Indication pour l'indexation (ou non) d'une page pour les moteurs de recherche, la balise meta robots est vieille comme le monde mais son utilité est toujours avérée. La meta meta robots est une balise HTML qui se situe dans l'entête HTML de vos pages internet, c'est-à-dire entre les balises ‹head› et ‹/head›.
Voici les différentes directives que vous pouvez donner à cette balise, bien trop souvent méconnue. Ne la sous estimez pas, elle a une grande utilité en complément d'un fichier robots.txt !
Les différentes directives de la balise meta robots
Type : meta robots noindex
Syntaxe : ‹meta name="robots" content="noindex"/›
Conséquence de l'implémentation balise meta robots noindex : L'indication noindex indique au robot qu'il ne faut pas indexer la page. La conséquence est que les bots ne vont pas indexer (référencer) la dite page. Par exemple, il est tout à fait possible et intéressant d'implémenter cette balise dans la page Contact ou Mentions légales de votre site internet.
.......Type : meta robots index
Syntaxe : ‹meta name="robots" content="index"/›
Conséquence de l'implémentation balise meta robots index : L'indication index indique au robot qu'il a l'autorisation d'indexer la page. Si aucune balise meta robots n'est implémentée, la page a par défaut ce comportement pour tous les moteurs de recherche. Il est donc inutile d'indiquer cette balise dans votre code.
.......Type : meta robots nofollow
Syntaxe : ‹meta name="robots" content="nofollow"/›
Conséquence de l'implémentation balise meta robots nofollow : L'indication nofollow indique au robot qu'il ne faut pas suivre les liens dans la page. La conséquence est que les bots ne vont pas crawler les pages liées. Cette balise est souvent implémentée à l'intérieur des blog post pour par exemple des liens externes au site internet ou pour éviter que les internautes ne spament les commentaires d'un article en plaçant des liens vers leur propre site internet.
.......Type : meta robots follow
Syntaxe : ‹meta name="robots" content="follow"/›
Conséquence de l'implémentation balise meta robots follow : L'indication follow indique au robot qu'il peut suivre les liens internes ou externes dans la page. Si aucune balise meta robots n'est implémentée, la page a par défaut ce comportement pour tous les moteurs de recherche. Il est donc inutile d'indiquer cette balise dans votre code.
.......Type : meta robots all
Syntaxe : ‹meta name="robots" content="all"/›
Conséquence de l'implémentation balise meta robots all : L'indication all indique au robot qu'il peut indexer et suivre les liens internes ou externes dans la page. Si aucune balise meta all n'est implémentée, la page a par défaut ce comportement pour tous les moteurs de recherche. Il est donc inutile d'indiquer cette balise dans votre code.
.......Type : meta robots none
Syntaxe : ‹meta name="robots" content="none"/›
Conséquence de l'implémentation balise meta robots none : L'indication none indique au robot de ne pas indexer ni suivre les liens internes ou externes dans la page. Cette valeur est l'équivalent des balises meta robots noindex et nofollow. Elle peut donc avoir son utilité pour coupler deux indications aux bots des moteurs de recherche.
.......Type : meta robots nosnippet
Syntaxe : ‹meta name="robots" content="nosnippet"/›
Conséquence de l'implémentation balise meta robots nosnippet : L'indication nosnippet indique au robot qu'il ne faut pas afficher de descriptif dans la page de résultats. On vous avoue qu'on doute de la pertinence de cette requête car se passer d'une description sur Google ou Bing, c'est amoindrir sa visibilité sur les moteurs de recherche.
.......Type : meta robots noarchive et nocache
Syntaxe : ‹meta name="robots" content="noarchive"/› ou ‹meta name="robots" content="nocache"/›
Conséquence de l'implémentation balise meta robots noarchive ou nocache : L'indication noarchive ou nocache indique au robot l'interdiction d'avoir accès à la version en cache. Cette balise peut être souvent implémentée dans des cas bien précis. Imaginons qu'une partie de votre contenu devient payant. Le retrait de la mise en cache permettra de ne pas avoir votre contenu dans son intégralité qui traîne dans un cache de Google par exemple.
.......Type : meta robots noarchive et nocache
Syntaxe : ‹meta name="robots" content="noarchive"/› ou ‹meta name="robots" content="nocache"/›
Conséquence de l'implémentation balise meta robots noarchive ou nocache : L'indication noarchive ou nocache indique au robot l'interdiction d'avoir accès à la version en cache. Cette balise peut être souvent implémentée dans des cas bien précis. Imaginons qu'une partie de votre contenu devient payant. Le retrait de la mise en cache permettra de ne pas avoir votre contenu dans son intégralité qui traîne dans un cache de Google par exemple. Les balises ‹meta name="robots" content="noarchive"/› et ‹meta name="robots" content="nocache"/› ont les mêmes fonctionnalités hormis que la balise nocache n'est pas prise en compte par Google mais seulement par Bing. Dans ce cas, autant utiliser la balise noarchive non ?
.......Type : meta robots notranslate
Syntaxe : ‹meta name="robots" content="notranslate"/›
Conséquence de l'implémentation balise meta robots notranslate : L'indication notranslate indique à Google que l'on ne souhaite pas qu'un lien " Traduire " soit affiché à côté du résultat des recherches.
.......Type : meta robots noimageindex
Syntaxe : ‹meta name="robots" content="noimageindex"/›
Conséquence de l'implémentation balise meta robots noimageindexe : L'indication noimageindex indique à Google de ne pas indexer les images disponibles sur votre page internet.
.......Type : meta robots noodp
Syntaxe : ‹meta name="robots" content="noodp"/›
Conséquence de l'implémentation balise meta robots noodp : L'indication noodp indique aux bots qu'il ne faut pas utiliser les données associées au site par les éditeurs de l'annuaire DMOZ (Open Directory Project, ODP). Cette balise peut etre uniquement nécessaire sur votre page d'accueil sachant que l'annuaire DMOZ indexe seulement les pages d'accueil des sites internet.
.......Type : meta robots unavailable_after
Syntaxe : ‹meta name="robots" content="unavailable_after"/› // Exemple d'utilisation : ‹meta name="robots" content="unavailable_after:07-Mar-2016 20:00:00 EST"/›
Conséquence de l'implémentation balise meta robots unavailable_after : L'indication unavailable_after indique au robot que la page internet ne doit pas ressortir dans les résultats après la date indiquée.