Qu'est-ce que la balise meta robots ?
The meta robots tag is the tag that we assign to some pages within the <head> section of the HTML. It is used to indicate search engine crawlers how they should behave when they reach to a web page. In this sense, you can ask search engines not to follow the links found on the page (nofollow), not to index (noindex) or not cache (nocache) the page.
La balise meta robots est d'une grande valeur pour optimiser l'utilisation de votre jus de lien puisque vous pourrez décider à quelles pages transférer l'autorité ou non. Choisissez soigneusement les étiquettes à utiliser dans chaque situation car cela a un impact direct sur l'optimisation de votre jus de liaison.
Types de méta-robots :
Vous pouvez assigner plusieurs types de méta-robots à une page Web. Vous trouverez ici une liste des balises meta les plus importantes et leur signification.
- index= Cette balise permet aux moteurs de recherche d'indexer la page. Il est fourni par défaut donc, si vous êtes d'accord avec les moteurs de recherche pour trouver et suivre vos pages, vous n'avez pas besoin de le toucher.
- noindex= Il empêche les moteurs de recherche d'afficher la page sur leurs SERPs (Search Engine Results Pages).
- all= Comme mentionné ci-dessus, cette balise permet aux moteurs de recherche d'indexer la page et de suivre ses liens. "Tous" est égal à"index follow."
- noimageindex= Il interdit aux moteurs de recherche d'afficher une image dans leurs résultats de recherche. Mais si l'image reçoit un lien, Google continuera à l'indexer, donc dans ce cas, il est préférable d'attribuer un HTTP X-Robots-Tag à l'en-tête.
- none= Son but est de demander aux moteurs de recherche de ne pas indexer ni suivre de lien sur cette page : noindex et nofollow. Il leur dit de ne pas réagir quand ils voient la page.
- follow= Cette balise robots invite Google à suivre les liens de la page, qu'ils soient "index" ou non.
- nofollow= Il demande aux moteurs de recherche de ne pas suivre les liens de la page.
- noarchive= Celui-ci empêche les moteurs de recherche d'afficher le cache sur la page (les informations ne seront pas stockées sur le navigateur de l'utilisateur pour de futures visites).
- nocache= Le même que le précédent, mais seulement pour MSN/Live.
- nosnippet= Il ne laissera pas les snippets apparaître sur les SERPs, et il empêche aussi la génération du cache.
- noodp= Bien qu'il n'existe plus, il a été utilisé pour empêcher les moteurs de recherche d'utiliser la description.
- noydir= Il empêche Yahoo ! d'utiliser la description sur son répertoire comme elle apparaîtrait dans les résultats de recherche (elle n'est pas utilisée non plus, mais vous pouvez la rencontrer).
Comment la balise meta robots est-elle utilisée le plus souvent ?
Si vous n'avez pas de balise meta robots sur votre page web, Google indexe et suit la page par défaut. C'est comme si vous aviez déjà un "index, suivez". Vous trouverez ci-dessous quelques exemples des combinaisons d'étiquettes les plus couramment utilisées.
- "Indexer, suivre" - "indexer la page Web sur les RSR et suivre les liens".
- "index, nofollow" - "indexer la page, et ne pas suivre les liens"
- "noindex, follow" - "ne pas indexer la page mais suivre les liens".
- "pas d'index, pas de nollow, pas de cache" - "ne pas indexer, ne pas suivre et désactiver la mise en cache de la page."
Lors de l'utilisation de la balise meta robots, vous devez vous assurer que les directives données dans la page courante sont en accord avec la balise meta robots spécifiée dans les pages liées. Par exemple, si vous décidez d'ajouter "index, follow" à la page courante, les pages sortantes doivent être indexables et ne jamais avoir de balise "noindex" dans ses meta robots.
Comment vérifier que la balise meta robots est correctement implémentée
Une fois que vous avez attribué la balise meta robots à vos pages, il peut être difficile de vérifier si cette tâche a été effectuée correctement, en particulier sur les grands sites Web. Pour ce faire, il est recommandé d'utiliser un crawler web tel que FandangoSEO. Une fois que vous aurez parcouru votre site, vous pourrez voir vos pages d'index et de noindex ainsi que si vous avez des pages bloquées par robots.txt. En examinant les listes d'URLs avec les différentes balises, vous pouvez vous assurer que vous ne cachez pas les pages pertinentes dans les moteurs de recherche.
L'utilisation de rel nofollow
Lorsque vous utilisez la balise meta robots, vous voulez assigner la règle qui convient le mieux à la majorité des liens trouvés sur la page. Cela dit, nous rencontrons souvent des exceptions, à l'exception des liens pour lesquels vous ne voulez pas appliquer la règle générale. Dans ce cas, vous pouvez utiliser le nofollow rel. Par exemple, si vous avez la balise meta robot "index, follow" dans une page mais que vous avez des liens spécifiques que vous ne voulez pas que les moteurs de recherche suivent, insérez l'attribut rel "nofollow" pour eux.
Exemple :
<a rel=”nofollow” href=”http://www.examplepage.com”>anchor text</a>
Robots.txt Plan du site XML