Le duplicate content est la bête noire de beaucoup de référenceurs. Suivant l’étendue de ce dernier, un site peut être sanctionné par Google et se retrouver relégué à la toute fin des résultats de recherches. Un désastre quand l’objectif premier de votre site est d’être le plus visible sur Internet.
Mais, avant de parcourir le web à la recherche d’un vil plagieur, vous êtes-vous assurés de ne pas avoir vous-même, involontairement, généré du duplicate content ?
Duplicate content : Ne multipliez pas les noms de domaine
Référencement Google et duplicate contentVous possédez un site dont le nom de domaine est composé de plusieurs mots : par exemple, www.mon-beau-site.com. Pour des raisons pratiques, vous avez décidé de déposer aussi le nom de domaine www.monbeausite.com.
Afin d’éviter tout duplicate content, il faut rediriger l’un des deux noms de domaine vers l’autre, en redirection 301. Ne commettez surtout pas l’erreur de copier coller via le FTP votre site : le duplicate content est assuré, et votre second site, perçu comme un site miroir, pourra vous coûter votre référencement.
Une seule URL pour votre page d’accueil
Vous avez suivi notre premier conseil et évité un duplicate content avec deux sites identiques. C’est une première étape essentielle. Pour aller plus moins, maintenant, assurez-vous que votre page d’accueil ne possède qu’une seule URL.
Parfois, le logo cliquable de votre site renvoie sur la page d’accueil.Assurez-vous qu’il renvoie bien sur www.mon-beau-site.com et non sur www.mon-beau-site.com/accueil.html par exemple.
Duplicate content et URL rewriting : la prudence s’impose
Il est important, pour bien référencer un site, d’avoir des url propres de la forme www.mon-beau-site.com/ma-belle-page.html. Les logiciels de gestion de contenu, qui génèrent les pages, offrent souvent des URL complexes non optimisées. Celles-ci peuvent alors être redéfinies via l’URL rewriting.
Si vous optez pour un URL Rewriting (conseillé), soyez prudents et assurez-vous que chaque page ne soit indexée par Google que pour l’URL réécrite. Sinon, vous pourriez avoir du Duplicate Content, www.mon-beau-site.com/aze&=amp2014 (URL générée par le CMS) cotoyant www.mon-beau-site.com/ma-belle-page.html (URL réécrite).
Surveillez les pages indexées par Google
Pour savoir si deux pages identiques sont indexées par Google, utilisez, dans le champ de recherche, la commande link:www.mon-beau-site.com. Vous pourrez ainsi vous assurer des pages prises en compte par Google.
Duplicate content : la balise canonical
Désormais, Google prend en compte la balise canonical. Celle-ci permet de définir, à l’attention des moteurs de recherche, une URL canonique. En cas de pages similaires, le robot d’indexation ne retiendra que celle-ci.