Première chose: Google ne pénalise pas (du moins pas à ce jour) le contenue dupliqué, de la manière dont les gens l’interprète.
Je ne dis pas que les moteurs de recherche affectionnent le « Duplicate content » contenue dupliqué, mais ils ne pénalisent pas spécifiquement les sites Web qui s’avèrent posséder une certaine partie de leurs contenus en double.
Le pire qui pourrait arriver c’est que Google décide de ne pas retourner le résultat d’une de vos pages parce qu’il la juge non pertinente puisque dupliqués… nous sommes loin d’une pénalité!
Le rôle que les moteurs de recherche moderne se sont donné est d’indexer et de livrer aux utilisateurs du contenu unique, varié et surtout pertinent.
Si un utilisateur recherche un type particulier de produit ou service et que le moteur de recherche lui revient avec des résultats (SERP) ou toutes les pages se ressemble, alors le moteur n’a pas accompli son travail correctement. Afin de fournir aux utilisateurs l’information diversifiée et par le fait même pertinente, les moteurs de recherche ont créé des filtres (l’algorithme). Il est possible qu’un filtre qui identifie le contenu en double soit actif, mais pas pour systématiquement pénaliser. Ces filtres sont mis en place, pour mieux débroussailler les informations qu’ils possèdent déjà (Cache). Si votre page est l’une de ceux qui est filtrée, vous pouvez vous sentir lésé ou pénalisé, mais en réalité votre site n’est pas pénalisé, il est tout simplement filtré.
Les sanctions sont réservées aux sites web qui tentent délibérément de leurrer les moteurs de recherche, comme ce fût le cas pour BMW, c’est que l’administrateur du site web essaie de duper les moteurs de recherche. Ces pénalités arrivent très rarement au site Web moyen. Les sites web qui reçoivent une pénalité savent exactement ce qu’elles ont fait pour le mériter.
Si vous vendez un « cossin » bleu et que vous lui dédiez une page, vous n’allez pas être pénalisé parce que vous avez créé une page pour un « cossin » rouge possédant un texte identique… Le pire qui pourrait arriver c’est que l’une des deux pages ne soit pas prise en compte (donc n’apparaisse pas dans les résultats).
Il n’y a aucun doute que le contenu dupliqué est un fléau pour des moteurs de recherche, mais quand vient le temps de retourner des résultats lors d’une requête (SERP), les moteurs de recherche ne vous pénalisent pas ou ne pensent pas que vous êtes un « spammeur » si vous possédez du texte dupliqué; ils essayent simplement de débarrasser leurs pages des résultats redondants en ignorant ces pages qui à leurs yeux semblent superflues.
De façon générale, dites-vous que si le contenu de votre site est facilement créé sans beaucoup d’intervention humaine (c.-à-d., automatisé, par exemple du contenu généré dynamiquement vis les fils RSS), les moteurs de recherches ne vont pas y accorder beaucoup d’importance pour leurs résultats dits : organique.