Ce n'est pas la première fois que je vous explique que le duplicate content est un souci majeur pour tout rédacteur qui souhaite voir le contenu textuel de son site bien positionné dans les moteurs de recherche comme Google ou Yahoo! cette vérification est d'autant plus réelle lorsque la duplication ne se fait pas au sein du même site, mais entre deux sites "concurrents".
En effet, si ces moteurs estiment que vous avez simplement copié le contenu d'un site sans le changer, votre contenu sera pénalisé et ne sera pas indexé. Pour effectuer cette tâche, ils utilisent un algorithme de bardeaux. Son principe de fonctionnement est le suivant : l'algorithme ne se soucie pas de l'ordre des mots et permet donc de vérifier si vous ne vous êtes pas simplement contenté de modifier l'ordre de certains mots.
Duplicate Content Checker est un site en anglais qui vous propose d'effectuer ce type de comparaison à votre place en comparant un texte cible et un texte source. Avant d'effectuer cette comparaison, vous devrez effectuer un petit nettoyage :
- retirez les balises HTML telles que le <strong>
- travaillez uniquement en minuscules
- retirez la ponctuation : virgules, points, apostrophes, retour à la ligne, doubles blancs, barres obliques...