La duplication de contenu ou contenu double traquée par les moteurs de recherche :
Il ya beaucoup de moyens et outils pour améliorer le classement de votre site dans résultats de recherche naturelle dans les moteurs, mais il faut faire faire le tri.
Certains webmasters utilisent certaines méthodes pour acquérir un Pagerank élevé dans les moteurs de recherche, même si celles-ci sont considérées comme abusives en ce sens qu’elles sont conçues pour tromper les moteurs de recherche. L’une de ces méthodes est effectivement le double emploi avec du contenu web ou la reproduction de contenu déjà existant sur le Web
Qu’appelle-t-on « Duplicate Content » ou contenu dédoublé ?
Dupliquer le contenu dans le référencement naturel est en fait n’importe quel contenu web qui est considéré comme similaire à un autre provenant d’un autre site web. Les moteurs de recherche ont réellement mis en œuvre de nouveaux filtres spécialement chargés de surveiller ce type de tentatives de tromperie pour améliorer le classement du site dans les pages de recherche des moteurs.
Beaucoup de gens pensent que, en créant plusieurs contenus dédoublés similaires de leurs pages Web, ils seront en mesure d’améliorer le classement de leur site dans les recherches, car ils seront en mesure d’obtenir plusieurs affichages de leur site dans les résultats. Actuellement les moteurs de recherche scrutent ce type de ruse, les sites utilisant du contenu en double peuvent finir par être bannis de l’index des moteurs de recherche au lieu d’améliorer leurs classements. (Black List)
Ce qui est considéré comme un contenu en double ?
Il y a une utilisation massive de contenus dupliqués par beaucoup de personnes, leurs utilisations diffèrent, mais tes sont conçues dans le même but, qui consiste à tromper les moteurs de recherche pour obtenir un meilleur classement dans les résultats naturels de recherche.
Une manière d’utiliser du contenu en double, c’est d’avoir des sites web très similaires ou identiques sur des pages web différentes (sous-domaines ou domaines) qui offrent essentiellement le même contenu. Cela peut être valable pour la page d’accueil comme pour les pages de contenu menant au site en question. Assurez-vous que vous ne recourez pas à cette option si vous ne voulez pas que votre site soit exposé au filtrage que font actuellement les moteurs lors de leur recherche de contenu en double.
Une autre méthode de création de contenu en double consiste à prendre simplement le contenu d’un autre site ou juste une page et la réorganiser pour la faire apparaître différente de sa forme initiale, même si elle est identique à celle-ci.
Encore plus grave, dans le cas de commerce électronique, des descriptions de produits à partir de nombreux sites de vente en ligne sont reprises à l’identique par d’autres. Dans d’autres sites web on retrouve simplement la copie de la désignation du produit du fabricant, elle même utilisée par d’autres acteurs web concurrents. En plus, même le fait de garder le nom du produit, le nom de l’artiste, producteur, écrivain ou le créateur peut être inclus dans la même page, cela fait une quantité importante de contenu dupliqué sur votre page. Bien que ces derniers champs soient plus difficiles à personnaliser, la page les contenant peut malgré tout être considérée comme du contenu dédoublé, ou spam.
La distribution d’articles copiés par d’autres sites autres que celui qui a publié l’article original peut aussi être considérée comme un contenu en double.
Bien que certains moteurs de recherche prennent en considération l’indication du site d’où l’article original a été extrait, certains n’ont pas cette fonction.
Comment fonctionnent les moteurs de recherche pour filtrer le contenu en double ?
Pour filtrer le contenu en double, les moteurs de recherche utilisent les mêmes moyens d’analyse et d’indexation pour le classement des pages des sites, et c’est grâce à l’utilisation de robots. Ces robots vont sur les différents sites internet et catalogues de ces sites pour lire et enregistrer les informations dans leurs bases de données. Une fois cela fait, ces robots analysent et comparent, ensuite ils vont comparer toutes les informations qu’ils ont prises d’un site à toutes les autres qu’elles ont déjà enregistrées pour déterminer si le contenu du site est pertinente à l’aide de certains algorithmes, et si elle peut être considérée comme un contenu en double ou du spam.
Comment éviter les contenus dupliqués ?
Bien que vous n’ayez aucune intention de tromper les moteurs de recherche pour améliorer le classement de votre page web, votre site peut être marqué comme ayant un contenu en double.
Une manière pour éviter cela consiste à vérifier vous-même s’il ya des contenus dupliqués de vos pages. Assurez-vous d’éviter trop de similitudes avec le contenu d’une autre page, votre contenu peut encore apparaître comme étant double pour certains filtres, même si la page n’est pas considérée comme spam.
Je vous suggère de suivre attentivement cette vidéo de Matt’s Grab le gourou du référencement chez Google qui nous parle de la duplication de contenu dans les descriptions d’articles dans le cadre du e-commece :
