Nov 12 2009

Duplicate Content sur Google, Yahoo & Bing

Category: Blog et marketing Internet,Référencement naturelMohammed ALAMI @ 6:40 PM

Dupliquer le contenu de sites web est un phénomène fréquent sur le web et dans de nombreux cas peuvent affecter les résultats des Moteurs de recherche. Alors que les moteurs de recherche peuvent ne pas toujours pénaliser techniquement les webmasters pour un contenu en double, ceux-ci peuvent l’être encore de différentes manières.

Duplicate Content dans Google

La façon dont Google gère le contenu dupliqué a été discutée énormément encore récemment. Ceci est largement dû à la vidéo Google téléchargée de Grothaus Greg, dans laquelle il expose dans le détail, la façon dont Google gère une variété de différents éléments de la conversation contenue en double.
Joachim Kupke, Sr. Software Engineer de l’équipe d’indexation de Google a réitéré l’essentiel de ce que dit Grothaus. Il a également dit que Google a une tonne d’infrastructures pour l’élimination des doubles emplois contenu:
- Redirections
- La détection des tendances URL récurrentes (l’aptitude à «apprendre» de manière récurrente des formats d’URL pour trouver le contenu dupliqué)
- Le contenu réel
- Versions Plus récemment explorées
- Contenu antérieur

Kupke dit d’éviter les URL dynamiques lorsque cela est possible (bien que Google soit capable d’éliminer les contenus douteux). Si tout cela échoue, utilisez l’élément de liaison canonique. Kupke appelle cela un «couteau suisse» pour les questions de contenu en double.
Google dit que le tag canonique a été un immense succès. Il n’existait même pas il ya un an, et a connu une croissance exponentielle. Il a eu un impact énorme sur les décisions de canonisation de Google, et 2 fois sur 3, la balise canonique modifie effectivement la décision organiques dans Google.

Balise Link Canonical Google
Une nouvelle balise afin d’éviter des pénalités Google sur des pages dynamiques codées maladroitement : Link Rel=Canonical. Elle est adoptée par Google et les autres moteurs de recherche. Cette balise est importante : elle permet d’éviter le duplicate content du à un code informatique maladroit dans votre site internet : deux URL différentes pour un même contenu.
Google désindexe toutes pages en contenu dupliqué sauf une. Bien sur on ignore laquelle.
Cette nouvelle balise LINK signale l’URL canonique donc unique de la page où la dite balise est située, c’est à dire la seule URL à prendre en compte par les moteurs. Cette nouvelle balise représente un immense progrès dans la simplification du métier de référenceur ou de codeur de site web à référencer. Il suffit de gérer cette balise quelle que soit les ajouts de session et autres arguments dans l’URL générée à la volée. C’est nettement plus simple à gérer !
Google indique une erreur commune : désigner la page 404 comme canonique, ce qui est généralement causé par des liens inutiles. Donc, évitez de modifier rel = “canonique” désignations, et d’éviter les redirections permanentes désignant les URLS canoniques. De même, ne regroupez pas les directives dans le fichier robots.txt pour annoter le contenu en double. Elle rend plus difficile la détection des doublons, selon Kupke.

Kupke dit que tenir compte des URLS canoniques pour l’indexation prend du temps. «Soyez patient et nous utiliserons vos canoniques désignées”. Le nettoyage d’une partie existante de l’indice prend encore plus de temps, et donc le doublon peut persister pendant un certain temps, malgré rel = canonique, Kupke ajoute.

Au SMX, Google a annoncé que la prise en compte dans le domaine du rel = canonique est à venir au sein de cette année. Ainsi, par exemple, si le Chicago Tribune a publié un article sur le New York Times, et le rel = canonique pointe sur le Chicago Tribune, alors Google ne créditera que le Chicago Tribune avec le contenu.

Duplicate Content dans Bing

En ce qui concerne la façon dont Bing traite les contenus en double, l’intention prime. Si votre intention est de manipuler le moteur de recherche, vous serez pénalisé.
Sasi Parthasarathy, Directeur du Programme Bing conseille de regrouper toutes les versions d’une page sous une adresse URL. “le moins est le mieux, en termes de contenu en double.” Si possible, utilisez une seule URL par morceau de contenu.
Bing ne prend pas en compte l’élément de liaison canonique (comme un facteur de classement) pour le moment, mais il est à venir. Ils disent l’utiliser, mais ce n’est pas vraiment un facteur de classement dans Bing pour le moment. Bing dit qu’il ya eu une augmentation dans l’usage des tags canonique dans les 6 derniers mois, mais les questions d’adoption existent encore. Selon Parthasarathy, 30% du point tags canonique au même domaine (ce qui est bien), et 9% l’utilisent pour pointer vers d’autres domaines. Cela pourrait être une erreur ou il pourrait y avoir manipulation. Bing dit chercher d’autres facteurs pour essayer de procéder à l’élimination des doublons.
Bing dit que les tags canoniques ne sont pas des conseils ou directives. «Utilisez-les avec prudence», et non comme une alternative à la bonne conception Web.
En ce qui concerne www vs non-www, vous n’avez qu’à choisir un et vous y tenir de manière cohérente. Supprimer les noms de fichiers par défaut à la fin de vos URL. Bing dit aussi des redirections 301 sont votre meilleur ami pour réorienter, utilisez rel = “nofollow” sur les pages inutiles, et d’utiliser un fichier robots.txt pour garder le contenu que vous ne souhaitez pas voir indexé.

Duplicate Content dans Yahoo

Si tout se déroule selon les prévisions, vous allez avoir besoin de vous soucier de la gestion de contenu en double sur Yahoo si vous vous inquiétez de la façon dont Yahoo voit votre site, mais Cris Pierry, Sr. Director of Search Yahoo, a offert quelques conseils supplémentaires.
Pierry dit que les URL descriptives doivent être facilement lisibles, et ce n’est pas une bonne idée de changer d’URL chaque année. En outre, l’utilisation canoniques, d’éviter la casse et éviter les identifiants de session et les paramètres comme à l’accoutumée.
Pierry dit aussi d’utiliser Sitemaps, et les soumettre à Yahoo Site Explorer. Améliorer l’indexation par l’usage robots.txt proprement dite, et l’utilisation du site Explorer pour supprimer les URL que vous ne vous souhaitez pas voir Yahoo indexer. Enfin, fournissez des éléments à Yahoo Site Explorer et signalez comme spam un lien vers votre dans site Explorer.
Yahoo dit que les métadonnées et SearchMonkey améliorent la présentation.

Tags: , , ,

Leave a Reply