Qu’est-ce que le duplicate content et quel impact pour votre SEO ?
Avez-vous déjà entendu parler du « duplicate content » ? Il se trouve que beaucoup de gens ne comprennent pas réellement de quoi il s’agit et encore moins comment il affecte le référencement d’un site. Découvrez dans cet article les faits réels et idées reçues sur le contenu dupliqué.
Le duplicate content : qu’est-ce que c’est ?
Le duplicate content ou contenu dupliqué se traduit par la présence d’une même information sur au moins deux pages web (emplacements) différentes. Il est aujourd’hui observé sur environ 29 % des emplacements ou URL en ligne. Il peut se résumer à quelques lignes de texte comme une description de produit qui se répète sur différentes pages d’un même site Internet.
De même, une page web entière peut être un contenu en double si elle apparaît à divers emplacements sur un même site ou sur plusieurs sites. Parfois, le CMS utilisé pour créer votre site Internet peut générer ce type de contenu. Néanmoins, un contenu dupliqué peut être aisément vérifié en utilisant Google ou une application dédiée disponible gratuitement en ligne.
Plus la quantité de contenu dupliqué est importante sur votre site, plus il y a de risque que cela affecte votre classement sur les moteurs de recherche à long terme. Alors, vous devez essayer de minimiser cette quantité autant que possible.
Par ailleurs, il y a tellement de contenus dupliqués en ligne que l’on pourrait croire que cela est normal. Pourtant, il est tout à fait illégal de reproduire le contenu d’une marque sur sa page web sans mentionner le nom de son créateur. Il s’agit clairement d’une violation du droit d’auteur, et cet acte est passible d’emprisonnement.
L’impact du contenu dupliqué pour votre SEO
Google indique clairement qu’il ne provoque pas la chute du classement SEO d’un site à cause du duplicate content. En effet, le moteur de recherche a affirmé : « Le contenu dupliqué sur un site n’est pas un motif d’action sur ce site, sauf s’il apparaît que l’intention du contenu dupliqué est d’être trompeur et de manipuler les résultats des moteurs de recherche. ».
Google a expliqué que lorsque le duplicate content est observé sur un site, ses algorithmes se chargent de faire apparaître la bonne version sur la SERP. Toutefois, rien ne garantit que le moteur de recherche sache exactement quel emplacement positionner en premier sur la page des résultats de recherche.
Vous pourrez donc ne pas voir le contenu approprié pour votre persona s’afficher. Et ce serait simplement parce que Google n’a pas réussi à déterminer le contenu le plus pertinent pour une requête donnée. Alors, pour ne pas perdre vos chances d’interagir avec votre public cible sur les moteurs de recherche, vous devriez limiter le contenu dupliqué sur votre site web.
De plus, réduire le contenu dupliqué peut améliorer considérablement l’expérience utilisateur (UX). Votre public cible ressortira satisfait de ses interactions avec votre plateforme, ce qui va contribuer à le fidéliser. Vous obtiendrez un trafic de bonne qualité, une augmentation de votre visibilité et un bon retour sur investissement.
Évitez d’être pénalisé pour votre contenu dupliqué grâce aux redirections 301
Le duplicate content peut être pénalisant pour un site Internet. Toutefois, vous pouvez éviter les pénalités en utilisant des redirections 301, tout en veillant à ne pas exagérer. La stratégie des boucles de redirection (qui peuvent être permanentes) consiste à produire une nouvelle version de contenu vers laquelle rediriger une URL ancienne. Elle convient dans des cas spécifiques :
- Le site Internet vient d’être déplacé sur un autre domaine,
- Une page web a été supprimée lors d’un changement sur le site,
- La page d’accueil du site a diverses URL (il faut en définir une seule),
- Deux sites web ont été fusionnés, donc il y a maintenant des URL obsolètes à rediriger.
Vous pouvez facilement configurer les boucles de redirection si vous utilisez un CMS tel que WordPress. Si ce n’est pas le cas, vous avez la possibilité d’insérer un code spécifique dans le fichier HTML du site web pour définir les redirections 301. Tout compte fait, ces dernières vont considérablement vous aider à débarrasser votre site Internet du contenu dupliqué.
Réduisez le duplicate content pour augmenter l’exposition des liens de votre site
Le contenu dupliqué vous empêche de bien renforcer « l’équité des liens » qui est aussi appelée « link juice » ou « jus de lien ». Ceci se rapporte à la valeur et à l’autorité transmises par les liens d’une page à un autre ou d’un site web à un autre. L’exposition de votre lien baisse au fur et à mesure que les moteurs de recherche constatent des pages en double sur votre site. La visibilité de chacune de ses pages se réduit, car les moteurs de recherche évitent de faire apparaître divers emplacements proposant le même contenu dans les résultats de recherche.
Les liens sont d’une grande importance dans le choix de la page la mieux adaptée pour afficher un contenu. Google par exemple s’assure de faire apparaître sur la SERP les pages avec beaucoup de liens (internes et externes). Le moteur de recherche considérera que vos liens externes ont peu de valeur si par exemple plusieurs sites renvoient vers une page en double sur votre site.
Pour vos campagnes visant à créer des liens, vous devez prendre soin d’utiliser un emplacement qui apparaît une seule fois sur votre site. Vous pouvez à cet effet rediriger les pages qui apparaissent en double vers une URL spécifique et appropriée.
Réduisez l’utilisation des blocs de texte standard
On retrouve de plus en plus de contenus « passe-partout » (on parle alors de « boilerplate ») sur les sites Internet. Les créateurs de contenus et les webmasters répètent notamment les clauses de non-responsabilité et les mentions de droits d’auteur. Ainsi, on retrouve les mêmes blocs de texte à des niveaux spécifiques sur différents sites.
Même si ces déclarations standardisées sont couramment utilisées, Google les considère comme du contenu dupliqué lorsqu’elles apparaissent dans le corps principal d’une page web. Vous devez veiller à prendre en compte les directives des moteurs de recherche concernant le boilerplate.
Avec Google par exemple, pour minimiser l’impact de la répétition des blocs de texte standard, il faut les afficher dans une version plus courte sur votre page. Il est recommandé d’inclure un lien dans votre article qui redirige le lecteur vers une page affichant le bloc de texte en complet.
Évitez les variations même mineures d’URL
Pour différentes raisons, on observe des variations d’URL sur les sites Internet. Même si ces dernières paraissent sans conséquence, elles peuvent entraîner des problèmes de contenu en double. Vous pouvez utiliser Google Search Console afin de trouver le moyen adapté pour réussir à détecter et corriger les variations d’URL.
Il serait également utile de bien configurer votre CMS en installant les plugins adaptés. Vous pourrez utiliser les fonctionnalités de ces derniers pour indiquer aux moteurs de recherche les URL avec lesquelles ils peuvent interagir et celles qu’ils doivent ignorer.
Utilisez les URL canoniques
Une URL canonique est une solution technique pour le contenu dupliqué. Vous pourriez, par exemple, avoir une publication ou un produit qui est attaché à deux catégories et existe sous deux URL, comme ceci :
https://example.com/black-shoes/black-and-red-shoes/ https://example.com/red-shoes/black-and-red-shoes/
Si ces URL concernent toutes les deux le même produit, en choisir une comme URL canonique indique à Google et aux autres moteurs de recherche laquelle afficher dans les résultats de recherche et ainsi ne pas considérer le contenu comme étant dupliqué.
Maîtrisez bien votre CMS pour réussir à éliminer le contenu dupliqué
Votre CMS peut dupliquer certains contenus sans que vous en ayez conscience. L’un des meilleurs moyens d’éviter cette situation est de bien étudier votre système de gestion de contenu avant et après qu’il a servi à créer votre site. Vous pouvez toujours confier cette tâche à une agence web spécialisée dans le CMS que vous souhaitez utiliser.
Un CMS peut créer des doublons de contenu en faisant par exemple afficher un même article sur votre page d’accueil et dans une catégorie de recherche. Lorsque vous repérez un contenu en double, vous pouvez :
- Empêcher le moteur de recherche d’indexer la page en utilisant par exemple la balise « Noindex »
- Réécrire l’article pour le rendre unique
- Procéder à l’insertion de la balise canonique dans le contenu
Vous avez la possibilité de confier la rédaction du contenu en double à une agence spécialisée. Cette dernière peut vous proposer différentes versions originales de ce seul contenu pour vos différentes pages web.
Les fausses affirmations sur le duplicate content
Il existe pas mal d’idées reçues sur le duplicate content. Découvrez tout ce que le duplicate content n’est pas à travers ces affirmations courantes, mais fausses.
Le duplicate content affecte directement le SEO
L’un des faits non avérés sur le duplicate content est qu’il a un impact énorme sur le référencement de votre site. Certes, il est nécessaire de limiter ce type de contenu, mais celui-ci ne nuit pas systématiquement à votre classement de recherche. Il affecte ce dernier seulement dans certains cas.
Google prend en compte différents facteurs pour positionner une page web dans la SERP. Cela dit, pour classer votre site le plus haut possible, vous ne devez pas proposer uniquement un contenu pertinent et original. Vous devez également mettre en place certaines stratégies de communication.
Par exemple, vous pouvez partager vos publications sur les réseaux sociaux pour vous constituer une communauté. Vos abonnés pourront visiter votre site et partager les contenus qui s’y trouvent, ce qui augmentera sa visibilité.
Google pénalise le contenu dupliqué, quelle que soit sa forme
Ce qu’on vous fait croire d’autre sur le sujet est que Google vous pénalise systématiquement dès qu’il détecte du contenu dupliqué sur votre site. Il se trouve que le moteur de recherche Google ne pénalise pas généralement les sites web qui dupliquent du contenu. L’essentiel est que ces derniers proposent du contenu qualitatif et pertinent, tout en évitant certaines stratégies.
Vous aurez des pénalités uniquement si vous adoptez un comportement trompeur. Cela signifie que votre positionnement sur Google se retrouvera en baisse si vous proposez du contenu dupliqué en vue de manipuler le moteur de recherche. Google pénalise aussi les sites qui bourrent leurs articles de mots-clés afin d’améliorer leur référencement SEO.
Les publications d’invités sont inutiles
Vous pouvez afficher les publications de vos invités sur votre site sans craindre un impact négatif pour votre SEO. En réalité, les messages des invités aident à obtenir plus de trafic et peuvent renforcer le positionnement SEO. Il est pertinent de les publier sur votre site dans la mesure où cela permet à votre public habituel d’y accéder plus facilement. Toutefois, vous devez éviter d’intégrer trop de liens sortants aux publications d’invités.
Si ces dernières comportent moins de liens entrants que de liens sortants, cela peut affecter votre référencement SEO. De plus, attendez quelques semaines après la publication de la version originale pour faire une republication sur votre site. N’oubliez pas d’insérer une balise HTML au code de la page pour aider Google à distinguer la publication d’origine de la vôtre.
Le grattage Web est mauvais pour un site Internet
Le grattage Web permet d’obtenir de grandes quantités de données en utilisant un bot spécial. Ce dernier récolte automatiquement du contenu sur différents sites web. Généralement, les données se présentent dans un format HTML non structuré. Elles peuvent ensuite être structurées à partir d’une base de données.
Les données issues du grattage Web sont utilisées pour proposer des articles de blog sur les sites. D’aucuns croient que ce type de contenu nuit au référencement SEO. Pourtant, Google ne considère pas les pages qui l’affichent au point de pénaliser les sites web concernés.
Les moteurs de recherche peuvent prévenir l’auteur du contenu original d’un plagiat
Les moteurs de recherche comme Google ne peuvent normalement pas vous indiquer que votre contenu a été plagié par un autre. En fait, il est très difficile pour eux d’identifier le site créateur du contenu original.
Ainsi, tout le monde peut publier votre contenu sur son site comme s’il en était l’auteur. Cependant, si vous constatez que votre contenu a été plagié, vous pouvez contacter un avocat spécialisé pour vous aider à dénoncer l’auteur.