Duplicate Content | L'impact sur votre SEO

Picto principal 1
Impact duplicate content seo
seo

Le duplicate content est présent partout sur le web. La plupart du temps, ce contenu dupliqué découle directement des contenus partagés de la structure de votre site (bloc newsletter, menu, note de bas de page...). Quelles qu'en soient les causes, il est indispensable de le traiter pour minimiser son impact sur le référencement de votre site. 

Peu importe que vous gériez un site web pour une petite ou une grande entreprise ; chaque site est vulnérable à la menace que représente le duplicate content pour votre référencement Google.

Dans cet article, je vais vous expliquer comment trouver le duplicate content, comment déterminer s'ils vous affectent directement ou indirectement, et comment gérer efficacement les problèmes de contenus dupliqués.

Pourquoi a-t-on du duplicate content sur son site ?

Le contenu dupliqué fait référence à des parties de contenu qui sont, soit totalement identiques (Exact-duplicate), soit très similaires, également appelés Near-duplicate. Les near-duplicates font référence à deux parties de contenu similaires.

Bien entendu, il est naturel et parfois inévitable d'avoir du duplicate content sur votre site. Votre bloc newsletter, votre nom, la présentation courte de votre produit/marque/service, vos versions SEO mobile et ordinateur. Pour tout le reste... Il faut agir !

Les différents types de duplicate content

Différents types de duplicate content

Il existe deux types de duplicate content :

  • Le duplicate content interne : Les contneus dupliqués sont présents sur le même site web (exemple: produit de différente couleur partageant la même description).
  • Le duplicate content externe, également connu sous le nom cross-domain duplicate : Il se produit lorsque deux ou plusieurs domaines ont le même contenu sur des pages indexées par les moteurs de recherche. On pense notamment au plagiat... mais cela apparait également dans d'autres circonstances ; essentiellement sur les marketplaces. Admettons que vous publiez un de vos produits sur Amazon en y dupliquant le contenu.
  • On parle parfois de duplicate content en référencement payant, lorsque les descriptions d'annonces sont identiques, mais nous ne nous attarderons pas dessus.)

Les doublons externes et internes peuvent être des exact ou near duplicates.

Le duplicate content est-il mauvais pour le référencement ?

Officiellement, Google n'applique pas de pénalité pour les duplicate content. Cependant, il filtre les contenus identiques en essayant de comprendre lequel est le plus susceptible d'intéresser ses utilisateurs - et cette affirmation est encore plus vraie depuis l'avènement de Google Panda.

Ça a donc finalement le même impact... Une perte de classement de vos pages sur le moteur de recherche.

Le contenu dupliqué embrouille Google et oblige le moteur de recherche à choisir parmi les pages identiques celles qu'il doit classer dans les premiers résultats. Peu importe qui a produit le contenu, il y a une forte probabilité que la page d'origine ne soit pas celle choisie pour les premiers résultats de recherche.

Ce n'est là qu'une des nombreuses raisons pour lesquelles le duplicate content est mauvais pour le référencement. Vous en voulez d'autres ? 

Problèmes de duplicate content interne

Duplicate content interne

Traitons tout d'abord tous les problèmes liés au duplicate content sur votre site.

Le balisage de votre site

Pour éviter les problèmes de duplication de contenu, assurez-vous que chaque page de votre site en a :

  • un titre de page unique et une méta-description dans le code HTML de la page
  • des balises uniques (H1, H2, H3, etc.) qui diffèrent des autres pages de votre site => Par exemple, n'utilisez jamais "conclusion" en fin d'article mais "Pour résumer LE SUJET DE L'ARTICLE"

Le titre de la page, la méta-description et les balises de titres ne représentent qu'une infime partie du contenu d'une page, mais ont un impact fort sur la compréhension de votre page par les moteurs de recherche. Il est plus sûr de garder votre site web hors de la zone grise du duplicate content autant que possible.

Si vous ne pouvez pas écrire une méta-description unique pour chaque page, car vous avez trop de pages, automatiser sa création grâce à un outil comme Rank Math SEO.

N.B.: n'oubliez pas d'adapter ces contenus à vos cocons sémantiques pour maximiser les résultats.

Descriptions de produits

Il est compréhensible que la création de descriptions de produits uniques soit un défi pour de nombreuses entreprises e-commerce. Cela représente du temps, et donc de l'argent pour des résultats qui ne semblent pas toujours justifiés.

Cependant, si vous voulez vous classer pour "Chaussure de sport jaune adidas 2021", vous devez différencier votre page de produit des chaussures de sport d'autres couleurs.

Si vous vendez vos produits par l'intermédiaire de marketplaces ou si d'autres revendeurs proposent votre produit, imposez-leur d'utiliser une description unique.

Si vous souhaitez que votre page produit soit plus performante que les autres, consultez notre article sur la manière de rédiger une excellente page produit.

Conseil : Si vous n'avez pas la possibilité de créer du contenu pour chaque produit, assurez-vous de ne créer qu'une seule page par produit et d'autoriser les utilisateurs à choisir la taille et la couleur sur cette unique page.

Paramètres d'URL

Un autre problème courant avec les contenus dupliqués trouvés sur les sites e-commerces (bien que non réservé à ce secteur) provient des paramètres des URL.

Certains sites Web utilisent les paramètres d'URL pour créer des variations d'URL de page (par exemple, ?sku=5136840, &couleur=bleu), ce qui peut amener les moteurs de recherche à indexer différentes versions des URL, y compris les paramètres.

Version WWW, HTTP, HTTPS

Vous avez éliminé tout le duplicate content de votre site, mais avez toujours l'impression que quelque chose ne fonctionne pas ? Avez-vous pensé à jeter un oeil aux différentes versions de votre site ?

  • www (http://www.example.com) et sans www (http://example.com)
  • http (http://www.example.com) et https (https://www.example.com)
  • une barre oblique à la fin d'une URL (http://www.example.com/) et sans barre oblique (http://www.example.com)

Pour Google, toutes ces versions sont des pages différentes, et sont donc des pages qui peuvent potentiellement être en compétition entre elles...

Un moyen rapide de vérifier ces problèmes consiste à :

  1. Copier un paragraphe sur l'une de vos pages les plus importantes,
  2. Copier ce texte entre guillemets dans la barre de recherche de Google (ex: "MON PARAGRAPHE")
  3. Lancer la recherche et regarder si plusieurs versions du site apparaissent

Si plusieurs pages apparaissent dans les résultats de la recherche, vous devrez alors regarder de près pour déterminer pourquoi cela se produit en examinant les exemples ci-dessus..

Si vous constatez que votre site Web présente un conflit entre www et non-www ou entre les barres obliques et les barres non obliques en fin d'URL, vous devrez alors mettre en place une redirection 301 de la version inutile vers la version préférée.

Remarque : il n'y a aucun avantage pour le référencement à utiliser ou non www ou la barre oblique dans vos URL. Il s'agit d'une question de préférence personnelle.

Problèmes de duplicate content externe

Duplicate content externe

Si vous disposez d'une quantité importante de contenu et que vous commencez à générer du trafic, il y a de fortes chances qu'il finisse par être republié sur un autre site web. Aussi flatteur que cela puisse être, vous devrez vous en passer. Voici les différentes façons dont le contenu dupliqué se produit à l'extérieur.

Scrapped Content

On parle de scrapped content lorsque le propriétaire d'un site Web vole le contenu d'un autre site Web automatiquement pour tenter d'augmenter la visibilité organique de son site.

Le contenu scrappé est facilement identifiable, car ces webmasters ne se donnent que rarement la peine de remplacer le nom de votre marque dans le contenu copié.

Pour faciliter leur identification :

  1. Assurez-vous de toujours mentionner votre marque au moins une fois sur chaque page.
  2. Effectuez des recherches sur votre nom de marque tous les mois et identifier les sites qui auraient pu vous voler votre contenu.

Le problème ? C'est que cela s'apparente à du plagiat, et qu'il n'est pas toujours évident pour Google de comprendre qui a publié le contenu en premier. Il n'est donc pas rare de voir ces sites se positionner au dessus des sites "originaux".

Si vous êtes victime d'un contenu scrappé, on vous conseille d'avertir Google. Plus d'information sur les démarches ici.

Contenu syndiqué

Le duplicate content, c'est mal !

Ouais... Mais pas toujours ! :)

Il s'avère que lorsque vous le faites en connaissance de cause, vous pourriez en tirer un avantage. 

Hum, après avoir lu cet article, je vous imagine déjà faire les gros yeux. Et pourtant...

Imaginez-vous un peu. Vous avez un petit site, tout jeune, un anonyme quoi.

Et puis... Un gros site aime tellement votre article qu'il aimerait le republier pour vous donner de la visibilité (ou pour tirer profit de votre travail gratuitement... mais c'est une autre histoire)

Si ce gros site ne fait qu'un copier/coller, il est fort probable qu'il vous expulse définitivement des SERP.

Mais s'il souhaite faire les choses correctement... Ce site à deux possibilités :

  • Ajouter la mention "Cet article a été publié originellement sur VOTRE SITE" en pied de page
  • ET ajouter l'URL du contenu source en tant qu'URL canonique. 

Hum ... Kezaco une URL canonique ? 

Bon ça fait pas rêver, mais c'est, pour faire simple, une information que l'on donne aux moteur de recherche pour les informer que le contenu original est disponible sur cet URL. Vous avez compris l'intérêt ? Sinon, n'hésitez pas à jeter un oeil sur notre article parlant de comment obtenir des backlinks de qualité.

Comment vérifier s'il y a du duplicate content sur son site ?

Si vous avez des pages web riches en contenu qui perdent des places sur les moteurs de recherche, il est alors d'usage d'aller jeter un coup d'œil afin de vérifier si votre contenu a été copié et utilisé sur un autre site web.

Voici quelques moyens de le faire:

  • Recherchez l'intégralité du contenu dans Google (en n'oubliant pas de mettre le contenu entre guillemets)
  • Copiez quelques phrases clés de votre contenu, et recherchez-les (de la même manière qu'au-dessus)

Si vous avez des résultats autres que votre site, vérifiez s'il ne s'agit pas d'une erreur. Si ce n'est pas le cas, écrivez au webmaster - les articles sont en général très rapidement supprimés dans ce contexte. 

Autres Définitions

Articles qui pourraient vous intéresser

Intéressé.e ?
Écrivez-nous