Téléchargez mon guide sur le référencement

Et recevez les derniers articles par mail
trucs-de-blogueuse-guide-referencement

Eviter le duplicate content pour mieux référencer son blog

Après le nofollow, on va voir un autre terme technique qui joue sur le référencement de votre blog : le duplicate content.

Qu’est-ce que c’est ? Quand est-ce qu’on fait du duplicate content ? Pourquoi faut-il l’éviter et comment l’éviter ? C’est ce qu’on va voir tout de suite.

trucs de blogueuse - duplicate content

Qu’est-ce que le duplicate content ?

Appelé contenu dupliqué en Français (pas besoin de Google Trad pour ça ! ^^) , le duplicate content est du texte que l’on trouve en double sur un même site ou à travers plusieurs sites différents.

C’est un concept utilisé dans le référencement naturel car les moteurs de recherche tels que Google pénalisent les sites n’ayant pas du contenu unique.

Cela peut être du texte copié-collé mot pour mot, mais est également considéré comme duplicate content une copie avec quelques mots modifiés. Que ce soit dans un paragraphe ou une page entière, Google voit tout !

 

Dans quel cas peut-on avoir du duplicate content ?

Il y a 2 types de contenu dupliqué :

  1. Le contenu non malveillant : il s’agit de copies faites par le même auteur sur son propre blog ou même ailleurs.
  2. Le contenu malveillant : ce sont les copies générées avec intention de « nuire » et qui ne permet pas à Google de faire correctement son référencement.

 

1. Le contenu non malveillant :

  • Dans les archives ou catégories de votre blog :

Il faut savoir que pour Google, une page présente une url unique. Si plusieurs url ont le même texte, c’est considéré comme du duplicate content. Ainsi, les articles qui s’affichent à la fois dans leur propre url, les archives ou bien les pages de catégories ou de mots-clés sont considérés comme des doublons.

Si on prend l’exemple de cet article :

    • il est présent à cet url : https://www.trucsdeblogueuse.com/duplicate-content-referencement/
    • mais aussi dans la catégorie Trafic de bloghttps://www.trucsdeblogueuse.com/categorie/trafic/
    • et dans les tags Google (https://www.trucsdeblogueuse.com/mot-cle/google/), Référencement (https://www.trucsdeblogueuse.com/mot-cle/referencement/) et Trafic (https://www.trucsdeblogueuse.com/mot-cle/trafic-2/),
    • Si j’avais créé des pages d’archives pour Août 2014, ça aurait fait une copie en plus.

Cela fait une possibilité de 5 copies du même texte, si je n’avais pas mis des extaits dans les pages d’archives et catégories/tags.

 

  • Sur votre page d’accueil :

Certains d’entre vous affichez vos articles entiers sur la page d’accueil au lieu des extraits, cela donne alors à Google des url différentes pour un même texte : l’url de l’article et l’url de l’accueil.

 

  • Lorsqu’il y a plusieurs versions d’un même site, par exemple sur ordinateur (desktop) et mobile, ou bien des versions imprimables :

Quand un site a une version mobile, cela se passe ainsi : lors de la connexion au site, un robot détecte le type de support et s’il reconnaît un mobile ou une tablette, on présente au visiteur une version différente du site « normal ».

Le site normal est du type www.trucsdeblogueuse.com et le site mobile du type m.trucsdeblogueuse.com ou www.trucsdeblogueuse.mobi

Comme vous commencez à le comprendre, on a des url différentes donc c’est du duplicate content.

Contrairement au site mobile, un site responsive permet d’être lu sur tous les types de supports sans changer d’url (comme c’est le cas pour mon blog, il n’a donc pas de version m.trucsdeblogueuse.com ou .mobi).

 

Une autre version possible d’une page est la page que l’on peut imprimer, vous avez déjà dû voir sur certains sites un lien « Version imprimable » qui est le double de l’original sans les menus ou images etc.

 

  • Un article publié plusieurs fois sur des sites différents par le même auteur :

Cela peut être un article-invité que vous avez écrit chez un blogueur et que vous publiez aussi chez vous.

Ou bien un article publié sur un premier blog, puis le même qui apparaît sur un second blog appartenant à vous car vous aviez décidé de faire une migration de blog sans effacer le premier.

 

2. Le contenu malveillant :

Le terme « malveillant » est utilisé par Google lui-même dans ses recommandations sur le duplicate content. Il considère que c’est malveillant car la duplication a pour intention de nuire directement ou indirectement. Les copies nuisent à la fois :

    • l’auteur réel du texte qui retrouve son contenu sur un site sans son accord,
    • le lecteur qui va lire plusieurs fois la même chose sur des sites différents pour une même requête, donc qui ne lui apportent aucune valeur ajoutée,
    • Google qui ne pourra pas présenter des résultats de recherche pertinents aux internautes.

On en trouve 2 types :

 

  • Le plagiat :

Certains « blogueurs » (qui n’en sont pas en vrai) copient des articles de blogs existants pour avoir du contenu sur le leur sans avoir à écrire une seule ligne de texte. Seules les touches Ctrl, C et V vont leur servir sur leur clavier.

 

  • Les méthodes de référencement abusif :

Avant les mises à jour récentes de Google, on voyait des référenceurs utiliser abusivement à leur avantage les critères d’indexation. Ils avaient plusieurs sites leur appartenant et :

    • ils dupliquaient le même contenu sur plusieurs sites pour que seuls leurs sites soient sur les premiers résultats de recherche,
    • quand Google a commencé à pénaliser les sites ayant des doublons, ils dupliquaient le contenu des concurrents cette fois-ci, pour que le site du concurrent soit pénalisé et ne soit plus indexé dans les résultats de recherche.

Il faut vraiment être tordu (ou un génie ?) pour penser à faire ça…

 

Pourquoi faut-il éviter le duplicate content ?

Vous avez dû le comprendre avec les exemples cités plus haut, il faut éviter d’avoir du texte dupliqué car Google pourrait penser que vous avez un contenu malveillant et pénaliser votre blog.

Cela se traduira par une désindexation de votre blog sur les moteurs de recherche, c’est-à-dire que les internautes ne vont plus trouver votre blog s’ils le recherchent sur Google, même avec une recherche sur le nom de votre blog.

Il sera toujours accessible avec le lien direct ou avec un lien depuis un autre site, mais étant donné que le référencement naturel permet d’apporter environ 50% des visites en moyenne sur tous les sites, cela ferait diviser par deux le trafic de votre blog

 

Mais bonne nouvelle, Google sait maintenant faire la différence entre le texte initial et le texte dupliqué :

  • Pour le contenu non malveillant, Google choisit lui-même d’indexer une seule des pages en doubons et pour éviter qu’il le fasse au hasard, il est possible de lui indiquer la page préférée grâce à des balises html.
  • Pour le contenu malveillant, Google regarde certains critères tels que :
    • la date de publication,
    • l’auteur de la publication.

 

Comment éviter le duplicate content ?

Même si Google sait faire la différence entre un texte original et un texte dupliqué, il y a des choses que l’on peut faire pour éviter de faire du duplicate content et risquer d’être pénalisé.

 

Eviter les doublons sur son blog

Voilà les recommandations pour éviter le duplicate content sur son blog :

  • Mettre les extraits de ses articles aussi bien sur sa page d’accueil que dans les pages d’archives, de catégories et mots-clés (tags), mais également dans son flux RSS. Pour cela sur WordPress, allez dans Réglages/Lecture/ »Pour chaque article d’un flux, choisir » et cocher « l’extrait ».
  • Indiquer à Google de ne pas indexer ces pages avec l’attribut noindex. (par exemple grâce à l’extension SEO by Yoast).
  • Pour les versions mobile et imprimable, dire à Google quelles sont les pages originales avec l’attribut canonical.
  • Lorsque vous migrez un blog vers un nouveau nom de domaine, faites des redirections 301 pour indiquer à Google que les anciennes url doivent définitivement être transféréer vers les nouvelles.
  • Pour les articles-invités que vous écrivez chez d’autres blogueurs : ne recopiez pas l’article sur votre propre blog. Si vous voulez absolument en parler à vos lecteurs, vous pouvez expliquer que vous avez écrit sur tel blog en faisant une petite introduction (unique et pas reprise sur l’article-invité) et mettre un lien cliquable vers l’article original chez l’autre blogueur. Vous comprenez maintenant pourquoi je demande à mes blogueurs invités de ne pas copier leur article sur leur blog, on ne sait pas si Google va pénaliser votre blog (selon la date de publication) ou le mien (selon le nom de l’auteur) !

Pour vérifier si vous avez du duplicate content sur votre blog, vous pouvez aller sur le site Siteliner : il vérifie tout notre blog et compare nos résultats avec la moyenne des autres sites. Par contre la version gratuite est limitée à un scan de 250 pages seulement. On ne se rend pas compte, mais avec les archives etc, un blog peut atteindre des milliers de pages très rapidement (par exemple, j’ai près de 2000 pages sur mon blog alors que j’ai seulement une centaine d’articles pour l’instant).

 

Traquer les plagieurs

En général, on se rend compte qu’on a été plagié lorsque l’on tombe par hasard sur un de nos articles sur un autre site, ou bien si quelqu’un d’autre le voit et nous le dit.

Il existe des sites qui permettent de vérifier si une de nos pages a été dupliquée, tels que :

  • Copyscape
  • Positeo et Plagspotter qui permettent aussi de voir les copies similaires avec un pourcentage de duplication (certains modifient quelques mots dans un contenu copié)

Malheureusement il faut rechercher url par url (donc article par article), ce qui peut être assez rébarbatif. Et je ne connais pas de site qui permette d’avoir une alerte automatique de contenu plagié, alors si vous en connaissez un de bien, je suis preneuse !

 

Si vous êtes victime de plagiat sur un de vos articles, vous pouvez :

  • dans un premier temps essayer de contacter le blogueur en lui disant que vous avez été copié sans votre autorisation. Certains blogs sont des récapitulatifs de ce qu’ils trouvent ailleurs (comme on peut le voir pour les blogs de DIY) alors ce n’était peut-être pas fait méchamment.
  • s’il ne veut pas supprimer le contenu malgré votre demande, vous pouvez notifier Google pour atteinte aux droits d’auteur qui se chargera de vérifier (grâce aux informations que vous leur fournirez) puis de retirer la page dupliquée. Lisez bien la notice de Google car si votre demande n’est pas justifiée et réelle, vous devrez payer des dommages et intérêts.

 

 

A vous de jouer

Est-ce que vous connaissiez le duplicate content ? Quelles sont vos techniques pour l’éviter, vos outils pour le détecter ? J’en ai peut-être oublié alors n’hésitez pas à partager avec nous vos méthodes dans les commentaires ci-dessous.

 

X

Mot de passe oublié ?

Ou créez un compte

Réinitialiser le mot de passe
Veuillez entrer votre email. Vous allez recevoir votre nouveau mot de passe par email.