Duplicate content
Qu’est-ce que le duplicate content ?
Le duplicate content ou contenu dupliqué correspond au fait de reproduire un contenu d’une page web à une autre. Il peut s’agir d’un copier-coller de l’intégralité d’une page ou alors seulement d’une partie.
La duplication de contenu pose problème au niveau du référencement naturel d’un site web. En effet, une page qui dispose de ce type de contenu va être moins bien référencé par les moteurs de recherche (Google, Bing, Yahoo, …), c’est-à-dire qu’elle va moins être mise en avant par rapport à une page qui possède du contenu unique et authentique.
Quelles sont les différentes catégories de duplicate content ?
Le duplicate content interne
Le contenu dupliqué Interne fait référence à un contenu identique sur plusieurs pages d’un même site.
Ce phénomène peut être causé par des erreurs techniques telles que :
- La mise en ligne d’un article dont le contenu est présent sur un PDF disponible sur le site ;
- L’intégration sur un site e-commerce de produits avec un texte similaire ou presque ;
- Un bloc de contenu qui se répète sur plusieurs pages du site.
Le duplicate content externe
Le contenu dupliqué externe correspond à un texte présent sur un site qui se retrouve sur d’autres sites. Ce type de duplicate content entraine les plus grandes pénalités infligées par les moteurs de recherche et peut amener à des complications judiciaires suite au non-respect de la propriété intellectuelle.
Quels sont les principaux cas de contenu dupliqué ?
On retrouve le duplicate content sous différents cas, cependant, nous allons nous concentrer sur trois cas qui sont le plus recensés :
Les pages identiques à 100%
Reproduire une page web dans sa structure est considéré comme du duplicate content. Au-delà de la structure, il y a le contenu qui compose la page. Le fait de reprendre, les mêmes images, le même texte, et même les sous-titres, est considéré comme tel. C’est aussi le cas pour le SEO. En effet, copier les bases meta comme les meta titres et meta descriptions s’apparente aussi à du duplicate content.
Les balises title et descriptions différentes, mais un contenu identique
Cette configuration peut aussi être considérée comme duplicate content. En effet, le moteur de recherche n’analyse pas seulement les balises et descriptions mais également le contenu à l’intérieur de chaque page. Votre page ne sera pas référencée de façon optimale.
Du contenu différent, mais des balises title et description identiques
Lorsque vous publiez du contenu sur votre site web, vous devez impérativement passer par l’optimisation du SEO qui va vous permettre de mieux référencer votre contenu. C’est-à-dire qu’il ressortira mieux que d’autres contenus et sera mis en avant sur la première page du moteur de recherche. Le fait de copier la configuration SEO d’une autre page web sera détecté par les moteurs de recherche et considéré comme de la duplication de contenu.
Quels sont les impacts du duplicate content ?
Nous en l’avons déjà évoqué au cours de cet article, mais les sanctions pour usage de duplicate content ne sont pas à négliger.
Cette pratique est interdite et a des conséquences sur votre référencement naturel et peut même avoir des conséquences juridiques.
Lorsqu’un internaute recherche une information, il va consulter plusieurs sites web pour avoir le plus de réponses possible. S’il tombe sur des articles qui sont tous similaires, le client ira sur votre site oui, mais n’y retournera probablement pas car il sera déçu.
Avoir du contenu dupliqué sur votre site influence le référencement naturel. Les moteurs de recherche référencent mieux les sites ayant du contenu unique et une configuration SEO unique. Avec ce type de contenu, vous serez forcément désavantagé. Google inflige même des pénalités qui peuvent aller jusqu’à la désindexation définitive du site.
Pour finir, le duplicate content s’apparente à du plagiat, qui est une pratique illicite et punissable pas la loi. En effet, c’est une pratique ne respectant pas la propriété intellectuelle. Le tribunal peut être saisi dans le cadre de cette pratique considérée comme une faute morale, civile et/ou commerciale.
« Selon les articles L335-2 et L335-3 du Code de la propriété intellectuelle, le tribunal correctionnel peut prononcer des sanctions graves : – 3 ans d’emprisonnement ; – 300 000 € d’amende ; – Si le délit est réalisé en groupe > 5 ans d’emprisonnement, 500 000 € d’amende. »
Que faire pour éviter le duplicate content ?
Vous l’aurez compris, le duplicate content est à bannir de votre stratégie de création de contenu. Cependant, cela n’empêche pas certaines personnes malhonnêtes ou mal informées de poursuivre leurs activités frauduleuses. Voici quelques conseils et outils qui vous permettront de produire un contenu authentique et de qualité :
La balise rel=canonical
Si vous avez des compétences en développement web, ce conseil est pour vous. La balise rel=canonical a été inventée par les développeurs de Google pour permettre aux créateurs de contenu aux moteurs de recherche d’authentifier leurs contenus comme étant la version originale ou principale. Cette pratique permet d’aider Google à faire le choix entre un contenu dupliqué et le contenu d’origine, unique.
Créer de la valeur ajoutée
Avoir de la valeur ajoutée va vous permettre de vous différencier de la concurrence et c’est ce qui va aussi attirer de nouveaux clients. En limitant les répétions et en rédigeant du contenu unique, vous allez créer une source d’information originale et authentique qui satisfera vos clients et les fera revenir sur votre site.
Les outils
Voici une liste d’outils qui va vous permettre de détecter si le contenu qui vous produisez se trouve déjà sur un autre site.
- SiteLiner: ce site permet d’analyser le contenu de votre site et de déterminer s’il possède du contenu dupliqué.
- Duplichecker : ce site permet d’analyser gratuitement (jusqu’à 1 000 mots) votre contenu textuel en ligne ou avant la publication. Vous pourrez voir les parties plagiées et uniques des articles, et par la suite apporter des modifications en conséquence.
- Kill Duplicate : ce site est un service qui détecte en temps réel les plateformes qui s’approprient votre contenu. En plus de détecter le duplicate content, il peut aussi prendre les mesures pour résoudre les problèmes.