Éviter le duplicate content sur WordPress

Niveau : Intermédiaire


Objectifs pédagogiques

À l’issue de cette astuce, vous saurez :

  • Identifier les sources de contenu dupliqué générées automatiquement par WordPress.
  • Mettre en place les solutions techniques pour les corriger via votre plugin SEO.
  • Vérifier l’état de votre index dans Google Search Console.

Qu’est-ce que le duplicate content ?

Le duplicate content (ou contenu dupliqué) désigne un contenu identique ou très similaire accessible via plusieurs URLs différentes. Google doit alors choisir quelle version afficher dans ses résultats — et il ne choisit pas toujours celle que vous souhaitez. L’autorité SEO se dilue entre les variantes au lieu de se concentrer sur une seule URL.

Sources de duplicate content sur WordPress et impact sur l'index Google

Le problème est particulièrement courant sur WordPress, qui génère plusieurs types de contenu dupliqué de façon automatique et invisible — sans que l’administrateur du site en soit conscient.


Les sources de duplicate content sur WordPress

1. Les variantes d’URL

Une même page peut être accessible via plusieurs URLs selon la configuration du serveur et du site :

  • http://monsite.fr/ma-page/ vs https://monsite.fr/ma-page/
  • monsite.fr/ma-page/ vs www.monsite.fr/ma-page/
  • monsite.fr/ma-page/ vs monsite.fr/ma-page (avec ou sans slash final)

Pour Google, chacune de ces variantes est techniquement une page différente — même si le contenu est rigoureusement identique.

2. Les pages d’archives, de tags et d’auteurs

WordPress génère automatiquement des pages de listing pour chaque catégorie, tag, auteur et date. Ces pages listent les mêmes articles et partagent souvent des méta-titres et descriptions similaires — ce qui crée du contenu quasi-identique à grande échelle.

3. La pagination

Les pages /blog/page/2/, /blog/page/3/… ont souvent les mêmes méta-titres et descriptions que la page principale du blog, ce qui les rend quasi-dupliquées aux yeux de Google.

4. Le contenu copié ou syndiqué

Reproduire du contenu d’un autre site sans balise canonique peut désavantager votre site : Google peut considérer l’autre site comme la source originale et lui attribuer l’autorité.


Solution 1 — Configurer l’URL canonique du site

La première étape est de forcer une URL unique pour l’ensemble du site — avec ou sans www, et en HTTPS.

Étape 1 — Dans WordPress, allez dans Réglages → Général et vérifiez que l’“Adresse web de WordPress” et l’“Adresse web du site” utilisent toutes les deux la même URL (de préférence https://monsite.fr sans www).

Étape 2 — Assurez-vous qu’une redirection 301 est en place depuis la variante non-canonique (ex. http:// ou www.) vers la version officielle (voir l’astuce sur les redirections). Votre hébergeur ou votre plugin SEO peut gérer cette redirection automatiquement.


Solution 2 — Mettre les pages d’archives en noindex

Les pages de tags, d’auteurs et d’archives de dates n’ont généralement aucune valeur SEO propre. La solution la plus simple est de les exclure de l’index Google via votre plugin SEO.

Avec Yoast SEO :

Étape 1 — Allez dans Yoast SEO → Apparence dans les résultats.

Étape 2 — Dans l’onglet “Types de contenu”, réglez les “Pages d’étiquettes” (tags) et les “Pages d’auteurs” sur “Non” dans l’option “Afficher dans les résultats de recherche”.

Étape 3 — Dans l’onglet “Archives”, réglez les archives de dates sur “Non” également.

Avec Rank Math :

Étape 1 — Allez dans Rank Math → Titres et méta.

Étape 2 — Dans les sections “Étiquettes”, “Auteur” et “Date”, activez l’option “Pas d’index” pour chacune.

Rank Mah réglages noindex sur les archives et pages de tags

Solution 3 — La balise canonique

La balise canonique est une balise HTML insérée dans le <head> de chaque page qui indique à Google quelle est la version “officielle” du contenu. Elle ressemble à ceci :

html

<link rel="canonical" href="https://monsite.fr/ma-page/" />

Yoast SEO et Rank Math ajoutent automatiquement cette balise sur toutes vos pages, en pointant vers l’URL propre. Vous n’avez généralement rien à faire — mais vous pouvez la modifier manuellement sur une page spécifique si nécessaire.

Cas où la modifier manuellement : si vous publiez un article qui reprend du contenu d’un autre site avec son autorisation, ajoutez une balise canonique pointant vers l’URL source originale — vous indiquez ainsi à Google que vous n’êtes pas la source première.

Avec Yoast SEO : dans l’éditeur de la page, dans le panneau Yoast → onglet “Avancé” → champ “URL canonique”.

Avec Rank Math : dans l’éditeur de la page, dans le panneau Rank Math → onglet “Avancé” → champ “URL canonique”.


Vérifier l’état de votre index dans GSC

Comparaison index Google sain vs index pollué par le duplicate content

Dans Google Search Console, plusieurs rapports vous aident à détecter le duplicate content :

Étape 1 — Allez dans “Pages” (menu “Indexation”). Repérez les raisons de non-indexation — notamment “Page en double sans balise canonique sélectionnée par Google” et “Page en double, balise canonique soumise non sélectionnée”. Ces deux statuts signalent que Google a détecté des doublons.

Étape 2 — Vérifiez la section “Pages indexées” — si le nombre de pages indexées est nettement supérieur au nombre de pages réelles de votre site, des pages d’archives ou des variantes d’URL sont probablement indexées inutilement.


Tableau récapitulatif

Source de duplicate contentSolution
Variantes d’URL (www, http, slash)Redirection 301 + URL canonique dans Réglages → Général
Pages de tagsNoindex via plugin SEO
Pages d’auteursNoindex via plugin SEO
Archives de datesNoindex via plugin SEO
PaginationBalise canonique automatique (Yoast/Rank Math)
Contenu copié d’un autre siteBalise canonique pointant vers la source originale
À faireÀ éviter
Forcer une seule URL pour tout le siteLaisser http et https coexister sans redirection
Noindex sur tags, auteurs, archives de datesIndexer des pages de tags vides ou peu peuplées
Laisser Yoast/Rank Math gérer les canoniquesModifier les canoniques sans en comprendre l’impact
Vérifier régulièrement le rapport Pages dans GSCCopier du contenu sans balise canonique vers la source

Ce qu’il faut retenir

Le duplicate content sur WordPress est en grande partie automatique et invisible — WordPress génère naturellement des pages de tags, d’auteurs et d’archives qui dupliquent votre contenu à votre insu. La bonne nouvelle : Yoast SEO et Rank Math règlent la majorité de ces problèmes automatiquement dès leur configuration. Les actions manuelles à prévoir sont limitées : forcer une URL canonique pour le site, passer les archives en noindex et surveiller le rapport Pages dans Google Search Console. Ces quelques réglages suffisent à maintenir un index propre et concentré sur vos vrais contenus.

Article ajouté au panier
0 Produit - 0,00