À faire et à ne pas faire – Traitement du contenu en double

Les sites Web dont le contenu est dupliqué représentent un contenu similaire ou identique sur des URL différentes, à ceci près que les sites Web concernés n'offrent rien en particulier: une valeur ajoutée pour les moteurs de recherche ou les visiteurs du site Web.

Cet article explique comment créer un contenu en double et pourquoi vous devez distinguer différents types de doublons. Vous obtiendrez également des conseils sur la manière d'utiliser correctement Dupliquer le contenu pour le réparer et l'empêcher de se produire dès le début.

Comment le contenu dupliqué est-il créé?

Google définit le contenu en double comme suit:

    "Le contenu dupliqué est généralement constitué de grands blocs de contenu similaires ou visiblement similaires à d'autres contenus appartenant au même domaine ou à des domaines différents."
    (Source: Aide de la console de recherche Google)

Le contenu en double est donc tout le contenu qui peut être trouvé sous différentes URL ou même différents domaines.

Les causes les plus courantes de contenu en double sont les suivantes:

  • Imprimer des versions de pages URL
  • Produits dans les boutiques en ligne qui sont livrés via un flux de produits
  • Aucune logique de domaine standard (par exemple, www.domain.tld vs. domain.tld)
  • Structure d'URL incohérente
    – paramètres GET
    – majuscules et minuscules
    – Tralingslash
    – SessionIDs
  • Versions PDF
  • Pénalité de contenu en double

    Souvent, on parle également d'une pénalité liée à Dupliquer le contenu. Il s'agit d'une sanction active de la part de Google si le contenu propre existe sous plusieurs URL. John Mueller, analyste de Google Webmaster Trends, a déclaré:

      Il n'y a aucune raison de pénaliser un site Web pour cela chez Google aucune pénalité de contenu en double quand il s'agit de votre propre contenu"Source

    Les doublons de contenu sur le même domaine ne sont pas une raison pour que Google punisse le webmaster, mais vous cédez beaucoup de potentiel grâce aux doublons. Google essaie toujours de fournir les meilleurs résultats possibles pour chaque recherche. Si le meilleur résultat est trouvé sur un domaine sous différentes URL, l'algorithme de Google tente d'identifier même la meilleure URL. Idéalement, cela pourrait être la page principale, mais il pourrait également s'agir d'une URL complètement incorrecte.

    Un grand nombre de doublons sur une page entraîne une consommation importante de ressources de balayage qu'un moteur de recherche doit utiliser pour traiter le contenu en double. Dans le pire des cas, le nouveau contenu sera indexé ou remarqué beaucoup plus tard. De manière optimale, on essaie déjà d'éviter le contenu en double sur le plan technique.

    D'autre part, le contenu dupliqué est évalué différemment par Google pour tous les domaines.

    Un moteur de recherche ne peut pas déterminer si le contenu a été intentionnellement dupliqué pour manipuler les résultats de la recherche.

      "Parfois, cependant, le contenu est délibérément dupliqué sur différents domaines dans le but d'influencer les classements des moteurs de recherche ou d'attirer plus de trafic. De tels comportements injustes peuvent conduire à une expérience utilisateur négative, car ils constituent fondamentalement le même contenu dans plusieurs résultats de recherche. est affiché. " source

    Si Google identifie un contenu identique sur plusieurs domaines, il tente d'identifier le contenu d'origine. Les doublons sont supprimés dans les résultats de la recherche:

    Illustration2 duplicate content duplicate Duplicate Content

    Figure 1: Google supprime le contenu en double dans les résultats de recherche.

    Si Google soupçonne une tentative de manipulation délibérée derrière les doublons interdomaines, des sanctions plus sévères sont menacées. Dans des cas particulièrement graves, cela peut également signifier des mesures contre tout le domaine:

      "Le contenu dupliqué est affiché dans le but de manipuler le classement ou d'induire en erreur nos utilisateurs, nous apporterons des corrections à l'index et au classement des sites en question. En conséquence, ces sites peuvent être classés plus bas dans les résultats de recherche ou même en dehors supprimé de l'index de Google et n'apparaîtra plus dans les résultats de recherche. " source

    Comment identifier le contenu dupliqué?

    Google distingue le contenu dupliqué interne et externe. Mais comment identifiez-vous ces deux espèces?

    Identifier le contenu dupliqué interne

    Avec SEO Expertise, les doublons internes peuvent être détectés en quelques étapes. Pour ce faire, appelez le rapport "Contenu" → "Contenu dupliqué" → "Copies dupliquées" sur le site Web de Success. Le rapport répertorie tous les doublons de la page Web trouvés par le robot et le nombre de doublons de l'URL affectée. En cliquant sur la loupe dans la colonne "Compteurs en double", toutes les URL de contenu en double sont affichées.

    allusionSi vous souhaitez supprimer tous les doublons du site Web, vous pouvez obtenir une exportation totale des doublons, y compris les URL de contenu en double. L'icône d'engrenage dans la table sélectionne simplement l'option d'exportation CSV et permet d'extraire le jeu de données.

    Identifier le contenu en double externe

    Pour identifier le contenu en double externe, vous devez d’abord poser trois questions importantes:

      1. Qui crée le contenu?

      2. Ce contenu sera-t-il toujours utilisé ailleurs sur le site?

      3. Y at-il des partenariats ou similaires qui utilisent le contenu?

    1. Qui crée le contenu?

    Tout d’abord, vous devez savoir d’où provient le contenu de votre propre page. Existe-t-il un bureau de rédaction ou le contenu est-il acheté? Surtout avec les boutiques en ligne, les descriptions de produits proviennent souvent d'un flux de données automatisé et sont donc potentiellement un contenu en double. Dans ce cas, il est conseillé de créer vos propres textes pour les produits les plus importants. À son tour, avec un inventaire changeant rapidement, il peut être utile d'exclure les pages de produits de l'index et de créer une catégorie optimisée ou des pages de renvoi répertoriant les produits.

    Dupliquer le contenu dupliqué du contenu Illustration4

    Figure 2: Copies 1: 1 de la description du produit Amazon.de dans de nombreux autres magasins en ligne.

    2. Ce contenu sera-t-il toujours utilisé ailleurs sur le site?

    Les grandes entreprises ou les sociétés internationales vendent leurs produits principalement par différents canaux et dans d’autres pays. Afin de transmettre un message de marque uniforme, des textes descriptifs et des slogans sont souvent adoptés sans changement dans d’autres endroits.

    Par conséquent, il est toujours conseillé de se demander quels secteurs de l'entreprise commercialisent toujours le même produit. Si vous communiquez dans la même langue dans plusieurs pays, vous devez utiliser le jour hreflang. Avec son aide, il est possible de communiquer au moteur de recherche que, par exemple, le texte anglais est destiné à différents pays.

    Illustration5 contenu identique en double Dupliquer le contenu

    Figure 3: Contenu identique dans le marketing de Microsoft Office 2016.

    3. Existe-t-il des partenariats ou similaires qui partagent le contenu?

    Si vous commercialisez vos propres produits, vous pouvez limiter le contenu dupliqué spécifique à un domaine avec une bonne communication interne. Cela sera toutefois difficile pour les coopérations: un grand nombre de systèmes de gestion de boutique en ligne peuvent offrir un flux de données de tous les produits, y compris des descriptions de produits sur demande. De cette manière, les partenaires peuvent très facilement intégrer tous les produits dans leur boutique en ligne, avec pour effet secondaire de créer un contenu en double.

    Les boutiques en ligne doivent donc proposer un flux de données séparé pour les coopérations avec des partenaires, qui n'est pas automatiquement renseigné à partir du propre CMS, mais possède ses propres textes descriptifs. Vous pouvez également demander au partenaire de fournir aux doublons une balise Canonical inter-domaines ou de placer la page sur NoIndex.

    Illustration6 duplicate content duplicate Duplicate Content

    Figure 4: Par produit de la boutique en ligne directement à ebay.de

    Le contenu en double peut également être créé à votre insu, si les utilisateurs utilisent le contenu d'un autre site sans que l'on leur demande. L'outil le plus populaire pour identifier les pages qui utilisent leur propre contenu sans autorisation est http://www.copyscape.com/. S'il n'est pas possible de contacter l'opérateur du site, vous pouvez également demander une demande de suppression à la console de recherche Google via le tableau de bord DMCA.

    Figure 7 duplicate content content Duplicate Content

    Figure 5: Tableau de bord DMCA dans la console de recherche Google.

    Comment traiter les doublons internes?

    Solution technique pour le traitement des doublons

    Du fait de la duplication interne du contenu, un potentiel précieux est exploité. Il est donc important non seulement de réduire le nombre de doublons, mais également de créer les conditions techniques nécessaires.

    Pour éviter les doublons, il existe des solutions techniquement différentes. Cependant, toutes les méthodes ne conviennent pas pour résoudre le problème à la source. Par conséquent, vous devriez vous poser les questions suivantes à l'avance:

      1. Puis-je empêcher techniquement le DC, par exemple en évitant les paramètres GET?

      2. Puis-je rediriger vers l'original via la redirection 301?

    Des solutions rapides pour traiter les doublons

    Ce n'est que lorsque toutes les mesures possibles ont été prises dans le contexte de ces questions que vous devez vous familiariser avec les solutions suivantes pour éliminer les contenus en double. Mais méfiez-vous: en particulier avec les problèmes de contenu en double à grande échelle, les solutions "rapides" peuvent entraîner de nouveaux problèmes.

    tag canoniqueLa balise canonique est une solution rapide pour éviter le contenu en double. Il peut et doit être utilisé de manière sélective, mais il ne doit en aucun cas être utilisé pour résoudre un contenu en double à grande échelle. Malgré les balises Canonical, les moteurs de recherche doivent analyser les URL correspondantes pour voir la balise Canonical. Ce processus peut gaspiller d'énormes ressources d'exploration sur un grand nombre de pages affectées.

    noindex: Les méta-robots spécifiant NoIndex empêchent l'inclusion de contenu dans l'index Google. Semblable à la balise Canonical, cet attribut ne doit pas être considéré comme une solution aux problèmes majeurs de contenu en double, car Google analyse en permanence ces URL pour rechercher de précieuses ressources pour le robot.

    robots.txtL'utilisation du fichier robots.txt pour éviter les doublons de contenu empêche les moteurs de recherche d'accéder aux doublons, mais empêche également le lien de se propager sur la page.

    nofollow: L'attribut de lien NoFollow communique avec le moteur de recherche pour ne pas prendre en compte le lien, mais son utilisation n'empêche pas l'indexation. Le contenu en double peut également être lié ailleurs, à la fois en interne et en externe.

    Cas particulier: contenu identique pour différents pays

    Si une page Web utilise le même contenu dans une langue mais dans des pays différents, il s'agit techniquement d'un contenu en double. Un cas courant est le contenu allemand d'un site Web utilisé pour l'Allemagne, la Suisse et l'Autriche.

    Pour résoudre ce problème, Google prend en charge l'attribut hreflang. L'URL affectée fait référence à toutes les versions de pays de langue. L'attribut hreflang est un outil très puissant, il ne devrait donc y avoir aucune erreur. Dans le pire des cas, une seule erreur d'utilisation peut entraîner la perte des classements dans un pays. Voici une liste des erreurs les plus courantes à éviter:

    • Langue et code pays incorrects -> utilisez le code ISO correct
    • Référencement d'URL inexistantes -> 404 ou éviter les redirections
    • Attributs hreflang contradictoires à différents endroits -> à utiliser uniquement à un endroit

    SEO Expertise vérifie l'utilisation du attributs hreflang, Dans le rapport "Multilinguisme" → "Langues", vous pouvez vérifier les langues auxquelles un document Web fait référence comme traduction. Ici, vous pouvez également voir en un coup d’œil les pages qui ne font pas référence aux traductions.

    Nombre de traductions Contenu identique Doublons Dupliquer le contenu

    Figure 6: Vérifier le nombre de traductions dans le succès du site Web

    Dans le rapport "Multilinguisme" → "Codes d'état", vous devez accorder une attention particulière aux codes d'état des groupes 3xx et 4xx. Si possible, évitez les références à des pages qui passent ou n'existent plus. En cliquant sur le code d'état correspondant, le tableau ci-dessous est également filtré et affiche uniquement les références concernées.

    conclusion

    Le contenu en double est un sujet très vaste pour lequel il existe différentes solutions. Pour trouver la bonne solution, vous devez toujours faire attention au type de contenu dupliqué disponible. Alors que le contenu en double interne coûte un potentiel précieux, le contenu en double externe peut avoir de graves conséquences.

    Règles importantes pour le contenu en double:

    • Si possible, utilisez des redirections 301 permanentes
    • Faites attention à un schéma d'URL uniforme, par exemple. Toutes les URL se terminent par un tiret de fin ou par .html
    • Définir un domaine standard – choisir une variante de domaine
    • Utilisez le hreflang day sur des sites internationaux
    • Faites attention à la manière dont le contenu est utilisé dans les coopérations et, si nécessaire, proposez une variante supplémentaire
    • Éviter les modules de texte récurrents

    Une solution techniquement optimale, dans la plupart des cas, nécessitera davantage d'efforts, mais il s'agit de la solution la plus durable et la plus évolutive pour éliminer le contenu en double.

    Dirigeant SEO SEA Expertise

    Si vous avez des craintes avant de vous lancer dans un projet de communication ou de marketing digitale ou si vous vous posez encore beaucoup de questions sur la meilleure manière de procéder, contactez-moi. Je serai ravi de répondre à vos questions.