Sommaire
Avec les balises Canonical, les webmasters et les référenceurs peuvent facilement éviter les doublons. Cependant, il y a quelques points à garder à l’esprit pour ne pas perdre les avantages de la balise.
Dans ce guide, vous apprendrez donc tout ce qui est important à propos du Jour Canonical, quand il peut être utilisé et à quoi vous devriez prêter attention.
Ce que vous devez savoir sur le tag Canonical
En février 2009, Google a fusionné avec les moteurs de recherche de Microsoft et de Yahoo pour prendre en charge le tag Canonical. Dans le blog de la société, cela a également été annoncé comme un soulagement pour les webmasters:
“Carpe diem concerne tout contenu en double: nous prenons désormais en charge un format qui vous permet de spécifier votre version préférée d’une URL.” (Source)
Cet élément est un méta-type qui peut être inséré dans la zone d’en-tête d’un site Web. La balise affiche les moteurs de recherche rel = canoniques sur deux pages identiques avec des URL différentes, l’original. De cette manière, l’URL canonique en double est ignorée et seule l’URL canonique est indexée.
L’élément HTML s’appelle non seulement Canonical Tag, mais aussi Canonical-Link ou simplement “Canonical”. Utilisé correctement, Canonical Tag évite les doublons de contenu et vous aide à optimiser le moteur de recherche.
Les avantages des balises Canonical pour l’optimisation des moteurs de recherche
Si vous incluez une URL canonique spécifique en tant que balise dans le code source, vous aiderez les moteurs de recherche à gérer votre site Web. En effet, les moteurs de recherche apprennent que ce n’est pas l’exploration en cours, mais que l’URL référencée doit être indexée. Si les liens font déjà référence aux doublons, leur puissance de lien est transférée à l’URL canonique grâce à Canonical. Dans le même temps, vous évitez que Google sélectionne une URL à indexer sur plusieurs URL similaires, comme une URL utilisant http au lieu de https.
Comment une balise Canonical est-elle implémentée correctement?
Vous pouvez spécifier une URL canonique de deux manières différentes. C’est ainsi que la journée peut être passée dans laSection du document HTML ou dans l’en-tête http. Cependant, une implémentation dans l’en-tête HTML est recommandée. D’une part, car il est techniquement très facile à mettre en œuvre là-bas. D’autre part, parce que Google la journée dans d’autres domaines, tels que dans le
, ignoré. De nombreux systèmes de gestion de contenu offrent la possibilité de connecter Canonicals à l’en-tête HTML.
Dans certains documents, toutefois, la balise canonique ne peut pas être placée en HTML. Par exemple, les documents PDF ne sont pas HTML, les balises Canonical ne peuvent donc pas être utilisées dessus.Les zones sont placées. Ici, vous devez inévitablement être utilisé sur l’en-tête http.
exemple:
Supposons que votre page Web comporte deux URL différentes qui ont presque exactement le même contenu. Peut-être sont-ils simplement différents d’un autre menu ou d’un bouton. Il y a déjà des liens des deux côtés. Au lieu de laisser à Google le choix de l’une de ces deux URL à afficher dans les SERP, vous pouvez désormais choisir une URL canonique.
Supposons que les deux URL ressemblent à ceci:
1. http://meineseite.de/seotipps
2. http://myeseite.de/seotipps-aktuell
Nous décidons maintenant que la première URL devrait être l’URL canonique. En pratique, vous devez choisir la page la plus pertinente, la page avec l’URL la plus courte ou la page contenant le plus de liens en tant qu’URL canonique.
Maintenant, vous ajoutez le rel = canonique sur le duplicata dansRégion. Cela ressemble à ceci:
Google et les autres moteurs de recherche “savent maintenant” qu’il existe une version canonique de ce site à considérer lors de l’indexation. Les liens vers les deux URL comptent alors pour l’URL canonique. Vous avez donc mis en place une sorte de “redirection en douceur” sans rediriger l’utilisateur.
Coller l’étiquette canonique dans l’en-tête http
Si votre ressource est un document PDF ou un autre type de document pris en charge par Google, la balise Canonical sera implémentée dans l’en-tête http. Vous devez considérer une syntaxe différente.
Reprenons l’exemple ci-dessus, mais cette fois le deuxième document est une source PDF:
1. http://meineseite.de/seotipps
2. http://myeseite.de/seotipps-aktuell.pdf
La ligne suivante est insérée dans l’en-tête http du document PDF:
lien: ; rel = “canonical”
Google prend actuellement en charge les balises Canonical dans l’en-tête http uniquement dans les recherches sur le Web.
Quatre exemples d’application pour les balises Canonical
1. Référence à vous-même
Fondamentalement, il est recommandé que chaque site Web se réfère à lui-même par Canonical, sauf s’il en existe un duplicata. Les balises canoniques sont évidentes lorsqu’une sous-page sur différentes variantes de la même URL est disponible – cela comprend les identifiants de session et d’affilié, les adresses http ou https et les URL avec ou sans www.
Par exemple, les systèmes canoniques auto-référentiels peuvent empêcher le moteur de recherche d’ajouter une URL de campagne à l’index. Cela permet également de protéger votre site contre les attaques de référencement négatives et les pertes de classement associées. Notamment pour cette raison, Google recommande également cette approche.
2. Un produit dans une boutique en ligne est accessible via plusieurs catégories
Les boutiques en ligne rencontrent souvent des problèmes de duplication de contenu. Ces problèmes surviennent généralement lorsque le même produit est disponible dans différentes catégories via différentes URL.
Prenons l’exemple d’une boutique en ligne de baskets. Le modèle en rouge est disponible pour les hommes et les femmes et en même temps dans la catégorie “chaussures de sport” classée. Cela donne quatre URL avec le même contenu:
1. http://www.schuhu.de/sneaker-red
2. http://www.schuhu.de/herren/sneaker-rot
3. http://www.schuhu.de/damen/sneaker-rot
4. http://www.schuhu.de/freizeitschuhe/sneaker-rot
Pour répartir au mieux le lien vers une URL tout en évitant les doublons, vous choisissez la première URL en tant qu’URL canonique. Dans ce cas, vous ajoutez dansGamme des trois autres URL du Canonical:
De nombreux systèmes de magasin utilisent déjà l’automatisation de Canonicals. Généralement, la balise Canonical est placée sur la page principale du produit.
3. Avoir des versions imprimées des URL référencées à la version canonique
Le contenu peut souvent être converti en version imprimée non seulement dans les boutiques en ligne, mais également sur les sites Web d’actualités ou sur les sites Web de grandes entreprises. Certains CMS peuvent créer une telle version imprimée en cliquant sur. Cette transformation crée généralement sa propre URL, qui dans le pire des cas est référencée dans l’index des moteurs de recherche. De cette manière, toutefois, un contenu dupliqué est généré, ce qui peut également entraîner une restriction non désirable de la convivialité en même temps. Par exemple, si un utilisateur ouvre un fichier PDF indexé, il ne pourra pas naviguer dans ce fichier ou ne reviendra pas sur votre site Web.
Dans ce cas, une balise Canonical dans l’en-tête http du fichier d’impression ou PDF peut apporter une solution. La balise pointe ensuite sur l’URL d’origine, qui sera éventuellement indexée.
Astuce: Si vous modifiez la structure des URL de votre site Web, vous devez dans ce cas non seulement rediriger, mais toujours vérifier les balises Canonical existantes. Incidemment, cela s’applique également lorsque le protocole est modifié, par exemple lors du passage de http à https.
4. Canoniques pour la liaison de domaines croisés
Une balise canonique peut également être utilisée pour désigner l’auteur d’un article ou d’un message original. Par exemple, il est possible qu’une publication dans le magazine OnPage soit utilisée sur une autre page pour une nouvelle publication. Pour que Google et les autres moteurs de recherche soient référés à l’original, le republisher définit un lien canonique vers le magazine OnPage.
Dans ce cas, les autres utilisateurs peuvent lire l’article original sur d’autres sites Web. Dans l’index des moteurs de recherche, seul l’article principal apparaîtra.
5. rel = canonique en combinaison avec hreflang
Si vous marquez votre site Web avec hreflang pour indiquer les versions de pays et de langue pour les moteurs de recherche, vous devez utiliser rel = canonical. Chaque version linguistique se réfère à elle-même par Canonical.
Erreurs courantes lors de l’utilisation d’étiquettes canoniques
Il existe de nombreux cas où l’utilisation abusive de rel = canonique peut entraîner de réels problèmes. Par exemple, une définition incorrecte de Canonical peut entraîner la disparition involontaire d’une URL de l’index Google et la disparition de son itinérance.
Pour cette raison, vous devriez éviter les erreurs suivantes.
-
- Lien relatif: Utilisez toujours l’URL complète si vous mettez une balise Canonical. De nombreux CMS utilisent des liens relatifs pour les liens internes. Mais Google ne peut pas gérer ce lien et ignore ensuite les Canonicals.
-
- Utilisation multiple de Canonicals sur une seule page: Utilisez une seule balise canonique sur chaque page. Si plusieurs Canonicals existent, les moteurs de recherche ne comprennent plus l’instruction. Cela peut mener au chaos et à des résultats indésirables. Dans le pire des cas, les pages censées être classées ne seront plus indexées.
-
- Balises canoniques sur un déplacement de domaine: N’utilisez pas de balises canoniques lors du déplacement vers un nouveau domaine. Utilisez plutôt les redirections 301. Si la “redirection” se produit uniquement via Canonical, les moteurs de recherche risquent d’être confus. Dans le pire des cas, les URL de l’ancien et du nouveau domaine de l’index. Pour les utilisateurs, cette confusion est encore plus grave car ils peuvent toujours invoquer l’ancienne URL sans être redirigés vers la nouvelle.
-
- normes URL: Lorsque vous définissez des tags Canonical, veillez à utiliser l’orthographe exacte de l’URL. Définissez les barres obliques de fin, si elles existent, et spécifiez l’URL exactement avec ou sans www, comme elle est généralement accessible. Par exemple, si vous faites référence depuis une page www à une page non www avec un nom canonique, ce pointeur de moteur de recherche ne sera pas utile si la page cible est déjà redirigée vers la version www avec une redirection 301. Google ignore généralement la déclaration et continue d’indexer toutes les pages.
- Mélange avec noindex, nofollow ou rejeter: L’utilisation d’une balise canonique et de la balise noindex sur une page à la fois peut entraîner le transfert de la fonction de la balise noindex vers le côté canonique. John Müller de Google a souligné ce danger dans un Hangout 2012. Les attributs nofollow et interdit dans robots.txt désactivent l’algorithme et entrent en conflit avec la fonction de Canonical. En particulier, les commandes d’exclusion de robots.txt refusent à Google l’accès au code HTML, ce qui signifie que le moteur de recherche ne peut même pas lire la commande Canonical, encore moins le suivre.
Devrais-je utiliser une redirection 301 ou une balise canonique?
Cette question n’est pas une réponse aussi générale. Après tout, cela dépend toujours du cas individuel, qu’une canonique ou une redirection soit plus utile. Si vous avez le choix entre une redirection 301 et une canonique, vous devriez toujours opter pour une redirection 301. Si vous ne pouvez pas utiliser une redirection 301 pour des raisons techniques ou en raison d’une restriction éventuelle de l’utilisabilité, la balise canonique constitue une alternative judicieuse.
Un exemple: si plusieurs URL de votre boutique en ligne font référence au même produit, une balise Canonical est recommandée. D’une part, la solution est techniquement plus simple et, d’autre part, vos utilisateurs devraient pouvoir appeler l’URL correspondante.
Si vous souhaitez rediriger directement une URL, seule la redirection est possible car la balise canonique ne redirige pas activement les URL, mais constitue simplement un indice pour les moteurs de recherche.
Tags canoniques sur Twitter et Facebook
Facebook et Twitter peuvent également lire et implémenter rel = canonique. Si vous partagez maintenant une URL dans ces réseaux sociaux qui fait référence à une autre URL avec un Canonical, les informations de l’URL canonique seront lues. En cas de fuite de la publication avec cette URL, ces j’aime comptent pour l’URL canonique.
Que puis-je faire si aucun Canonical ne peut être défini?
Si vous ne pouvez pas utiliser rel = canonique, vous avez toujours la possibilité de stocker uniquement les URL indexables qui émettent un code d’état 200 OK dans un sitemap. Vous pouvez envoyer ce sitemap à Google via la console de recherche Google. De cette manière, vous garantissez le faible risque que Google indexe uniquement les pages transmises via le plan du site. Cependant, il ne s’agit que d’une option pour les sites Web nouvellement créés, l’indexation des sites Web existants pouvant difficilement être influencée de cette manière. Si, en fait, aucune balise canonique ne peut être définie, essayez au moins de préciser aux moteurs de recherche via le lien interne quelle URL est la plus importante. Par exemple, si vous avez un article de presse et une version imprimée de cet article, tous les liens internes doivent aller à l’article lui-même, et un seul lien de cet article à la version imprimée.
Si les URL de votre site Web utilisent de nombreuses variables ou paramètres et qu’il n’est pas toujours facile de travailler avec un Canonical, vous pouvez également utiliser la console de recherche. Vous y indiquez comment Google doit traiter certains paramètres dans les URL.
conclusion
Les balises canoniques sont un outil puissant pour les référenceurs et les webmasters, afin d’éviter les doublons de contenu et de mieux distribuer les liens. L’implémentation est techniquement très simple même sans plugins.
Cependant, il y a des pièges que nous vous avons montrés ici. Si l’implémentation de Canonical est incorrecte, le méta-élément peut également causer des dommages et, par exemple, exclure des sous-pages importantes du classement. D’autre part, si vous considérez les règles ci-dessus pour la configuration de rel = canonical, votre site peut bénéficier de la balise.