Sommaire
Un sitemap est une simple liste d'URL que vous envoyez aux moteurs de recherche. C'est un outil précieux pour identifier les problèmes d'indexation.
Dans cet article, vous apprendrez à utiliser une bonne structure Sitemap pour identifier rapidement les problèmes d'indexation et identifier avec succès les causes à l'aide de SEO Expertise.
John Mueller a déclaré dans un Hangout de Google Webmaster Central relatif aux heures de parole que les pages de moins de 10 000 URL n'ont pas une structure de page trop profonde. Dans le contexte de cette déclaration selon laquelle Google pourrait indexer complètement les sites Web plus petits sans inconvénient majeur, il ne semble pas nécessaire au départ de déposer un sitemap XML.
Toutefois, quelle que soit la taille de la page, les référenceurs doivent fournir un ou plusieurs plans Sitemap couvrant différentes parties de la page Web afin d'identifier rapidement les faiblesses de l'indexation dans ces domaines et de prendre des contre-mesures opportunes.
Structure XML Plan du site
Pour l’indexation elle-même, la manière dont les sitemaps XML sont générés importe peu. Afin d'identifier les faiblesses de la structure de la page Web, il est très important de choisir une structure de sitemap appropriée. Cela permet de réduire les problèmes d’indexation à des domaines spécifiques.
Conseils pour créer un plan Sitemap
- Segmentez les plans de site de manière logique par types de page, étendues, produits, etc., pour mapper rapidement les faiblesses d'indexation à un domaine spécifique.
- Ne dépassez pas la taille maximale d'un sitemap (50 000 URL ou jusqu'à 10 Mo non compressé). Partagez les URL sur différents sitemaps.
- Utilisez un fichier d'index de plan de site avec plusieurs sitemaps.
- Limitez le nombre d'URL par sitemap afin de mieux identifier les problèmes liés à l'indexeur.
- Répertoriez uniquement les URL pertinentes pour l'index (code d'état "200ok", méta-robots: index, non ou balise Canonical à auto-référencement).
- Utilisez uniquement des URL qui ne sont pas verrouillées via le fichier robots.txt.
- Créez votre propre plan Sitemap ou structure de plan Sitemap par domaine ou sous-domaine.
- Ne publiez pas plus d'informations sur les URL dans le sitemap, mais directement sur l'URL, par exemple. sur hreflang ou lastmodified.
- Utilisez uniquement des URL absolues.
- Évitez les paramètres GET si possible. Les paramètres de suivi et de filtrage n'ont rien à rechercher dans le sitemap.
Sitemaps pour les blogs
Un blog Web vit et se développe avec de nouveaux messages. En règle générale, les 10 derniers articles sont affichés sur la page de démarrage. Chaque nouveau message déplace un ancien message vers la page suivante. Cela se produit non seulement sur la page d'accueil, mais également dans les catégories et les pages de balises. En raison de ce système, les articles les plus récents de la page de démarrage figurent toujours en tête de liste, mais les articles plus anciens continuent de reculer. Sans un système approprié pour la liaison interne, le tracé de détourage pour une publication plus ancienne peut s'allonger à chaque nouvel article publié.
Afin d'identifier les problèmes liés à l'indexation via des liens internes, il est recommandé de créer un plan du site pour les articles de blog par mois uniquement, par exemple pour les articles de blog. Plan du site mmyy.xml post ./>
Si vous publiez des pages statiques (pages) à intervalles réguliers, vous pouvez rapidement adapter cette logique.
Le sitemap peut être comme suit: sitemap-page-MMYY.xml
Sitemaps XML pour les boutiques en ligne
Une caractéristique typique des boutiques en ligne est le grand nombre de produits. Souvent, leurs descriptions proviennent de sources de données qui fournissent les images et les textes détaillés appropriés au produit. En conséquence, d'innombrables magasins en ligne utilisent la même description de produit. La conséquence en est l'apparition de contenus en double. Les pages qui ne fournissent pas de contenu unique ne sont pas pertinentes pour les index et ne doivent donc pas être répertoriées dans un plan Sitemap.
Si, en revanche, il s’agit de pages uniques contenant des informations produit spécifiques, il est utile que la boutique en ligne fournisse ces URL dans un sitemap XML. Il est judicieux de regrouper les URL par catégorie, puis de les regrouper dans des sitemaps appropriés. Les catégories appropriées pour une boutique en ligne pourraient être:
- Thème / Catégorie par exemple Pantalons, chaussures, etc.
- Marque, par exemple Adidas, Puma, Nike, etc.
- Type de page ou modèle: page de catégorie, page d'arrivée, etc.
- Date de prise de vue par jour, semaine, mois ou année
- TopSeller
Soumettre un plan Sitemap et vérifier le niveau d'indexation
L'augmentation des efforts, qui résulte d'un regroupement détaillé des URL et de la création d'une structure complexe de sitemap, porte ses fruits au plus tard après la soumission du sitemap au moteur de recherche.
Si vous envoyez un sitemap dans la console de recherche Google, vous recevrez bientôt des informations sur le degré d'indexation des URL dans le sitemap correspondant.
Figure 1: Nombre de cartes de site et d'URL indexées soumises par sitemap dans la console de recherche Google
Plus la structure de Sitemap est transparente, plus il est facile de limiter les problèmes d’indexation aux parties concernées du site Web. Si vous divisez les URL du site Web, par exemple, en fonction de répertoires sous différents plans Sitemap, vous pouvez immédiatement voir dans la console de recherche Google, quels répertoires sont relativement lentement inclus dans l'index du moteur de recherche. Comprendre les causes des difficultés d'indexation de manière plus ciblée et efficace vous aidera à comprendre quelles zones sont affectées.
Astuce: Pour une meilleure vue d'ensemble, il est judicieux de visualiser le degré d'indexation dans Excel à l'aide d'un diagramme de maillage.
Figure 2: Nombre d'URL indexées / URL soumises = niveau d'indexation par sitemap
Pour un site Web bien entretenu, l'objectif devrait être que toutes les URL soumises soient incluses dans l'index de Google. Cela correspondrait à un degré d'indexation de 100%. Si le niveau d'indexation des sitemaps est inférieur, plusieurs causes peuvent être à l'origine du problème.
Causes possibles des problèmes d'indexation
Un niveau d'index de 100% ne peut être atteint que si seul le contenu valide et indexable est répertorié dans le sitemap. Plus le sitemap XML est bien géré, plus le niveau d'indexation pouvant être atteint est élevé.
Les erreurs courantes dans le plan Sitemap peuvent être facilement identifiées à l'aide du site SEO Expertise Website Success.
premier Le code d'état du contenu n'est pas "200 OK"
Un sitemap XML bien géré offre aux moteurs de recherche une liste d’URL valides et pertinentes pour les index. Il est toujours important de veiller à ce que tout le contenu affiché dans le sitemap soit accessible. Afin de vérifier l'accessibilité du contenu du plan Sitemap, sélectionnez dans le site Web Succès le rapport "Codes d'état du contenu".
Les pages défectueuses ou redirigées peuvent être facilement analysées à l’aide de la fonction de filtrage très pratique. Cliquez sur les zones marquées en jaune et en rouge. Le tableau ci-dessous montre les URL correspondantes correspondant aux critères sélectionnés. En outre, il existe des informations sur le fichier sitemap contenant l'URL.
deuxième Sitemap contient du contenu non indexé.
Les URL non indexées ne sont pas autorisées dans un fichier Sitemap XML. La vérification de l'indexabilité de chaque URL du plan Sitemap est complexe et prend du temps.
SEO Expertise vous épargne cet effort et indique en quelques clics si des pages non indexables sont incluses dans le sitemap XML. Pour ce faire, sélectionnez le rapport "Dans les sitemaps déposés" dans la catégorie "Plan du site" et activez un filtre manuel en cliquant sur le bouton "Nouveau filtre". Le masque de filtre sélectionne et applique ensuite la catégorie Indexabilité avec l'option Pages / Fichiers uniquement non indexables. Le rapport affiche maintenant toutes les URL non indexables. En cliquant sur le graphique "contenir", seules les pages figurant dans le plan Sitemap sont affichées, mais leur contenu n'est pas indexable.
Figure 3: Identifier les pages non indexables dans le plan Sitemap
troisième Tout le contenu pertinent n'est pas répertorié dans le plan Sitemap
Plus l'architecture des pages Web est complexe et plus la taille de la page Web est grande, plus il est difficile d'inclure toutes les URL pertinentes pour l'index dans le sitemap XML. Un contenu particulièrement nouveau ou insuffisamment lié risque de passer inaperçu ou d'être oublié. Avec SEO Expertise, vous pouvez identifier rapidement les pages qui ne figurent pas dans un sitemap XML.
Pour ce faire, créez un filtre de la catégorie "indexabilité" avec l'option "contenus / fichiers indexables" dans le rapport "In Sitemaps", puis cliquez sur le graphique "non inclus". Cela vous donne une liste de toutes les URL pertinentes pour l'index qui doivent toujours être incluses dans le plan Sitemap.
Figure 4: Identifier les URL pertinentes pour l'index qui ne figurent pas déjà dans le sitemap
- Pour plus de conseils sur l'indexation et des détails sur le sitemap XML, consultez l'article de SEO Expertise Magazine.
conclusion
Grâce à une structure de sitemap XML intelligente et orientée vers les objectifs, la console de recherche Google peut être utilisée pour mesurer le degré d'indexation de toutes les zones d'un site Web et pour identifier rapidement les déficits. La structure choisie peut aller d’une simple copie 1: 1 de l’architecture d’information du site Web à des structures complexes et à des sitemaps spéciaux pour les boutiques en ligne.
Lorsque vous choisissez le plan du site, veillez à choisir un formulaire adapté à la page Web et pouvant refléter les faiblesses potentielles de la page.