Détecter et traiter les contenus minces avec Ryte

Sommaire

Avec trois nouveaux rapports: nombre de mots, nombre de mots différents par document et rapport contenu / code, SEO Expertise offre désormais plus de moyens de détecter le contenu fin. Cela améliorera encore vos audits OnPage SEO.

Tous ceux qui ont assisté à notre événement expert l’ont déjà remarqué: à l’avenir, nous souhaitons mieux comprendre ce qui facilite les flux de travail de nos clients. Dans ce cadre, nous avons lancé notre outil "Demande de fonctionnalité" afin que les clients puissent ajuster leurs souhaits encore plus facilement et que la communauté puisse ensuite décider dans quelle direction nous allons développer de nouvelles fonctionnalités. Nous avons également délibérément utilisé l'événement expert pour obtenir directement les commentaires de nos clients, ce qui nous a permis d'obtenir des informations intéressantes.

Bien entendu, la priorité de la mise en œuvre est également déterminée par les efforts. En d'autres termes, nous essayons de donner la priorité aux gains rapides plutôt qu'aux projets pouvant prendre plusieurs mois.

Nous aimerions présenter le premier résultat de ce retour d'information direct de la communauté aujourd'hui: Nouveaux rapports pour détecter le contenu fin,

Je vais maintenant présenter brièvement les 3 nouveaux rapports, puis expliquer brièvement pourquoi nous avons choisi cette solution.

1. "Nombre de mots" aka "Nombre de mots"

Le rapport "Word Count" peut être trouvé à Réussite de site Web> Statistiques de Word> Nombre de mots,

Le nom du rapport révèle en réalité ce que nous faisons: lors de l'exploration de votre page, nous identifions les mots qui apparaissent dans les documents et nous les comptons. À partir de ces valeurs, nous générons ensuite le graphique qui regroupe les documents de la manière habituelle.

Comme toujours, vous pouvez filtrer ces contenus en cliquant sur l'une des barres. En outre, la mesure du nombre de mots est désormais disponible dans tous les rapports en tant que filtre.

Ce que nous entendons par contenu

Remarque: par défaut, nous évaluons tout le contenu de la page. Cela inclut également le contenu de l'en-tête, de la barre latérale et du pied de page dans l'analyse. Mais ce n'est pas si mal: la vue d'ensemble sous la forme du graphique devrait aider à révéler les valeurs aberrantes dans le contenu de ce domaine. Certains utilisateurs nous ont demandé de jeter les passe-partout (en-tête, pied de page, barre latérale, etc.) dans notre analyse de texte. Nous avons également mis en œuvre ce souhait et vous pouvez maintenant dans les paramètres d'analyseque seul le contenu principal doit être analysé (désactivé par défaut).

A lire également : Ryte Content Cup - ce sont les gagnants!

Il convient toutefois de noter que cette approche n’est pas recommandée: premièrement, parce que les moteurs de recherche analysent également tout le contenu de la page, même si certaines personnes le prétendent, ce qui ne le serait pas et parce que cela peut parfois conduire à des résultats indésirables.

Ceux qui pensent que les moteurs de recherche n'évalueraient que le "contenu principal" d'une page peuvent se faire via un simple requête "site:" mieux enseigner à Google. En combinant un terme du contenu principal et un terme qui apparaît uniquement dans le pied de page avec un "site": vous pouvez constater que Google trouve la bonne page. S'ils analysaient uniquement le contenu principal, le résultat devrait être vide. Pourquoi ça? La reconnaissance du contenu principal est algorithmiquement assez complexe et très susceptible aux "faux positifs". Le risque de ne pas reconnaître toutes les parties du contenu principal (en particulier sur les pages contenant du code HTML un peu plus complexe) est relativement élevé. Par conséquent, l'approche consiste à indexer tout le contenu, puis à utiliser des techniques telles que la pondération des termes ("WDF * IDF"), qui est plus efficace et donne de meilleurs résultats de recherche.

Nombre de mots différents par document aka Nombre de mots unique

Ce rapport est une continuation du "nombre de mots". Au lieu de compter le nombre de mots trouvés, ce rapport ne compte chaque mot qu'une seule fois. Cela aide, par exemple Pour révéler un texte aveugle sur un domaine – c'est-à-dire par exemple Pages réservées remplies uniquement avec "Lorem Ipsum".

Contenu / Code Ratio aka Part du contenu en taille de fichier

Cette métrique a déjà fourni une discussion à l’avance. Après tout, on en parle depuis un moment dans le monde du référencement: il s'agit de mesurer la taille de la taille du fichier qui revient au contenu réel et la proportion du code HTML + Javascript + CSS (dans le document). Dans le passé, vous avez dit de manière assez simpliste: "Le rapport contenu / code ne doit pas dépasser x%". Cette vue est un peu datée de nos jours. Les nouvelles technologies (l'optimisation CSS critique, par exemple) gonflent le code d'une page, mais les utilisateurs ont également un avantage (meilleure expérience utilisateur). Vous ne devez donc pas rester là en tant que SEO et qualifier ce développement de négatif. Néanmoins, il convient de s’interroger à tout moment sur la taille du code d’un document: car plus le code est fin, plus la page se charge rapidement sur les appareils mobiles et les moteurs de recherche plus rapides peuvent télécharger et indexer cette page (si l’ensemble vu à l'échelle "vue à vol d'oiseau"). Dites: le code mince est toujours bon et parfois même les concepteurs peuvent apprendre autre chose.

A lire également : Comment augmenter votre trafic de référencement en 30 jours!

Cette histoire de métriques nous a rendu réticents à les inclure dans notre logiciel. Mais la discussion sur le contenu mince a finalement pris la décision de créer un rapport. Parce que le ratio contenu / code peut être utilisé à merveille pour démasquer des documents dans un domaine qui sont "différents". Tout ce que vous avez à faire est de regarder le graphique pour les «valeurs aberrantes».

Les valeurs aberrantes à gauche (les documents avec une ration de code de contenu de 0 à 10%) sont nos supposées pages de contenu minces. Par exemple, il y a nos outils gratuits (il n’ya presque pas de texte) mais aussi des pages de catégories plutôt vides du blog.

Pour affiner l'analyse, j'exclus les outils gratuits de l'analyse via des filtres, car les pages ont une valeur ajoutée malgré un contenu limité et doivent donc être ignorées lors de l'évaluation du "contenu fin".

Et voici, ce sont des pages très minces! Apparemment, notre blog, par exemple, relie les auteurs de l'article et mène à un aperçu des articles de cet auteur. Et ce sont ces aperçus qui sont assez "minces" pour nos auteurs invités – car la plupart d'entre eux n'ont publié qu'un article à ce jour.

Ci-dessous, même le contenu de notre nouveau sous-domaine international "en.ryte.com" sera révélé, mais n'a pas encore été traduit. Il n'y aura pas de contenu affiché sur notre page anglaise. Ce rapport constitue donc une aide pratique pour notre équipe de traduction, car il permet de placer un autre filtre sur le sous-domaine "fr.ryte.com", puis d'afficher les URL où il doit encore le faire.

A lire également : Récapitulation SEOkomm 2013

Comme vous pouvez le constater, le rapport de rapport contenu / code (ainsi que les deux autres nouveaux rapports) offre des possibilités d'analyse ingénieuses, notamment en combinaison avec les puissants filtres proposés par SEO Expertise.

Contexte: Pourquoi ces métriques?

Enfin, quelques mots expliquent pourquoi nous avons choisi ces trois mesures relativement simples. Longue histoire courte: Déterminer ce que le contenu mince est et n'est pas sacrément difficile. Sur un domaine, plusieurs CMS différents ou différents modèles peuvent être utilisés. Par conséquent, nous ne pouvons pas simplement définir une valeur de X sur "bonne" et tout ce qui se trouve en dessous est automatique "Contenu mince", Dans le monde des moteurs de recherche, le "contenu mince" pose moins de problèmes. Après tout, le fait est qu'une page de contenu mince est automatiquement déclarée en tant que contenu dupliqué et ne se retrouve donc pas dans l'index. Parce que si un domaine a plusieurs pages avec un contenu fin, cela signifie que ces pages sont considérées comme un contenu dupliqué. Étant donné que les référenceurs sont intéressés par la création de plans de travail et de tâches à effectuer dans le secteur des agences, il est logique de jeter un coup d'œil au contenu fin. A l'aide des trois métriques choisies:

le nombre de mots
mots différents
Rapport contenu / code

Nous permettons au client d'optimiser l'analyse sur son propre cas particulier (voir l'exemple ci-dessus en utilisant notre propre domaine). Cette approche est très flexible et vous obtenez des idées ingénieuses avec créativité – ce qu'aucun outil ne pourrait fournir, qui dit simplement: "Si une page compte moins de 400 mots, la page est mauvaise".

Nous espérons que vous apprécierez les nouveaux rapports et qu’ils vous aideront dans votre travail quotidien.