Nous avons analysé 11,8 millions de résultats de recherche GoogleVoici ce que nous avons appris sur le SEO
Nous avons récemment analysé 11,8 millions de résultats de recherche Google pour répondre à la question :
Quels facteurs sont en corrélation avec le classement en première page des moteurs de recherche ?
Nous avons examiné le contenu. Nous avons examiné les liens retour. Nous avons même examiné la vitesse de la page.
Avec l’aide de notre partenaire de données Ahrefs, nous avons découvert des résultats intéressants.
Et aujourd’hui, je vais partager ce que nous avons trouvé avec vous.
Voici un résumé de nos principales conclusions :
1. Nos données montrent que l’autorité de lien globale d’un site (telle que mesurée par Ahrefs Domain Rating) est fortement corrélée avec des classements plus élevés.
2. Les pages avec beaucoup de backlinks se classent au-dessus des pages qui n’ont pas autant de backlinks. En fait, le résultat #1 dans Google a en moyenne 3,8x plus de backlinks que les positions #2-#10.
3. Un contenu complet avec un « Content Grade » élevé (via Clearscope), surpasse significativement le contenu qui ne couvre pas un sujet en profondeur.
4. Nous n’avons trouvé aucune corrélation entre la vitesse de chargement des pages (mesurée par Alexa) et le classement de la première page de Google.
5. Obtenir des backlinks de plusieurs sites différents semble être important pour le référencement. Nous avons constaté que le nombre de domaines liés à une page avait une corrélation avec les classements.
6. La grande majorité des balises de titre dans Google correspondent exactement ou partiellement au mot clé pour lequel ils sont classés. Cependant, nous avons trouvé essentiellement une corrélation nulle entre l’utilisation d’un mot-clé dans votre balise de titre et un meilleur classement sur la première page.
7. L’autorité de la page (mesurée par Ahrefs URL Rating) a une faible corrélation avec les classements.
8. Nous avons découvert que le nombre de mots était uniformément réparti parmi les 10 premiers résultats. Le résultat moyen de la première page de Google contient 1 447 mots.
9. La taille des pages HTML n’a pas de corrélation avec les classements. En d’autres termes, les pages lourdes ont les mêmes chances de se classer que les pages légères.
10. Nous avons trouvé une très légère corrélation entre la longueur de l’URL et les classements. Plus précisément, les URL courtes ont tendance à avoir un léger avantage de classement par rapport aux URL plus longues.
11. Nos données montrent que l’utilisation du balisage Schema n’est pas corrélée à un meilleur classement.
12. Les sites Web dont le « temps sur le site » est supérieur à la moyenne ont tendance à être mieux classés dans Google. Plus précisément, l’augmentation du temps sur le site de 3 secondes est corrélée à un classement d’une seule position plus élevée dans les résultats de recherche.
Nous avons des données et des informations détaillées de nos conclusions ci-dessous.
Les domaines faisant autorité ont tendance à être mieux classés dans les résultats de recherche de Google
Nous avons constaté que l’autorité globale des liens d’un site Web (mesurée à l’aide de l’évaluation de domaine Ahrefs) est corrélée à un meilleur classement en première page de Google :
Et en général, l’évaluation de domaine moyenne augmente en fonction de la position SERP.
En d’autres termes, plus vous allez haut sur la première page, plus la cote de domaine a tendance à être élevée.
En fait, l’autorité globale d’un site Web avait une corrélation plus forte avec les classements que l’autorité de la page elle-même (cote URL).
Prises clés : Des évaluations de domaine plus élevées sont en corrélation avec des classements plus élevés sur la première page de Google. Par conséquent, les domaines ont un avantage significatif dans les SERPs.
Les pages avec plus de backlinks ont tendance à être mieux classées que les pages avec moins de backlinks
L’une des conclusions les plus intéressantes de cette analyse est que très peu de pages ont des backlinks.
En fait, nous avons constaté qu’environ 95% de toutes les pages ont zéro backlink.
Ce résultat est en ligne avec cette analyse Backlinko-BuzzSumo de 912 millions d’articles de blog, qui a trouvé que 94% de tout le contenu a zéro backlinks.
En fait, si peu de pages avaient des backlinks que les pages « zéro backlink » commençaient à fausser les données. Donc, pour ce facteur de classement, nous avons décidé d’exécuter cette analyse particulière en excluant les pages avec zéro backlink.
Peut-être pas surprenant, nous avons découvert que les pages avec le plus grand nombre de backlinks totaux avaient tendance à mieux se classer dans Google.
Nous avons également constaté que le résultat n°1 a en moyenne 3,8x plus de backlinks que les résultats classés #2-#10.
Récupération clé : Même si Google continue d’ajouter de la diversité à son algorithme, il semble que les backlinks restent un signal de classement critique.
Un contenu complet est fortement corrélé à des classements plus élevés
De nombreux experts en référencement affirment qu’un contenu complet est plus performant dans Google.
Dit autrement : un contenu qui couvre un sujet entier sur une seule page peut avoir une relation directe ou indirecte avec les classements.
Nous avons décidé de mettre cette hypothèse à l’épreuve. Plus précisément, nous avons fait passer un sous-ensemble de notre ensemble de données complet de 11,8 millions d’URL par l’outil d’analyse de contenu Clearscope.io.
Notre analyse a révélé une corrélation claire entre la « note de contenu » et les classements Google dans les résultats de bureau et mobiles.
En fait, en regardant les 30 premiers résultats, augmenter la note de contenu de 1 équivaut approximativement à augmenter les classements d’une position. Ce qui suggère une relation significative.
Par exemple, prenez cette page de PaleoLeap.com:
Cette page possède de nombreuses métriques traditionnelles qui sont généralement en corrélation avec un classement Google élevé. Par exemple, la page utilise le mot-clé exact dans la balise titre de la page et dans la balise H1. En outre, le domaine fait très autorité (Ahrefs Domain Rating de 73).
Pourtant, cette page ne se classe qu’au 9e rang pour le mot clé : « petits déjeuners du régime paléo ».
Sure enough, cette page a également un Content Grade relativement faible.
La question de savoir si un contenu complet a un impact direct sur les classements n’est pas claire.
Il se pourrait que Google ait une préférence inhérente pour le contenu qu’ils jugent complet. Ou il se peut que les utilisateurs soient plus satisfaits des résultats de recherche qui leur donnent une réponse complète à leur requête.
Comme il s’agit d’une étude de corrélation, il est impossible de déterminer la raison sous-jacente de cette relation à partir de nos seules données.
Principes à retenir : Rédiger un contenu complet et approfondi peut aider les pages à mieux se classer dans Google.
La vitesse de chargement des pages n’a pas de corrélation avec le classement
Gogle utilise la vitesse du site comme signal de classement officiel depuis 2010.
Et la plus récente mise à jour de Google liée à la vitesse, la « Speed Update » de 2018, a été conçue pour fournir aux chercheurs mobiles des pages à chargement plus rapide.
Cependant, nous voulions savoir :
Est-ce que la vitesse du site est en corrélation avec le classement réel de Google ?
Nous avons utilisé la vitesse de domaine d’Alexa pour analyser le temps de chargement médian de 1 million de domaines de notre ensemble de données. En d’autres termes, nous n’avons pas mesuré directement la vitesse de chargement des pages individuelles de notre ensemble de données. Nous avons simplement regardé la vitesse de chargement moyenne sur l’ensemble du domaine.
Dans l’ensemble, nous avons trouvé une corrélation nulle entre la vitesse du site et les classements Google :
À première vue, ce résultat peut surprendre. Après tout, PageSpeed est un signal de classement confirmé de Google. Sachant cela, on pourrait s’attendre à ce que les pages plus rapides surpassent généralement les pages plus lentes.
Pourtant, les données dépeignent une image différente. Et lorsque vous creusez un peu plus profondément, ce manque de relation a du sens.
Lorsque Google a annoncé sa mise à jour de vitesse, ils se sont assurés de souligner que cette mise à jour affectait en grande partie les pages extrêmement lentes.
Et que la mise à jour dans son ensemble peut ne pas être si impactante.
En bref, l’algorithme de Google semble déclasser les pages extrêmement lentes par rapport aux pages rapides avantageuses.
Et notre analyse a révélé que la vitesse moyenne de chargement des pages pour un résultat de première page est de 1.65 secondes.
Notre analyse précédente de la vitesse du site a révélé que la page moyenne prenait 10 secondes à charger sur le bureau et 27 secondes sur le mobile.
Par rapport à ce point de référence, une vitesse de chargement moyenne de 1,65 seconde est extrêmement rapide.
Et parce que les 10 premiers résultats ont tendance à se charger relativement rapidement, ils ne semblent pas être affectés par les différentes mises à jour de vitesse de Google.
Volonté principale : Le résultat moyen de la première page de Google se charge en 1,65 seconde. Cependant, nous n’avons trouvé aucune corrélation entre la vitesse du site et les classements de Google.
Le nombre de domaines de référence semble avoir une influence sur les classements
De nombreux experts en référencement s’accordent à dire que l’obtention de plusieurs backlinks à partir du même domaine a des rendements décroissants.
En d’autres termes, il vaut mieux obtenir 10 liens de 10 sites différents que 10 liens du même domaine.
Selon notre analyse, cela semble être le cas. Nous avons constaté que la diversité des domaines a un impact substantiel sur les classements.
Comme pour les backlinks, les premiers résultats ont tendance à avoir plus de domaines de liaison que ceux vers le bas de la première page.
Prises clés : Obtenir des liens d’un groupe diversifié de domaines semble être important pour le référencement.
La plupart des balises de titre sur la première page de Google contiennent des mots-clés qui sont une correspondance exacte ou partielle de cette recherche
Depuis les premiers jours des moteurs de recherche, la balise de titre a été considérée comme l’élément de référencement sur page le plus important.
Parce que votre balise titre donne aux gens (et aux moteurs de recherche) un aperçu du sujet global de votre page, les mots qui apparaissent dans votre balise titre devraient vraisemblablement avoir un impact significatif sur les classements.
En fait, le propre Guide de démarrage pour l’optimisation des moteurs de recherche de Google recommande d’écrire des balises de titre qui décrivent le sujet de cette page.
Sure enough, nous avons constaté que la plupart des balises de titre sur la première page de Google contiennent tout ou partie du mot-clé pour lequel ils sont classés.
Alors que la plupart des pages qui se classent pour un mot-clé ont ce mot-clé dans leur balise de titre, une balise de titre optimisée pour le mot-clé ne semble pas être en corrélation avec un meilleur classement sur la première page.
En fait, notre modèle linéaire prédit une très faible relation entre la correspondance des balises de titre et les classements (seulement une différence de 1% entre le résultat #1 et #10).
Il apparaît qu’une balise titre riche en mots clés peut être un « ticket d’entrée » qui peut vous aider à atteindre la première page.
Cependant, une fois que vous êtes sur la première page, l’utilisation du mot clé exact dans votre titre ne semble pas vous aider à grimper dans le classement. C’est là que d’autres facteurs (comme les backlinks, les signaux d’expérience utilisateur et l’autorité du domaine) semblent jouer un rôle important.
Principaux enseignements : Les pages figurant dans les 10 premiers résultats de Google contiennent 65 % à 85 % des mots clés pour lesquels elles sont classées dans leur balise titre. Cependant, nous avons trouvé très peu (voire aucune) corrélation entre les balises de titre optimisées pour les mots clés et un meilleur classement sur la première page.
Les balises H1 optimisées pour les mots clés ne sont pas corrélées à un meilleur classement sur la première page
Similairement à nos résultats sur les balises de titre, la plupart des pages dans les résultats de Google ont un mot clé correspondant dans la balise H1 de la page.
De plus, les H1 appariés à un mot-clé n’ont essentiellement aucune relation avec un meilleur classement sur Google.
Récupération clé : Comme pour l’optimisation de la balise title, les H1 peuvent être un facteur de » ticket d’entrée » qui peut vous aider à craquer la première page de Google. Cependant, les H1 riches en mots clés peuvent ne pas être un signal de classement assez fort pour aider une page à monter dans les résultats de la première page.
L’autorité de la page (notation de l’URL) a une légère corrélation avec des classements plus élevés
En plus de la notation du domaine, nous voulions répondre à la question :
L’autorité globale des liens d’une page influence-t-elle les classements ?
En d’autres termes, est-il plus important d’obtenir des backlinks vers une page spécifique ? Ou l’autorité globale du domaine d’un site est-elle plus importante ?
Pour le savoir, nous avons examiné la corrélation entre l’autorité de la page (mesurée par l’évaluation URL d’Ahrefs) et les classements.
Bien que nous ayons constaté que l’évaluation URL et les classements étaient liés, la relation était faible.
Spécifiquement, les pages classées dans le top 6 ont une note URL légèrement plus élevée (12) par rapport aux pages classées de 7 à 10 (11).
Cependant, cette corrélation n’était pas aussi forte que l’impact de la note de domaine d’un site sur les classements.
Dans l’ensemble, la plupart des évaluations d’URL sont similaires parmi les 10 premiers.
Et à travers toutes les pages de notre ensemble de données, nous avons constaté que l’évaluation moyenne de l’URL d’un résultat de première page dans Google était de 11,2.
Key Takeaway : L’autorité des liens de chaque page individuelle de votre site semble avoir un impact relativement faible sur les classements par rapport à l’autorité globale du domaine de votre site.
Le nombre moyen de mots d’un résultat de première page de Google est de 1 447 mots
Le contenu long est-il plus performant que les courts articles de blog de 200 mots ?
D’autres études industrielles, comme celle-ci, ont constaté que le contenu plus long a tendance à accumuler plus de backlinks par rapport aux articles de blog courts.
En effet, nous avons découvert que le contenu qui se classe dans Google a tendance à être du côté long.
En général, le nombre de mots moyen d’un résultat du top 10 de Google est de 1 447 mots.
Cependant, malgré le fait que le contenu long a tendance à être le meilleur pour la création de liens, nous n’avons trouvé aucune relation directe entre le nombre de mots et le classement.
Cela peut être dû au fait que, comme avec les balises de titre optimisées pour les mots clés, le contenu long peut vous aider à craquer la première page. Mais il ne vous aidera pas une fois que vous y serez.
Ceci étant une étude de corrélation, il nous est impossible de déterminer précisément pourquoi le contenu long format a tendance à apparaître sur la première page de Google.
Principaux enseignements : Les pages dont le nombre de mots est plus élevé semblent avoir les mêmes chances de figurer en bonne place sur la première page que les pages dont le nombre de mots est plus faible. Le nombre moyen de mots d’un résultat de première page de Google est de 1 447 mots.
La taille HTML de la page n’a pas de relation avec les classements
Est-ce que le fait d’avoir une page allégée (en termes d’octets totaux) affecte votre classement Google ?
Selon cette analyse, non.
Nous n’avons trouvé aucune corrélation entre la taille de la page et les classements.
Des personnes dans la communauté SEO ont spéculé que les pages plus grandes avec un HTML gonflé sont désavantagées.
Pour autant, selon les pages de notre analyse, la taille de la page ne peut pas être liée aux classements.
Principaux enseignements : La taille de la page ne semble pas avoir d’impact sur le classement de Google.
Les URL courtes ont tendance à être légèrement mieux classées que les URL longues
Google recommande d’utiliser des « URL simples » et déconseille spécifiquement les URL « extrêmement longues ».
Cependant, ces recommandations semblent être plus orientées vers l’optimisation des URL pour l’expérience utilisateur que pour le référencement.
C’est pourquoi nous avons entrepris d’étudier le lien entre la longueur des URL et les classements.
Nous avons effectivement constaté que les URL courtes se classent au-dessus des URL longues.
Spécifiquement, les URL en position #1 sont en moyenne 9.2 caractères plus courts que les URL qui se classent en position 10.
Et la longueur moyenne d’une URL pour un résultat du top 10 dans Google est de 66 caractères.
Cependant, dans l’ensemble, la plupart des URL sur la première page de Google sont approximativement de la même longueur (40 à 100 caractères).
Les URL courtes peuvent améliorer le référencement pour quelques raisons différentes.
Premièrement, les URL courtes peuvent conduire à un CTR organique plus élevé. En fait, notre étude à grande échelle sur le CTR organique a révélé que les URL courtes ont un CTR plus élevé par rapport aux URL longues.
Deuxièmement, les URL courtes peuvent aider Google à comprendre de quoi parle votre page.
Par exemple, une URL courte comme backlinko.com/my-post est plus facile à comprendre pour Google que backlinko.com/1/12/2022/blog/category/this-is-the-title-of-my-blog-post pageid=891/.
Enfin, une URL longue a tendance à pointer vers une page qui est à plusieurs clics de la page d’accueil. Cela signifie généralement qu’il y a moins d’autorité qui circule vers cette page. Moins d’autorité signifie des classements plus bas.
Par exemple, cette URL vers une page de produit de vase représente une page qui est très éloignée de la page d’accueil du site qui fait autorité:
Renseignements clés : Les URL plus courtes ont une corrélation avec des classements plus élevés. L’URL moyenne sur la première page de Google fait 66 caractères.
Il n’y a pas de corrélation entre le balisage Schema et les classements
Il y a eu beaucoup de buzz sur Schema dans la communauté SEO au cours des dernières années.
Google eux-mêmes sont restés vagues sur l’impact de Schema sur les classements.
Beaucoup pensent que le balisage Schema donne aux moteurs de recherche une meilleure compréhension de ce que signifie votre contenu. Cette compréhension plus profonde les encouragera à montrer votre site à plus de personnes.
Par exemple, vous pouvez utiliser des données structurées pour faire savoir à Google que lorsque vous utilisez le mot « Toy Story », vous faites référence au titre original du film… et non à la franchise en général :
De nombreux sites utilisent Schema pour obtenir des snippets riches dans les SERP.
Cependant, malgré ces avantages potentiels, nous avons constaté que très peu de sites ont mis en œuvre Schema.
Nous avons découvert que seulement 72,6% des pages de la première page de Google utilisent Schema.
Et, selon notre analyse, la présence de données structurées n’avait aucune relation avec les classements Google.
Key Takeaway : L’utilisation du balisage Schema peut avoir sa place. Mais il n’y a pas de corrélation directe avec un meilleur classement dans Google.
Les sites Web dont le « temps sur le site » est supérieur à la moyenne ont tendance à être mieux classés dans Google
De nombreuses personnes dans le monde du référencement ont émis l’hypothèse que Google utilise des « signaux d’expérience utilisateur » (comme le taux de rebond, le temps sur le site, le taux de clics organiques et le pogosticking) comme facteurs de classement.
Pour tester cette théorie, nous avons fait passer un sous-ensemble de domaines de notre ensemble de données par Alexa pour déterminer le temps sur site à l’échelle du site. Nous avons ensuite cherché à voir s’il y avait une corrélation entre le temps sur le site et le classement de la première page de Google.
Nous avons en effet trouvé une forte relation entre le temps sur le site et le classement.
Spécifiquement, nous avons découvert que le temps sur le site est fortement corrélé avec un meilleur classement.
En général, le temps moyen sur le site pour un résultat de première page de Google est de 2,5 minutes.
Veuillez garder à l’esprit que nous ne suggérons pas que le temps sur le site a une relation directe avec un meilleur classement.
Bien sûr, Google peut utiliser quelque chose comme le temps sur le site ou le taux de rebond comme un signal de classement (bien qu’ils l’aient précédemment nié). Ou cela peut être le fait que le contenu de haute qualité garde les gens plus engagés. Par conséquent, un temps élevé sur le site est un sous-produit du contenu de haute qualité, que Google mesure effectivement.
Comme il s’agit d’une étude de corrélation, il est impossible de le déterminer à partir de nos seules données.
Principaux enseignements : Le temps moyen sur le site pour un résultat de première page de Google est de 2,5 minutes.
Nous avons également constaté une forte corrélation entre le temps sur le site et les classements Google. Cependant, il n’est pas clair s’il s’agit d’une corrélation ou d’une causalité.
Conclusion
J’aimerais remercier à nouveau Ahrefs pour avoir fourni une grande partie des données brutes qui ont rendu cette étude possible.
Aussi, si vous souhaitez en savoir plus sur la façon dont nous avons collecté et analysé nos données, voici un lien vers nos méthodes d’étude. Nous avons également téléchargé les données brutes utilisées dans cette analyse sur GitHub.
Maintenant, j’aimerais entendre vos réflexions :
Quel est votre enseignement #1 à retenir de cette analyse ?
Ou peut-être avez-vous une question sur les résultats.