Accueil » Ventes & Marketing » L'état actuel de Google PageRank et son évolution

L'état actuel de Google PageRank et son évolution

pagerank google

PageRank (PR) est un algorithme qui améliore la qualité des résultats de recherche en utilisant des liens pour mesurer l'importance d'une page. Il considère les liens comme des votes, l'hypothèse sous-jacente étant que les pages les plus importantes sont susceptibles de recevoir plus de liens.

PageRank a été créé par les cofondateurs de Google, Sergey Brin et Larry Page, en 1997, alors qu'ils étaient à l'Université de Stanford, et le nom fait référence à la fois à Larry Page et au terme "page Web". 

À bien des égards, cela ressemble à une métrique appelée «facteur d'impact» pour les revues, où plus cité = plus important. Il diffère un peu en ce que PageRank considère certains votes plus importants que d'autres. 

En utilisant des liens avec du contenu pour classer les pages, les résultats de Google étaient meilleurs que ceux de ses concurrents. Les liens sont devenus la monnaie du web.

Vous voulez en savoir plus sur le PageRank ? Plongeons dedans.

Table des matières
Google utilise toujours le PageRank
Mathématiques amusantes, pourquoi la formule PageRank était fausse
Histoire du PageRank
Comment le PageRank a changé
Pouvez-vous toujours vérifier votre PageRank ?
Comment améliorer votre PageRank
Réflexions finales

Google utilise toujours le PageRank

En termes de référencement moderne, le PageRank est l'un des algorithmes comprenant Expérience Expertise Autorité Fiabilité (EEAT).

Les algorithmes de Google identifient les signaux concernant les pages qui sont en corrélation avec la fiabilité et l'autorité. Le plus connu de ces signaux est le PageRank, qui utilise des liens sur le Web pour comprendre l'autorité.

Source : Comment Google lutte contre la désinformation

Nous avons également reçu la confirmation de représentants de Google comme Gary Illyes, qui a déclaré que Google utilise toujours le PageRank et que les liens sont utilisés pour EAT (maintenant EEAT).

Quand j'ai couru un étude pour mesurer l'impact des liens et effectivement supprimé les liens à l'aide de l'outil de désaveu, la baisse était évidente. Les liens comptent toujours pour les classements.

Impact sur le trafic lorsque les liens sont désavoués

PageRank a également été un facteur confirmé en ce qui concerne budget d'analyse. Il est logique que Google veuille explorer plus souvent les pages importantes.

Le PageRank est aussi un signal de canonisation. Les pages avec un PageRank plus élevé sont plus susceptibles d'être choisies comme la version canonique qui est indexée et présentée aux utilisateurs.

Mathématiques amusantes, pourquoi la formule PageRank était fausse 

Fait fou : la formule publiée dans l'article original du PageRank était erronée. Voyons pourquoi. 

Le PageRank a été décrit dans le papier d'origine sous forme de distribution de probabilité, c'est-à-dire la probabilité que vous vous trouviez sur une page Web donnée. Cela signifie que si vous additionnez le PageRank de chaque page sur le Web, vous devriez obtenir un total de 1.

Voici la formule complète du PageRank de l'article original publié en 1997 :

PR (A) = (1-d) + d (PR (T1) / C (T1) +… + PR (Tn) / C (Tn))

Un peu simplifié et en supposant que le facteur d'amortissement (d) est de 0.85 comme Google l'a mentionné dans l'article (j'expliquerai bientôt quel est le facteur d'amortissement), c'est :

PageRank pour une page = 0.15 + 0.85 (une partie du PageRank de chaque page de liaison répartie sur ses liens sortants)

Dans le papier, ils ont dit que la somme du PageRank pour chaque page devrait être égale à 1. Mais ce n'est pas possible si vous utilisez la formule dans le papier. Chaque page aurait un PageRank minimum de 0.15 (1-d). Juste quelques pages mettraient le total à plus de 1. Vous ne pouvez pas avoir une probabilité supérieure à 100 %. Quelque chose ne va pas!

La formule devrait en fait diviser ce (1-d) par le nombre de pages sur Internet pour que cela fonctionne comme décrit. Ce serait:

PageRank pour une page = (0.15/nombre de pages sur Internet) + 0.85 (une partie du PageRank de chaque page de liaison répartie sur ses liens sortants)

C'est encore compliqué, alors voyons si je peux l'expliquer avec quelques visuels.

1. Une page reçoit un score PageRank initial basé sur les liens pointant vers elle. Disons que j'ai cinq pages sans liens. Chacun obtient un PageRank de (1/5) ou 0.2.

Exemple de PageRank de cinq pages sans liens pour le moment

2. Ce score est ensuite distribué à d'autres pages via les liens sur la page. Si j'ajoute des liens vers les cinq pages ci-dessus et que je calcule le nouveau PageRank pour chacune, j'obtiens ceci : 

Exemple de PageRank de cinq pages après une itération

Vous remarquerez que les scores favorisent les pages avec plus de liens vers eux.

3. Ce calcul est répété au fur et à mesure que Google explore le Web. Si je calcule à nouveau le PageRank (appelé une itération), vous verrez que les scores changent. Ce sont les mêmes pages avec les mêmes liens, mais le PageRank de base pour chaque page a changé, donc le PageRank résultant est différent.

Exemple de PageRank de cinq pages après deux itérations

La formule PageRank a également un soi-disant «facteur d'amortissement», le «d» dans la formule, qui simule la probabilité qu'un utilisateur aléatoire continue de cliquer sur des liens lorsqu'il navigue sur le Web. 

Pensez-y comme ceci : la probabilité que vous cliquiez sur un lien sur la première page que vous visitez est raisonnablement élevée. Mais la probabilité que vous cliquiez ensuite sur un lien sur la page suivante est légèrement inférieure, et ainsi de suite.

Si une page solide est directement liée à une autre page, elle transmettra beaucoup de valeur. Si le lien est à quatre clics, la valeur transférée à partir de cette page forte sera beaucoup moins importante en raison du facteur d'amortissement.

Exemple montrant le facteur d'amortissement PageRank

Histoire du PageRank

Histoire du PageRank

Le premier brevet PageRank a été déposé le 9 janvier 1998. Il était intitulé «Méthode de classement des nœuds dans une base de données liée. » Ce brevet a expiré le 9 janvier 2018 et n'a pas été renouvelé. 

Google a rendu le PageRank public pour la première fois lorsque le Annuaire Google lancé le 15 mars 2000. Il s'agissait d'une version du projet Open Directory mais triée par PageRank. Le répertoire a été fermé le 25 juillet 2011.

C'était le 11 décembre 2000, quand Google a lancé PageRank dans la barre d'outils Google, qui était la version la plus obsédée par les référenceurs.

Voici à quoi cela ressemblait lorsque PageRank était inclus dans la barre d'outils de Google. 

PageRank 8/10 dans l'ancienne barre d'outils de Google

PageRank dans la barre d'outils a été mis à jour pour la dernière fois le 6 décembre 2013 et a finalement été supprimé le 7 mars 2016.

Le PageRank affiché dans la barre d'outils était un peu différent. Il utilisait un système de numérotation simple de 0 à 10 pour représenter le PageRank. Mais PageRank lui-même est une échelle logarithmique où atteindre chaque nombre supérieur devient de plus en plus difficile.

PageRank a même fait son chemin dans Google Sitemaps (maintenant connu sous le nom de Google Search Console) le 17 novembre 2005. Il a été affiché dans les catégories haute, moyenne, basse ou N/A. Cette fonctionnalité a été supprimée le 15 octobre 2009.

Au fil des ans, il y a eu de nombreuses façons différentes dont les référenceurs ont abusé du système dans la recherche de plus de PageRank et de meilleurs classements. Google a tout un liste des schémas de liens cela comprend:

  • Acheter ou vendre des liens - échanger des liens contre de l'argent, des biens, des produits ou des services.
  • Échanges de liens excessifs.
  • Utiliser un logiciel pour créer automatiquement des liens.
  • Exiger des liens dans le cadre de conditions d'utilisation, d'un contrat ou d'un autre accord.
  • Annonces textuelles qui n'utilisent pas d'attributs nofollow ou sponsorisés.
  • Annonces publicitaires ou publicités natives qui incluent des liens qui passent le crédit de classement.
  • Articles, publications d'invités ou blogs avec des liens de texte d'ancrage optimisés.
  • Annuaires ou liens de signets sociaux de mauvaise qualité.
  • Liens riches en mots clés, cachés ou de faible qualité intégrés dans des widgets qui sont placés sur d'autres sites Web.
  • Liens largement distribués dans les pieds de page ou les modèles. Par exemple, coder en dur un lien vers votre site Web dans le thème WP que vous vendez ou donnez gratuitement.
  • Commentaires du forum avec des liens optimisés dans la publication ou la signature.

Les systèmes de lutte contre le spam de liens ont évolué au fil des ans. Regardons quelques-unes des mises à jour majeures.

Nofollow

Le 18 janvier 2005, Google a annoncé qu'il s'était associé à d'autres moteurs de recherche majeurs pour introduire l'attribut rel="nofollow". Il a encouragé les utilisateurs à ajouter le nofollow attribuer aux commentaires de blog, aux rétroliens et aux listes de références pour aider à lutter contre le spam.

Voici un extrait de la déclaration officielle de Google sur l'introduction du nofollow :

Si vous êtes un blogueur (ou un lecteur de blog), vous connaissez douloureusement les personnes qui tentent d'améliorer le classement de leurs propres sites Web dans les moteurs de recherche en soumettant des commentaires de blog liés comme "Visitez mon site de produits pharmaceutiques à prix réduits". C'est ce qu'on appelle le spam de commentaires, nous n'aimons pas ça non plus, et nous avons testé une nouvelle balise qui le bloque. À partir de maintenant, lorsque Google verra l'attribut (rel="nofollow") sur les hyperliens, ces liens n'obtiendront aucun crédit lorsque nous classerons les sites Web dans nos résultats de recherche. 

Presque tous les systèmes modernes utilisent l'attribut nofollow sur les liens de commentaires de blog. 

Les référenceurs ont même commencé à abuser du nofollow, parce que bien sûr nous l'avons fait. Nofollow a été utilisé pour la sculpture PageRank, où les gens ne suivaient pas certains liens sur leurs pages pour renforcer d'autres liens. Google a finalement changé le système pour empêcher cet abus.

En 2009, Matt Cutts de Google a confirmé que cela ne fonctionnerait plus et que le PageRank serait distribué sur les liens même si un attribut nofollow était présent (mais ne passait que par le lien suivi).

Google a ajouté quelques autres attributs de lien qui sont des versions plus spécifiques de l'attribut nofollow le 10 septembre 2019. Celles-ci comprenaient rel = "ugc" destiné à identifier le contenu généré par l'utilisateur et rel = "sponsorisé" destiné à identifier les liens payants ou affiliés.

Alors que les référenceurs trouvaient de nouvelles façons de créer des liens, Google a travaillé sur de nouveaux algorithmes pour détecter ce spam. 

Lorsque l'algorithme Penguin original a été lancé le 24 avril 2012, il a nui à de nombreux sites Web et propriétaires de sites Web. Google a donné aux propriétaires de sites un moyen de récupérer plus tard cette année-là en introduisant le outil de désaveu Octobre 16, 2012.

Quand Penguin 4.0 lancé le 23 septembre 2016, il a apporté un changement bienvenu à la façon dont le spam de lien était traité par Google. Au lieu de nuire aux sites Web, il a commencé à dévaluer les liens de spam. Cela signifiait également que la plupart des sites n'avaient plus besoin d'utiliser l'outil de désaveu. 

Google a lancé son premier Mise à jour des liens indésirables le 26 juillet 2021. Cela a récemment évolué, et un Mise à jour des liens indésirables le 14 décembre 2022, a annoncé l'utilisation d'un système de détection basé sur l'IA appelé SpamBrain pour neutraliser la valeur des liens non naturels. 

Comment le PageRank a changé

La version originale de PageRank n'a pas été utilisée depuis 2006, selon un ancien employé de Google. L'employé a déclaré qu'il avait été remplacé par un autre algorithme moins gourmand en ressources.

Ils l'ont remplacé en 2006 par un algorithme qui donne des résultats approximativement similaires mais qui est nettement plus rapide à calculer. L'algorithme de remplacement est le nombre qui a été signalé dans la barre d'outils et ce que Google revendique comme PageRank (il a même un nom similaire, et donc la revendication de Google n'est pas techniquement incorrecte). Les deux algorithmes sont O (N log N) mais le remplacement a une constante beaucoup plus petite sur le facteur log N, car il supprime la nécessité d'itérer jusqu'à ce que l'algorithme converge. C'est assez important car le Web est passé d'environ 1 à 10 millions de pages à 150 milliards +.

Vous souvenez-vous de ces itérations et de la façon dont le PageRank changeait à chaque itération ? Il semble que Google ait simplifié ce système.

Qu'est-ce qui a changé d'autre ?

Plutôt que de diviser le PageRank équitablement entre tous les liens d'une page, certains liens sont plus valorisés que d'autres. Il y a des spéculations de brevets selon lesquelles Google est passé d'un modèle de surfeur aléatoire (où un utilisateur peut accéder à n'importe quel lien) à un modèle de surfeur raisonnable (où certains liens sont plus susceptibles d'être cliqués que d'autres, ils ont donc plus de poids).

Plusieurs systèmes ont été mis en place pour ignorer la valeur de certains liens. Nous avons déjà parlé de quelques-uns d'entre eux, notamment :

  • Nofollow, UGC et attributs sponsorisés.
  • Algorithme Penguin de Google.
  • L'outil de désaveu.
  • Mises à jour de spam de lien.

Google ne comptabilisera pas non plus les liens sur les pages bloquées par robots.txt. Il ne sera pas en mesure d'explorer ces pages pour voir les liens. Ce système était probablement en place depuis le début.

Google a un canonisation système qui l'aide à déterminer quelle version d'une page doit être indexée et à consolider les signaux des pages en double vers cette version principale.

Signaux de canonisation

Éléments de lien canonique ont été introduits le 12 février 2009 et permettent aux utilisateurs de spécifier leur version préférée.

On disait à l'origine que les redirections transmettaient la même quantité de PageRank qu'un lien. Mais à un moment donné, ce système a changé et aucun PageRank n'est actuellement perdu.

Un peu est encore inconnu

Lorsque les pages sont marquées comme noindex, nous ne savons pas exactement comment Google traite les liens. Même les Googleurs ont des déclarations contradictoires.

Selon John Muller, les pages marquées noindex seront éventuellement traitées comme noindex, nofollow. Cela signifie que les liens finissent par cesser de transmettre toute valeur.

Selon Gary, Googlebot découvrira et suivra les liens tant qu'une page contient encore des liens vers celle-ci.

Ceux-ci ne sont pas nécessairement contradictoires. Mais si vous vous fiez à la déclaration de Gary, il pourrait s'écouler beaucoup de temps avant que Google arrête d'explorer et de compter les liens, peut-être jamais.

Pouvez-vous toujours vérifier votre PageRank ?

Il n'y a actuellement aucun moyen de voir le PageRank de Google.

Classement des URL (UR) est une bonne métrique de remplacement pour PageRank car elle a beaucoup en commun avec la formule PageRank. Il montre la force du profil de lien d'une page sur une échelle de 100 points. Plus le nombre est grand, plus le profil de lien est fort.

Capture d'écran montrant le score UR de l'aperçu Ahrefs 2.0

PageRank et UR tiennent compte des liens internes et externes lors du calcul. De nombreuses autres mesures de force utilisées dans l'industrie ignorent complètement les liens internes. Je dirais que les constructeurs de liens devraient s'intéresser davantage à UR qu'à des mesures telles que DR, qui ne tiennent compte que des liens provenant d'autres sites.

Cependant, ce n'est pas exactement la même chose. UR ignore la valeur de certains liens et ne compte pas les liens nofollow. Nous ne savons pas exactement quels liens Google ignore et ne savons pas quels liens les utilisateurs peuvent avoir désavoués, ce qui aura un impact sur le calcul du PageRank de Google. Nous pouvons également prendre des décisions différentes sur la façon dont nous traitons certains des signaux de canonisation comme les éléments de lien canoniques et les redirections.

Notre conseil est donc de l'utiliser, mais sachez que ce n'est peut-être pas exactement comme le système de Google.

Nous avons également Évaluation de la page (PR) in Audit de site Explorateur de pages. Ceci est similaire à un calcul de PageRank interne et peut être utile pour voir quelles sont les pages les plus fortes de votre site en fonction de votre structure de liens internes.

Évaluation des pages dans l'audit de site d'Ahrefs

Comment améliorer votre PageRank

Puisque le PageRank est basé sur des liens, pour augmenter votre PageRank, vous avez besoin de meilleurs liens. Regardons vos options.

Rediriger les pages cassées

La redirection d'anciennes pages de votre site vers de nouvelles pages pertinentes peut aider à récupérer et à consolider des signaux comme le PageRank. Les sites Web changent avec le temps et les gens ne semblent pas aimer mettre en œuvre des redirections appropriées. C'est peut-être la victoire la plus simple, car ces liens pointent déjà vers vous mais ne comptent pas pour vous actuellement.

Voici comment trouver ces opportunités :

Je trie généralement cela par "Domaines référents".

Meilleur rapport par liens filtré sur le code d'état 404 pour afficher les pages que vous voudrez peut-être rediriger

Prenez ces pages et redirigez-les vers les pages actuelles de votre site. Si vous ne savez pas exactement où ils vont ou si vous n'avez pas le temps, j'ai un script de redirection automatique cela peut aider. Il examine l'ancien contenu de archive.org et le met en correspondance avec le contenu actuel le plus proche de votre site. C'est là que vous souhaitez probablement rediriger les pages.

Les backlinks ne sont pas toujours sous votre contrôle. Les gens peuvent créer un lien vers n'importe quelle page de votre site de leur choix et ils peuvent utiliser le texte d'ancrage de leur choix.

Les liens internes sont différents. Vous avez un contrôle total sur eux.

Lien interne là où cela a du sens. Par exemple, vous voudrez peut-être créer des liens vers des pages qui sont plus importantes pour vous.

Nous avons un outil à l'intérieur Audit du site appelé Opportunités de liens internes qui vous aide à localiser rapidement ces opportunités. 

Cet outil fonctionne en recherchant les mentions de mots-clés pour lesquels vous êtes déjà classé sur votre site. Ensuite, il les propose comme opportunités de liens internes contextuels.

Par exemple, l'outil affiche une mention de "navigation à facettes" dans notre guide pour duplicate content. Comme Site Audit le sait, nous avons une page sur navigation à facettes, il suggère que nous ajoutions un lien interne à cette page.

Exemple d'opportunité de lien interne

Vous pouvez également obtenir plus de liens d'autres sites vers le vôtre pour augmenter votre PageRank. Nous avons déjà beaucoup de guides sur la création de liens. Certains de mes favoris sont :

Réflexions finales

Même si le PageRank a changé, nous savons que Google l'utilise toujours. Nous ne connaissons peut-être pas tous les détails ou tout ce qui est impliqué, mais il est toujours facile de voir l'impact des liens.

De plus, Google n'arrive pas à s'empêcher d'utiliser des liens et PageRank. Il a déjà expérimenté le fait de ne pas utiliser de liens dans son algorithme et a décidé de ne pas le faire.

Nous n'avons donc pas une version comme celle-là qui est exposée au public mais nous avons nos propres expériences comme ça en interne et la qualité semble bien pire. Il s'avère que les backlinks, même s'il y a du bruit et certainement beaucoup de spam, sont pour la plupart toujours une très grande victoire en termes de qualité des résultats de recherche.

Nous avons joué avec l'idée de désactiver la pertinence des backlinks et au moins pour l'instant, la pertinence des backlinks aide toujours vraiment à s'assurer que nous obtenons l'ensemble de résultats de recherche le meilleur, le plus pertinent et le plus actuel.

La source: YouTube (Centre de recherche Google)

Source à partir de Ahrefs

Avis de non-responsabilité : les informations énoncées ci-dessus sont fournies par Ahrefs indépendamment d'Alibaba.com. Alibaba.com ne fait aucune représentation et garantie quant à la qualité et à la fiabilité du vendeur et des produits.

Cet article a-t-il été utile?

A propos de l'auteur

Laisser un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *

Remonter en haut