L'algorithme du PageRank Google
S'il y a bien un facteur pris en compte par Google dans
l'élaboration de son classement qui a fait couler beaucoup d'encre, il
s'agit indubitablement du PageRank ! Certes il existe déjà de
nombreuses définitions données sur différents sites spécialisés mais un
article de l'excellent Danny Sullivan publié en Avril 2007 a
particulièrement retenu mon attention.
Son billet a le mérite d'être fort complet et c'est surtout son
approche très pédagogique qui fait la différence avec les articles déjà
publiés sur le PageRank. Les référenceurs chevronnés n'apprendront certainement rien
mais envoyer ses clients curieux vers cet article peut être une manière
efficace pour faire découvrir et comprendre une partie du
fonctionnement de l'algorithme de Google.
J'ai ajouté un complément à la fin de la traduction (réalisée par
Shannon Delorme) afin de centraliser sur une même page un maximum
d'informations. J'ai également supprimé quelques phrases et mis des
passages en exergue pour vous faciliter la lecture. Je laisse donc
maintenant la parole à Danny Sullivan.
Qu'est ce que le PageRank ? Une guide pour les chercheurs et les webmasters
A plusieurs reprises ces derniers mois j'ai écrit des articles
portant sur des nouvelles fonctions de Google, certaines concernaient
le PageRank. Malheureusement, Google lui-même offre très peu d'informations sur le PageRank
qui pourraient aider ceux que cela intéresse. Pour pallier à ce manque
voici un guide du PageRank, conçu pour aider à la fois les utilisateurs
mais aussi les webmasters.
Cet article est relativement long. Afin de vous aider voici une
liste des différentes sections les plus importantes, auxquelles vous
pouvez accédez directement si vous le souhaitez en cliquant sur les
liens ci-dessous :
- La définition donnée par Google : PageRank comme un système de votes
- Des modifications récentes de Google soulignent que le PageRank n'est qu'un seul facteur parmi d'autres
- Le PageRank pour les utilisateurs : la barre d'outils Google
- PR signifie PageRank, et non relations publiques
- Le PageRank dans l'annuaire Google
- Le PageRank pour les référenceurs
- Voir le PageRank dans les résultats de recherche
- Le PageRank contre le PageRank de la Google barre
- Vocabulaire technique du PageRank
- Conclusion (surtout pour ceux qui se diront qu'ils n'auront pas le temps de tout lire)
La définition donnée par Google : Le PageRank comme un système de votes
Commençons par ce que dit Google. En bref, il considère que les liens sont comme des votes. D'autre part, il considère que certains votes ont plus de poids que d'autres.
Le PageRank est donc le système employé par Google pour compter les
votes et déterminer quelles pages sont plus importantes en fonction de
ces votes.
Ce score est ensuite utilisé en conjonction avec beaucoup d'autres
éléments pour déterminer si une page sera bien classée lors d'une
recherche.
Vous n'aimez pas la paraphrase ? Pas de problème. Lorsque Google
parle de PageRank sur son site, il donne souvent un lien vers la page
de Google Technology, où l'on peut lire :
Au coeur de nos logiciels se trouve PageRank, un système qui
permet d'établir un classement des pages web, élaboré par nos
fondateurs Larry Page et Sergey Brin de l'université de Stanford. Et
bien que nous ayons des douzaines d'ingénieurs dont la tâche
quotidienne est d'améliorer chaque aspect de Google, PageRank joue
toujours un rôle central dans le fonctionnement d'un grand nombre de
nos outils de recherche.
Explication de PR :
Le fonctionnement de PageRank repose sur la nature fondamentalement
démocratique du web, en se servant de la vaste structure de liens qu'il
représente comme un indicateur de la valeur de chaque page
individuelle. En bref, Google interprète un lien d'une page A vers une
page B comme un vote de la part de la page A en faveur de la page B.
Mais Google prend bien plus de choses en compte que le seul volume
de votes, ou liens, qu'une page reçoit. Par exemple, il analyse aussi
la page qui émet le vote. Les votes donnés par des pages qui
elles-mêmes sont "importantes" permettent à Google d'émettre un
jugement sur l'importance relative de chaque page.
Des sites importants, de bonne qualité, reçoivent un PageRank. Bien sur, des pages "importantes" ne veulent rien dire pour vous si elles ne correspondent pas à votre recherche.
plus élevé que Google enregistre à chaque fois qu'il effectue une
recherche
C'est pour cela que Google conjugue PageRank avec des techniques
sophistiquées d'analyses lexicales afin de trouver les pages qui seront
à la fois importantes et pertinentes par rapport à votre recherche
spécifique. Google ne se contente pas de compter le nombre de fois
qu'un terme figure sur une page, il examine tous les douzaines d'aspects
du contenu de la page (et de celles qui ont des liens vers elle) pour
pouvoir déterminer si oui ou non il s'agit d'un résultat adéquat par
rapport à votre recherche.
Des modifications récentes de Google soulignent que le PageRank n'est qu'un facteur parmi bien d'autres
Pourquoi les caractères gras et le texte rayé ? vous-demandez vous.
Entre le moment où j'ai commencé cet article et le jour de sa mise en
ligne, j'ai remarqué que cette page fondamentale de Google a été mise à
jour pour la première fois depuis des années. Ce qui est en gras montre
ce qui a été ajouté lors de la mise à jour, le texte rayé montre ce qui
a été supprimé.
Une autre référence fondamentale à propos de PageRank avait été mise à jour sur la page Corporate Philosophy de Google.
Google fonctionne parce qu'il s'appuie sur les millions d'individus
qui publient des livres sur des sites web, afin d'aider à déterminer
quels autres sites proposent un contenu de valeur. Google évalue
l'importance de chaque page web employant des techniques variées, dont
son très connu algorithme PageRank qui analyse quels sites ont été élus
"meilleures sources d'information" par d'autres pages aux quatre coins
du web.
Au lieu de dépendre d'un seul groupe d'éditeurs ou sur la
simple fréquence d'utilisation de certains termes, Google classe chaque
page à l'aide d'une technique révolutionnaire nommée PageRank. PageRank
évalue tous les sites qui créent des liens vers une page web
particulière et leur attribue une valeur, basée en partie sur les sites
qui l'ont indexée. En analysant la structure globale du web, Google est
capable de déterminer quels sites ont été "élus" la meilleure source
d'information par les pages les plus intéressées par cette information
en question.
Cette technique s'améliore avec l'extension du net, puisque chaque
nouveau site est un point d'information supplémentaire, un autre vote.
Ces changements sont intéressants. Ce que Google semble être
en train de faire, c'est nuancer l'importance de PageRank en soulignant
que ce n'est pas le seul facteur dans la classification des pages. C'est un très bon point, car comme je le montrerai, trop de gens se sont attachés au PageRank pendant trop longtemps.
PageRank pour les utilisateurs : la barre d'outils Google
Commençons par étudier la manière dont PageRank est utilisée par Google pour les utilisateurs. En tout premier lieu, ce n'est qu'un facteur parmi d'autres employés pour classer les pages web.
Le PageRank n'apparaît pas lors des recherches (du moins la plupart du
temps. Plus loin j'expliquerai comment il est en fait possible de le
voir.)
Mais dans les coulisses, il aide en partie à décider si oui ou non telle ou telle page va faire partie des résultats affichés.
La plupart des utilisateurs prennent connaissance du PageRank à
travers la barre d'outils Google. Cette barre d'outils possède un
"indicateur du PageRank" dont Google lui-même n'explique pas
entièrement le fonctionnement sur ses fichiers d'assistance en ligne.
A titre d'exemple, lorsque j'écrivais mon article intitulé L'Histoire du Search de Google prend de l'envergure, devient une Histoire du Web
la semaine dernière, j'ai consacré du temps à passer en revue les
fichiers d'aide de la barre d'outils Google pour trouver une bonne
explication sur l'indicateur du PageRank vers laquelle créer un lien
pour mon article. Ceci fut ma seule trouvaille, ainsi qu'une courte note explicative :
"Vous vous demandez si un nouveau site web mérite que vous y
consacriez du temps ? Utilisez la fonction "PageRank display" sur la
barre d'outils pour savoir quelle évaluation Google accorde à la page
que vous visionnez".
Voici comment cela fonctionne. Si vous avez installé la barre
d'outils Google, vous avez PEUT-ETRE aussi installé le compteur
PageRank. Si c'est bien le cas, vous le trouverez en haut de votre page
comme le montre l'exemple ci dessous :
Voyez cette longue barre verte ? Il s'agit du compteur de PageRank.
Si vous promenez votre curseur dessus, il vous affichera le PageRank de
la page que vous êtes en train de visiter, comme ceci :
Pas mal ! La page d'accueil Google a un pagerank de 10 !
Voir cette partie : (10/10)
Google vous donne tout d'abord le score de la page sur laquelle vous
vous trouvez (10) et la valeur maximale qu'une page peut avoir : (10).
Google est parfait !
Il est plus utile de voir affichés ces deux numéros lorsque vous vous
trouvez sur des pages moins parfaites. Voici par exemple Search Engine Land :
Voyez, nous avons obtenu un score de 7/10 ! Nous avons un PageRank
de 7 points sur dix points possibles. Pas encore parfait, donc. Snif
snif. Pas grave. C'est un très bon score pour la page d'accueil d'un
site qui n'a que quatre mois.
Remarquez la manière dont la barre n'est pas entièrement verte,
contrairement à la page Google ? Pareille à un thermomètre, elle n'est
que partiellement remplie, à 7 dixièmes, pour représenter visuellement
le PageRank.
Voici une autre page:
Aïe, zero ! Cette page est lamentable ! En fait pas vraiment, pour
cet exemple j'ai délibérément essayé de trouver une page qui n'existe
plus sur Search Engine Land. Cela m'a donc donné une erreur. Puisque la
page n'existe pas, Google n'a pas de score PageRank à afficher. C'est
pourquoi vous obtenez un score de 0/10. Observez bien que le compteur
PageRank n'est pas vert du tout, puisqu'il n'y a aucun PageRank pour la
page.
Beaucoup d'utilisateurs n'ont peut-être jamais vu une barre de PageRank.
Cela s'explique par le fait que jusqu'à la semaine dernière, il n'était
par défaut jamais activé. Il fallait l'allumer manuellement, et ceux
qui le faisaient étaient généralement les personnes qui s'intéressent
au référencement.
(Postscriptum: A la lecture de ceci, Matt Cutts de
chez Google, a fait ce commentaire: "Beaucoup d'utilisateurs normaux
font le choix d'avoir le PageRank d'affiché. Je crois que le nombre
d'utilisateurs normaux qui choisissent d'afficher le PageRank est
beaucoup plus élevé que le nombre de référenceurs actifs.")
L'Histoire du Search de Google prend de l'envergure, devient une Histoire du Web
explique les raisons pour lesquelles il y aura bientôt de plus en plus
d'utilisateurs qui verront le PageRank. Et cela parce que dans certains
cas la barre d'outils Google sera téléchargée avec l'option activée
d'avance. Dans d'autres cas Google nous encouragera à activer
l'indicateur. Lisez la suite de mon article pour en savoir plus.
Votre indicateur de PageRank n'est pas activé et vous voudriez que
ce soit le cas ? Convaincu par les aspects de sécurité et de
confidentialité exposé dans cet article (et expliqués par les propres mots de Google)
? Cliquez sur le bouton de paramètres dans la barre d'outils, puis sur
options, puis "More Tab", ensuite allez dans "Even more buttons" et
sélectionnez le bouton "PageRank and Page info". Maintenant le compteur
est activé.
PR signifie PageRank, et non Relations Publiques !
A propos de référenceurs, ce sont eux qui ont créé l'acronyme que vous rencontrerez certainement de temps à autre : PR, pour PageRank.
Par exemple, la page d'accueil de Google qui était évaluée à 10/10 serait contractée en PR 10. Search Engine Land avec 7/10 deviendrait PR 7. La page d'erreur ? PR 0.
Le PageRank dans l'annuaire Google
Saviez-vous qu'il existe un espace sur Google où les pages web sont
répertoriées grâce au travail de sélection d'éditeurs humains et non
suite au ratissage du web par Google ? C'est l'annuaire Google, qui repose sur le travail d'éditeurs participant au projet Open Directory.
Lorsque Google a ajouté l'information de l'Open Directory à son site
web en Mars 2000, la différence principale était que cette édition-là
(de l'annuaire Google) organisait les listes de sites en fonction du
PageRank.
Par exemple, comparez la catégorie de blogs dédié au search sur Google, avec celui sur Dmoz :
Il s'agit des deux mêmes catégories, exactement, celle de Google à
gauche, celle du Open Directory à droite. Elles devraient être
pratiquement identiques mais ce n'est pas le cas, pour deux raisons
fondamentales.
Tout d'abord, Google est très dépassé. Comme vous pouvez les voir,
l' Open Directory montre bien plus de résultats que ne le fait Google.
Cela fait sans doute des mois que Google n'a pas pris la peine de
mettre à jour ses listes sur celles de l'Open Directory. Ce n'est pas
étonnant... Autrefois c'était un élément principal de Google,
aujourd'hui cela n'est pas une priorité.
En plus de cela, le répertoire Google a été relégué à la page "Plus de Produits Google"
en mars 2004. Ce n'est pas un élément prioritaire. De plus, l'Open
Directory lui aussi à plusieurs reprises a été hors service ou n'a pas
produit de nouvelles informations.
L'autre différence fondamentale réside dans le fait que les listes
de Google sont organisées par PageRank. Voyez comment sous la barre
"pages web" du répertoire Google il y a une icône PageRank à côté de
chaque site ? Pour les référenceurs, cela indique l'important du
PageRank. Comme cela est expliqué sur les pages d'aide de l'annuaire Google :
Les barres vertes d'évaluation montrent l'importance
montrent l'évaluation que fait Google de l'importance d'une page web,
d'après la définition d'importance donnée par la technologie du
PageRank ainsi que d'autres facteurs. Ces barres "PageRank" vous
signalent au premier coup d'oeil si d'autres personnes sur le web Google considère une page comme étant d'une bonne qualité et donc digne d'être visitée.
Google lui-même n'évalue ni ne recommande aucun site web. Nous
mesurons l'intérêt accordé par les autres gens sur le web à tel ou tel
site qu'ils jugent assez important pour recevoir un lien. Et puisque
Google n'accepte aucun paiement de la part de sites web pour établir le
classement, les informations qui s'affichent lorsque vous faites une
recherche sont entièrement objectives.
Google considère une page comme étant d'une bonne qualité et donc digne d'être visitée. Google.
lui-même n'évalue ni ne recommande aucun site web. Nous mesurons
l'intérêt accordé par les autres gens sur le web à tel ou tel site
qu'ils jugent assez important pour recevoir un lien. Et puisque Google
n'accepte aucun payement de la part de sites web pour établir le
classement, les informations qui s'affichent lorsque vous faites une
recherche sont entièrement objectives
(Comme pour les autres rubriques d'aide en ligne, j'ai remarqué que
ces informations sur le PageRank de l'annuaire Google ont récemment été
mises à jour, donc comme précédemment, les caractères gras montrent les
nouvelles précisions, et ce qui est rayé révèle ce que Google a
supprimé).
Le PageRank pour les référenceurs
J'ai abordé les deux façons dont les utilisateurs peuvent voir
PageRank, et j'ai indiqué qu'en coulisses il fait partie des multiples
facteurs qui entrent en jeu dans le classement/ référencement de pages
web. La manière dont les pages sont classées et bien évidemment d'un
intérêt majeur pour les référenceurs.
Malheureusement, et c'est vraiment déplorable, bien trop de
référenceurs se sont focalisés sur le PageRank lorsqu'il est apparu
tout d'abord dans l'annuaire Google et ensuite dans la barre d'outils
Google en décembre 2000. Ils se sont uniquement préoccupés
d'obtenir des liens de sites web avec un score PageRank élevé, sans se
rendre compte que ce facteur seul ne suffisait pas.
Voici ce que j'ai répondu en 2002 :
La question des liens et des moteurs de recherche, et plus
particulièrement la manière dont les gens perçoivent le traitement des
liens par Google devient de plus en plus mal abordée. De
nombreux utilisateurs ont perdu de vue la signification initiale des
liens à force de trop vouloir attirer l'attention de Google.
Tous les moteurs de recherche basés sur le système de "crawler"
récoltent des liens sur tout le web, mais aucun d'entre eux ne
produisent un score d'"importance" fixe comme le fait Google par le
biais de sa barre d'outils. Ce score, tout en représentant une grande
ressource pour les utilisateurs, donne dans le même temps un des
aperçus les plus utiles de la manière dont Google référence les sites
web.
Certains webmasters, qui tentent désespérément d'être classés par
Google, se cognent obstinément à cette fenêtre comme des oiseaux
désorientés...
Les propriétaires de sites web utilisent la barre d'outils afin de
trouver de "bons" sites dont ils essaient ensuite de recevoir des
liens, sans prêter assez d'attention au contexte du lien, et sans
parler des nombreux autres facteurs utilisés par Google pour classer
une page. D'autres webmasters qui voient leur barre de PageRank grisée
avec un score PR0, pensent immédiatement au pire et s'imaginent qu'il
ont été blacklistés.
Assez, par pitié, assez ! Oubliez ce compteur sur la barre d'outils
Google. Arrêtez de vous demander si ce site est un "bon" site ou un
"mauvais" site d'après Google. En bref, oubliez Google lorsqu'il s'agit de construire des liens.
Le PageRank n'est autre que le score attribué à une page selon l'estimation de Google
(d'ailleurs, cette estimation d'importance est considérée comme une
"opinion" de Google, et par conséquent se trouve protégée aux USA par
le 1er amendement de la constitution américaine. Lorsque Google a été
poursuivi en justice pour avoir changé le PageRank de certaines pages,
une cour de justice américaine a prononcé ce verdict :
"PageRanks sont des opinions, des opinions sur l'importance de
pages web spécifiques en rapport avec une recherche donnée, la cour en
conclut que les valeurs du PageRank de Google sont pleinement sous la
protection de la constitution.)
Il est vrai que si vous recevez un lien vers votre site de la part d'un site à fort PR, une partie de ce PR
sera transmise à votre page. Mais cela ne prend pas en compte le
contexte du lien, c'est-à-dire les mots contenus dans le lien (l'ancre
du lien).
En voici un aperçu rapide. Admettons que vous êtes Nike et que vous
voulez être répertorié pour le mot "chaussures". Des centaines de pages
PR9 vont créer des liens vers vous en utilisant juste ce mot ci :
Parfait ! Toutes ces pages vont vous transmettre du PageRank à gogo
! Votre site sera considéré comme important ! Mais important dans quel
domaine ? Pour pouvoir le déterminer, Google va regarder les mots
présents dans le lien lui-même. Le mot en question ici étant "Nike,"
c'est l'idéal, Nike est répertorié sous la rubrique de son propre nom !
Maintenant admettons que vous soyez Zappos. N'étant pas aussi connu
que Nike, vous ne recevez pas de liens d'autant de sites PR9. Ce sont
plutôt des sites classés PR4, PR5 et PR6 qui vous indexent. Voici
comment ils créent un lien vers vous :
Ces liens sont moins importants, il est vrai. Mais ils comptent néanmoins, car ils ont tout de même un certain poids. De plus, ce qu'ils disent, c'est-à-dire la pertinence des mots clés employés, est d'une utilité fondamentale.
En gros ils vous distinguent tout en employant le mot "chaussures" dans
le lien, c'est en fait même plus utile que les liens dont bénéficie
Nike sans mention des chaussures.
Vous ne me croyez pas sur parole ?
Google Declares Stephen Colbert As Greatest Living American est un article qui explique comment les ancres des liens vers Colbert Nation
(et non les scores PageRank de ces liens) ont récemment permis de
hisser le site dans les résultats de recherche pour "greatest living
american," alors que Google Kills Bush's Miserable Failure Search & Other Google Bombs et George W. Bush: A Failure Once Again
expliquent comment les mots utilisés ont des répercussions sur la
manière dont George Bush produit des résultats tels que "miserable
failure" (échec lamentable).
Voir le PageRank dans les résultats de recherche
Vous ne me croyez toujours pas lorsque je dis que le PageRank n'est
pas le critère le plus important pour être bien classé sur Google ?
Voici comment je le démontre depuis des années.
Effectuez une recherche, puis voyez s'il y a des résultats classés
plus bas que les dix premiers qui ont des PageRank supérieurs à
certains des sites classés en première page. Si c'est le cas (et c'est
bien le cas), cela montre bien que le PageRank n'est pas le facteur le
plus important.
Illustrons-le. Voici une recherche pour le mot "films":
Voyez vous comment tous les résultats de recherche sont accompagnés
d'un indicateur de PageRank ? Pour obtenir cela j'ai utilisé l'outil PageRank Search sur SEO Chat.
Observez la manière dont Movies.com, le 1er résultat affiché,
possède un score de PR8 alors que l'Internet Movie Database a un PR9 ? La page avec un PageRank inférieur a tout de même obtenu un meilleur rang dans les résultats de recherche.
Vous aimeriez que ces scores soient visibles dans vos résultats de
recherche ? Google ne donne pas le choix aux utilisateurs, il n'est pas
possible de les voir. Cela vous paraît étrange ? C'est pourtant logique
et contribue d'ailleurs à prouver mon argument central.
Le PageRank n'est qu'un seul parmi de nombreux facteurs qui
permettent de classer les résultats de recherche. Mettre en valeur le
PageRank sur la page de résultats n'aide pas l'utilisateur, et cela
parce que Google utilise un autre système pour indiquer quelles sont
les pages les plus importantes par rapport à la recherche particulière
que vous venez d'effectuer. Il les classe par ordre d'importance.
Cela ne servirait qu'à embrouiller les gens si le PageRank était
également visible. Certains utilisateurs risqueraient de ne pas
comprendre pourquoi des pages avec des scores plus élevés sont moins
bien classées que d'autres.
Par contraste, si vous regardez une seule page, comme c'est le cas
parfois lorsque vous surfez sur le web, vous n'êtes plus tant
intéressés par le classement de la page dans la liste de résultats de
recherche, que par son score PR pour vous faire un ordre d'idée de son
importance ou de sa réputation.
C'est là que le PageRank entre en jeu et son utilisation prend alors tout son sens.
Bien évidemment, les référenceurs et certains autres
utilisateurs voudraient peut-être voir le PageRank dans les pages de
résultats. L'outil utilisé ci-dessous n'est qu'un exemple
parmi d'autres d'outils vous permettant d'afficher le PR. Pour un outil
basé sur votre navigateur, essayez par exemple SEO For Firefox de SEO Book.
Le PageRank contre le PageRank de la Google barre
Le PageRank que vous pouvez voir ? Il est souvent appelé le page de
la Google Barre. Celui-ci est à distinguer de ce que l'on appelle
PageRank "interne".
Le PageRank interne est le score que Google utilise dans son
algorithme de classement. Ces scores sont constamment en train d'être
mis à jour. Contrairement à cela, le PageRank que Google montre
publiquement, via la Google Barre donc, est une capture d'écran du
PageRank interne réalisé tous les quelques mois.
Qu'est-il important de noter ici ? Si vous êtes un nouveau site, vous avez toutes les chances d'avoir un PR quasi nul dans la barre d'outils Google.
Cela risque de vous embêter, même si cela affectera surtout la
fréquence avec laquelle les robots de Google vous crawleront (plus
votre score PR est élevé, plus Google viendra visiter fréquemment votre
site).
Bien sûr cela affecte aussi en partie votre performance pour le positionnement.
Il est probable qu'après plusieurs semaines vous aurez gagné du
PageRank interne. Le résultat visible en sera sans doute que vous
constaterez plus de passage/traffic sur votre page. Mais d'apparence,
le score très bas de PR sur la Google Barre n'aura pas changé. Puis une
mise à jour (NDT :
appelée Export) de ce score sera effectué, et soudain il reflètera un
meilleur PR, et ce qui se passait en coulisses sans être reflété par
l'indicateur de la Google Barre.
L'article More info on PageRank écrit par Matt Cutts de chez Google explique tout ceci plus en détails, et développe d'autres aspects de PageRank.
Vocabulaire technique pour le PageRank
PageRank tient son nom du co-fondateur de Google Larry Page. Vous
pouvez trouver l'explication du système initiale de classement pour
calculer le PageRank ici, si vous le souhaitez. Pendant que vous y êtes, jetez un coup d'oeil à l'article sur comment fonctionnait Google ici.
Mais pour ce qui est de disséquer le fonctionnement contemporain de
Google, ces documents datant de 1998 et de 2000 ne vous aideront pas
beaucoup. Toutefois ils sont intéressants pour le fait même qu'ils ont
été tant lus, analysés, et malheureusement hélés comme la bible pour
comprendre le fonctionnement actuel de Google.
Si vous vous sentez toujours obligés de rechercher plus d'éléments
sur le PageRank, du moins pour comprendre son ancien fonctionnement,
allez donc lire l'article d'autorité de longue date de Phil Craven,
intitulé Google's PageRank Explained ainsi que celui par Ian Rogers, The Google Pagerank Algorithm and How It Works.
Naturellement, Wikipedia propose un article sur le PageRank
avec d'autres éléments qui vous intéresseront sans doute. Il traite
aussi la manière dont certains sites qui utilisent des redirections
peuvent simuler un PR plus élevé que celui qu'ils possèdent en réalité.
Et puisque nous parlons de ces aspects techniques, il faudrait préciser
que le PageRank ne fonctionne pas réellement sur une échelle de 0 à 10.
En coulisses les scores "internes" sont beaucoup plus
complexes, mais sont simplifiés pour pouvoir être affichés de 1 à 10
dans le PR visible.
L'article How does Google collect and rank results ?
écrit par Matt Cuttack pour la "Google Librairie Central" est un autre
texte intéressant sur les principes basiques dont Google se sert pour
classer des pages, et dont le PageRank n'en est qu'un parmi d'autres.
Conclusion (surtout pour ceux qui se diront qu'ils n'ont pas le temps de tout lire)
Je pourrais en dire beaucoup plus sur PageRank, mais j'espère vous
avoir présenté au moins une introduction claire. Voici les éléments
clefs dont il faut se souvenir :
- Le PageRank vous donne l'importance d'une page, relativement et comparativement à d'autres pages.
- Le PageRank n'est qu'un seul facteur parmi PLUSIEURS autres pour déterminer le classement des résultats de recherche.
- Un PageRank élevé ne garantit EN RIEN un classement élevé dans les
résultats de recherche pour un terme précis. Si c'était le cas, des
sites PR10 comme Adobe apparaîtraient en haut du classement lors de
n'importe quelle recherche. Or, ce n'est pas le cas. - Le texte d'un lien hypertexte est souvent plus important en
lui-même que si oui on non il se trouve sur une page ayant un PR élevé. - Si vous souhaitez vraiment savoir quelles sont les pages les plus
importantes et pertinentes pour en obtenir des liens, ne comptez pas
sur le PageRank. Recherchez les mots pour lesquels vous
voudriez être répertoriés. Voyez quelles sont les pages qui
apparaissent en haut de la liste de résultats sur Google. Ce sont les
pages les plus utiles pour vous. Et cela parce que Google est
effectivement en train de vous dire que pour le sujet que vous avez
spécifiquement entré, ces pages sont les meilleures.
Fin de la traduction
En complément de ce billet, je tenais à vous proposer deux images
très parlantes. La première illustre la difficulté exponentielle
d'obtenir un point de PageRank supplémentaire lorsque son site est déjà
populaire. A titre indicatif, il est toujours intéressant de se
rappeler que le domaine Google.fr ne possède même pas un PageRank de
10...
La seconde illustre la transmission de popularité en fonction du nombre et de la valeur des liens :