Les indispensables mathématiques et physiques

Une application intéressante des mathématiques : les algorithmes de « page ranking » (classement des pages) des moteurs de recherche comme Google. Si l’on cherche à attribuer un classement Xj à une page j, on s’intéresse aux pages i « pointant » vers j : Xj va être une somme des « points » Vij qui sont accordés à j par chacune des pages i, Xj = ∑i Vij, sachant que :

1) plus la page i qui pointe vers j a elle-même un rang élevé, plus le rang de j est élevé : en gros, Vij est proportionnel à Xi. Il est intéressant d’être référencé par des pages qui sont-elles mêmes bien classées.

2) Inversement, plus la page i possède de liens vers d’autres pages, plus l’intérêt qu’elle porte à la page j est dilué : Vij est inversement proportionnel au nombre Ni de pages pointées par i.

Proportionnalité à Xi, proportionnalité inverse à Ni, on peut donc écrire de manière approximative : Xj =∑i Xi/Ni.

 

 

Or, le moteur de recherche est capable de connaître le Ni, nombre de liens sur chaque page (pointant vers j). Les Ni sont les paramètres, les Xi les inconnues. Un algorithme de page ranking revient, grossièrement, à trouver la solution d'une équation matricielle comme :

X = M X, où M est la matrice des coefficients 1/Ni.

 

Comme on se l'imagine, la résolution est plus compliquée, faisant intervenir le théorème de Perron-Frobenius sur les éléments propres de certaines matrices, et les chaînes de Markov : mais poser le problème ainsi me paraissait intéressant, comme application des mathématiques dans la vie quotidienne.

 

(merci à Jacques Bair et à son article dans le magazine TangenteSup de septembre-octobre de nous avoir mis sur cette piste)
Mar 4 nov 2008 3 commentaires
article interessant, je vais étudier ca de plus près... ');">
Dav!D - le 04/11/2008 à 19h17
Cela ne supposerai-t-il pas un caractère statique au web en termes de pages (pas de naissances, pas de mort)?

De plus je pense qu'il a des freins (à la hausse et à la baisse) pour simuler une continuité dans l'évolution du ranking, c'est à dire qu'intervient (pour moi) en paramètre (pondéré comment?) l'ancien ranking (avant calcul) du site dont on cherche le ranking.

Autre souci amusant : l'inflation du ranking....

On s'amuse aussi beaucoup avec le classement ELO...
wouf - le 04/11/2008 à 23h20
Ce n'est pas statique, si le calcul est refait régulièrement (3-4 fois par an comme ceci semble être le cas?). Sur le second point, oui, l'ancien PR intervient, je n'ai exposé qu'ue partie de la méthode, simplement pour faire comprendre ce mécanisme matriciel. A.M.
Alexandre Moatti
L'autre grande force du pagerank (càd l'utilisation des retrolien pour trouvé les pages qui nous interesse le plus) est d'affiné la "sémantique" : il arrive lors d'une recherche, que la page qui nous interesse ne contienne pas les mots recherché, parce que notre requête est une "abréviation" en peu de mot de l'information qui nous interesse. Sur le site lui même cette abréviation peut être absente, mais il y a de bonne chance de la trouvé dans les noms de liens qui mène vers cette page.
Léo - le 27/11/2008 à 13h15