Google a dix ans ! La société aujourd'hui célèbre a en effet été fondée le 27 septembre 1998 par Larry Page et Sergey Brin. Ces deux étudiants de Stanford travaillaient au paravent sur une projet de recherche sur les moteurs de recherche baptisé BackRub. Ils ont imaginé une innovation majeure par rapport au moteur de l'époque : l'analyse des relations entre les sites Internet indexés par le robot.
Rappelons le fonctionnement d'un moteur de recherche :
1 - un robot ou crawler scrute le web pour visiter des pages Internet ; Il passe de page en page en suivant les liens hypertextes. Lorsqu'il arrive sur une page, il "comprend" de quoi elle parle. Pour ce faire il visite les balise META dans le code source de la page. A cet endroit le webmaster de la page concernée a notamment placé des mots-clés, une description et un titre. Pour confirmer que les mots employés dans ces balises sont en rapport avec la page, le robot scrute intégralement la page en analysant les noms des images, vidéos et autres animations, le nom des pages, les commentaires et bien sur le texte écrit sur la page. Une fois la page ainsi analysée, elle est alors associée à des mots clés ; Il s'agit des mots les plus récurrents dans la page au différents endroits précédemment cités. La page et les mots clés associés viennent remplir un index appartenant au moteur de recherche.
2 - un requêteur, l'outil visible en ligne sur la page d'un moteur, permet d'interroger l'index et donc de ressortir toutes les pages associées à un mot-clé. Le mot saisi dans la cartouche d'un moteur se retrouve forcément dans la page trouvée mais pas forcement dans la partie visible. Le mot peut en effet figurer dans les balises META, les commentaires, les noms des images, etc. Il se peut aussi que la page est changé entre le moment où le robot l'a visitée et le moment où vous la lisez. En effet il y a toujours un décalage avec un moteur de recherche causé par le fait que l'indexation ne se fait pas en temps réel mais en deux étapes comme décrit au dessus.
Alors qu'elle est l'innovation apportée par Larry Page et Sergey Brin ?
Ils ont décidé de classer les résultats par popularité. Mais comme la popularité d'une page web est rarement connue, ils ont choisi de l'estimer. Le mode de calcul retenu a été de mesurer la quantité de liens hypertextes pointant vers une page mais aussi la qualité de ces liens. Ainsi, si une page a de nombreux liens qui pointent vers elle et que ces liens sont eux mêmes bien référencés sur les mêmes mots clés, cela améliorera d'autant son propre référencement. Avec Google l'indexation devient donc un algorithme complexe qui depuis a été copié par d'autre moteur de recherche qui, à leur tour ont reprit le calcul des liens. Certains webmaster ont aussi tenté d'abuser de cette mesure d'indexation en faisant du Google bombing
Depuis la création dans un garage de la Silicon Valley, la start up a parcouru du chemin ... Dès 1999 Google supporte 3 millions de requêtes par jour. Aujourd'hui, la société est estimée à 210 milliards de dollars à la bourse de Wall Street, elle compte plus de 15 000 employés à travers le monde. Google posséderait le parc de serveurs le plus important du monde avec environ 500 000 machines réparties sur plus de 32 sites de par le monde. En 1998, Google indexait 26 millions de pages web, en 2000, un milliard, en 2008, plus de mille milliard
Pour revenir, il y a dix ans et plonger dans les archives du Web, Google nous propose de rechercher avec l'interface d'origine, et les résultats de l'époque. Si ce billet n'y figure pas, Troover et moi y sommes déjà ! Ca fait un coup de vieux de faire partie des anciens du Web !
François JEANNE-BEYLOT