En juin 2010, j’écrivais un billet intitulé « Le planétaire et le cloisonné », en référence au livre « L’Empire immobile » d’Alain Peyrefitte. Dans ce billet, j’évoquais l’entrée de Facebook dans la danse de la recherche Web, avec son bouton « Like », véritable sangsue pour siphonner le Web tout en restant à demeure.
2010 est terminée, et comme le souligne pertinemment Danny Sullivan (@dannysullivan), il est probable que, malgré les millions de boutons « Like » implantés dans les pages Web, le nombre de « Like/Recommend » ne soit pas encore suffisant pour que le graph social « aide » Microsoft Bing à personnaliser ses résultats.
Petit retour en arrière : 1995 et 1998
Aujourd’hui, la recherche Web reste encore un problème. Avec les années, ce « problème » s’est complexifié.
En 1995, alors que les internautes ne savaient pas « quoi » chercher sur le Web, la solution fut de leur proposer une sélection de sites web. Yahoo! était emblématique de cette période. L’annuaire de Yahoo! cristallisait en quelque sorte le concept de curation, avec, comme unité de choix, le site web.
L’annuaire de Yahoo! échoua dans la personnalisation, et, parce qu’il était géré par des humains, échoua aussi à suivre l’exponentielle croissance du Web. Cinq ans après l’avènement du Web commercial, la recherche Web était dans une impasse (« discovery was a mess », selon John Battelle). Pour le fondateur d’Altavista, Louis Monnier, la recherche Web était également une quadrature du cercle. Son moteur ne pouvait combattre le déluge de spams.
En 1998, Google débarque avec son algorithme PageRank et fait déjà « pivoter » la recherche Web d’une « unité de choix basée sur le site web » à une « unité de choix basée sur la page Web ». Larry Page et Sergey Brin révolutionnèrent la recherche Web et créèrent un véritable écosystème économique autour des liens sponsorisés AdWords. Merci Bill Gross au passage, l’inventeur d’Overture et des liens sponsorisés, du moteur GoTo et du logiciel Picasa ! Grâce à lui, Google arrêta de chercher son business model (cf. le livre passionnant « La révolution Google aux éditions Eyrolles).
John Battelle nous explique alors que la curation est passée en 1998 à l’échelle du Web grâce à un objet, le lien hypertexte. Le lien hypertexte fut le signal pour filtrer l’information et améliorer la recherche Web.
Google proved the thesis that if you find a strong signal (the link), and curate it at scale (the search engine), you can become the most important company in the Internet economy. With both, of course, the true currency was human attention.
De 1995 à 2010, en passant par 1998 et Google, 2004 et Facebook, 2006 et Twitter, la recherche Web n’a donc cessée d’évoluer. Les questions que l’on pose ne sont plus seulement « Quel site web peut répondre à mon intention ? » ni « quel contenu ? », mais « qui ? ». Qui suivre ? Qui est susceptible de m’apporter de la valeur et du sens ?
Au cours des dernières années, alors que nous sommes entrés dans une société de l’interaction (cf. conférence de Serge Soudoplatoff à l’Ecole Normale Supérieure), la pensée « papier » (site web + page web) a fait place à la pensée « réseau ». Le lien n’est plus un signal suffisant pour traiter le déluge d’informations et filtrer de la pertinence.
Le Web pivote encore : du site (annuaire Yahoo!) à la page (Google), l’unité de choix passe désormais sur l’individu (Twitter, Facebook, Tumblr) et son graph social.
La recherche sociale initiée par Microsoft
La firme de Redmond n’a-t-elle pas affirmé au Bing Search Summit à San Francisco en décembre 2010, par la voix de son Senior Vice President, Satya Nadella, que les annotations sociales, à l’instar des « Likes » de Facebook, seront intégrées dans les SERPs de Bing.
Les « Likes » vont donc probablement influencer le ranking (positionnement) tout en personnalisant les résultats.
« La recherche sociale va modifier en profondeur le processus de découverte de l’information. Nous n’en sommes qu’au début … seulement, elle sera aussi fondamentale que fût l’ancre de texte et le linking pour la recherche Web classique (initiée par Google en 1998 avec le PageRank) ».
D’ailleurs, toujours selon Satya Nadella, les annotations sociales génèrent d’ailleurs plus de clics sous le fold des SERPs (parce qu’elles sont en bas de page, et par l’aspect nouveauté aussi/probablement ?).
Le graph social est un « Web d’individus » et « non un « Web de documents ». Il représente donc une alternative crédible à la recherche Web classique, dont dépendra la qualité des résultats. La notion de réseau, c’est des choix d’individus. Il semblerait donc que Microsoft réponde « socialement » au CEO de Google, Eric Schmidt, qui expliquait il y a 2 ans que les marques sont la solution pour contrer la « fosse à purin » qu’est devenu le Web après toutes ces années :
« The Internet is a « cesspool » where false information thrives. Brands are the solution, not the problem. Brands are how you sort out the cesspool ».
Facebook « détientrait » un signal – le graph social – qui n’est autre qu’un curator à l’échelle de notre expérience Web. Associé à Microsoft, ce signal pourrait faire des dégâts à Mountain View, qui a d’ailleurs augmenté les salaires de ses employés, certains quittant le navire pour l’ennemi … Facebook.
Evan Williams, l’un des co-fondateurs de Twitter, explique que la solution réside sans doute dans une combinaison entre un travail réalisé par la foule et un travail réalisé par les machines. Il souhaite d’ailleurs que Twitter soit un antidote à ce déluge de contenus (cf. mes annotations sous Diigo sur le thème de la curation).
The future of the Internet will be a combination of machines and the crowd. Data collected from the crowd that is analyzed by machines. For us, at least, that’s the future. Facebook is already like that. YouTube is like that. Anything that has a lot of information has to be like that. People are obsessed with social but it’s not really “social.” It’s making better decisions because of decisions of other people. It’s algorithms based on other people to help direct your attention another way.
Twitter va participer à contrer les fermes de contenus (Associated Content, Demand Media, Populis) qui vont, à contrario, participer à engraisser le Web. La diététique éditoriale n’est pas pour demain, surtout lorsque l’on écoute certains observateurs qui estiment que d’ici quelques années, l’information disponible sur le Web doublera toutes les 72 heures. La création de contenu deviendra donc un véritable raz-de-marée.
Pour confirmer ce que dit Evan Williams, le moteur Blekko est un excellent exemple de recherche sociale. Il va plus loin que Bing, et propose déjà d’intégrer le graph social dans la recherche Web via Facebook Connect.
Une fois Blekko et Facebook connectés, vos sympathies deviennent des moteurs de recommandation (cf. capture ci-dessous).
En effet, avec moins de 1000 serveurs, Blekko estime que la communication faite autour du nombre de serveurs de Microsoft et Google n’est que de l’intimidation. L’idée derrière cela est d’élever les barrières à l’entrée du marché de la recherche Web. Blekko estime qu’il peut mieux faire, que la recherche Web doit combiner la curation mécanique et humaine pour économiser des ressources et ainsi proposer de la pertinence et du sens.
La curation = recommandation + personnalisation
L’information devra être repérée par la communauté puis traitée par les machines. Si le curator est le nouveau pilier de votre réseau social, il sera aussi la couche sociale de la personnalisation de vos recherches Web, un moteur de recommandation (cf. billet To be or not to be a curator).
La solution algorithmique (exemple de Google) ne peut plus gérer le charivari d’informations. Dans une économie de l’attention, la notion de personnalisation devient de plus en plus nécessaire. Des professionnels de la curation (« des spécialistes dans leur domaine ») ont donc une place à prendre.
Peter Cashmore, le CEO de Mashable, estime d’ailleurs sur CNN que la curation était l’une des 10 tendances lourdes de 2010.
IBM, Microsoft et UPS, notamment, ont déjà ouvert la danse :
- IBM utilise une plateforme de « light blogging » (Tumblr) pour contextualiser les idées pour une planète plus intelligente sur http://smarterplanet.tumblr.com/. Chez IBM, les communicants n’écrivent plus, ils filtre et partagent, ils font de la curation de contenu créé par 200 000 employés.
- Microsoft a imaginé un site qui gère les flux de conversations sur la marque « Windows 7 » sur http://www.microsoft.com/windows/social/
- UPS, et son tableau de bord intitulé POPURLS, http://brown.popurls.com/, dont la vocation est de filtrer le meilleur des informations économiques
L’exemple d’IBM avec la solution Tumblr est intéressant. Partant du principe que Twitter est trop réducteur (140 caractères) et qu’un blog trop chronophage, IBM a choisi la plateforme de « speed blogging » Tumblr pour faire de la curation active, tout comme elle aurait pu choisir Posterous ou Soup.io (cf. ci-dessous).
Dans un monde digital où 97% du contenu produit ne reçoit aucune interaction sociale (partage, tweet, commentaire, like, etc.), des questions se posent :
Google sera-t-il capable d’intégrer dans son approche sémantique (HTML) et éditoriale un signal « social » ? Car, si, en 1998, Google a fait pivoter le Web du « site web » à la « page web », il semblerait que Facebook détienne aujourd’hui la clé du nouveau pivot, celui qui fera passer la recherche Web de la « page web » à « l’individu » comme unité de choix.
Facebook sera-t-il capable d’entrer dans la recherche Web par la porte de la pertinence ? Car malheureusement, Facebook reste encore trop bruyant. Le problème, encore, une fois, est de traiter l’information à grande échelle. Plus j’ai des sympathies (friends), plus la plateforme Facebook est bruyante. Ceci est d’autant plus problématique que l’identité d’un individu se compartimente, et que donc Facebook ne pourra probablement pas gérer mes différentes identités contextuelles (identité personnelle, professionnelle, centres d’intérêts).
Les spécialistes de Google estiment que la recherche Web est un problème résolu à hauteur de seulement 5%. Le sera-t-elle jamais ? Sera-t-elle toujours un problème à résoudre ?