La préparation d'un prochain séjour à Madrid m'incite à faire un point sur le web sémantique. Je me demandais où est actuellement exposé le tableau Guernica ? Du coup j'ai tapé la question suivante : Dans quel musée est exposé Guernica ?
Puis j'ai passé à la question les moteurs suivants :
- Yahoo
- Bing
- Ixquick
- DuckDuckGo
Tout d'abord, une définition
Le web sémantique est le web des données. Il est souvent présenté comme le web 3.0 et permet aux moteurs de comprendre la signification des informations qu'on leur demande et de nous les délivrer. Le terme a été inventé par Tim Berners-Lee, le co-inventeur du Web et directeur du W3C, qui coordonne les propositions de standards du web sémantique. Récemment interviewé par Les Echos, Tim Bernes-Lee décrivait ainsi les fonctions du web sémantique : "Le Web sémantique va permettre de relier les données qui sont dispersées dans des textes, des bases de données, des feuilles de calcul partout dans le monde. Le Web a permis de créer des liens entre plusieurs documents, mais il faut maintenant inventer des outils beaucoup plus puissants pour que les programmes informatiques puissent lire ou manipuler les données à l'intérieur de ces documents. Ce n'est pas un projet centralisé pour tout comprendre. Le but est de relier, de permettre à la communauté de donner du sens aux informations".
Puis, les objectifs
J'ai trouvé cette approche (sur jplu.developpez.com) qui me paraît claire : "Un des principaux objectifs du Web sémantique est de permettre aux utilisateurs d'utiliser la totalité du potentiel du Web : ainsi, ils pourront trouver, partager et combiner des informations plus facilement. Aujourd'hui tout le monde est capable d'utiliser des forums, d'utiliser des réseaux sociaux, de chatter, de faire des recherches ou même d'acheter différents produits. Néanmoins, il serait mieux que la machine fasse tout ceci à la place de l'homme, car actuellement, les machines ont besoin de l'homme pour effectuer ces tâches. La raison principale est que les pages Web actuelles sont conçues pour être lisibles par des êtres humains et non par des machines. Le Web sémantique a donc comme principal objectif que ces mêmes machines puissent réaliser seules toutes les tâches fastidieuses comme la recherche ou l'association d'informations et d'agir sur le Web lui-même".
Ensuite, l'observation
Tous les moteurs m'ont apporté une réponse claire : 4 bonnes réponses dans les 5 premières occurences de Google bien que ces réponses soient déductives, je veux dire par là que je n'ai pas eu un retour direct, voire personnalisé : "Enfin, voyons François ! Au musée de la Reine Sofia !".
Mais Ixquick et DuckDuckGo, qui revendiquent une protection des recherches des usagers m'ont éclairé d'abord, puis par déduction, j'ai trouvé la réponse.
Entre ces deux modèles, Yahoo et Bing, chacun délivrant une réponse appropriée. On imagine ce qu'il en serait si à chaque question que nous formulons, au moins pour des sujets emblématiques car le tableau de Picasso en est un, les moteurs nous répondaient directement : "le tableau Guernica de Picasso est actuellement au musée de la Reina Sofia à Madrid, Espagne. Dans 3 jours il quittera ce musée pour rejoindre l'exposition temporaire consacrée à Picasso à....".
Des améliorations en vue
Mon exemple s'est appuyé sur une démarche touristique basique. Poussons le questionnement : Guernica est il-photographiable ? Guernica est-il dans un espace suffisamment dégagé pour y passer 30 minutes tranquille devant ? Guernica est-il compréhensible par des enfants ? Etc... Evidemment, les interrogations qui demandent un avis, qui sont quand même celles des touristes une fois que la logistique touristique est maîtrisée, ne peuvent pour l'instant être traitées de la sorte sauf dans le cadre d'un chat avec l'office de tourisme. Mais des perspectives d'amélioration sont en vue comme l'a souligné Francis Pisani en pointant l'initiative de Ledface.com, moteur de recherche brésilien.
La logistique à l'oeuvre est lourde puisque pour une question subjective (demandant une opinion) Ledface mobilise un groupe de personnes susceptibles d'y répondre (dans un maximum de 5). La collaboration entre l'intelligence artificielle pour choisir le groupe de spécialistes en capacité de répondre et l'intelligence collective, conduit à proposer des réponses appropriées. Bien évidemment, cette méthode est différente des recherches en sémantique conduites actuellement par Google et qui échauffent les spécialistes du référencement.
Dans le tourisme territorial, je verrais bien la conduite d'une démarche similaire à Ledface.com : il s'agirait de créer une communauté de greeters numériques par destination qui, de surcroît en différentes langues, serait capable d'apporter des réponses subjectives à des questions de fond.