WaSP café : Web sémantique

Publié le 19 avril 2008 par Samuel Martin

Jeudi 17 avril 2008, rue St Augustin, dans le batiment IESA Multimédia se tenait la troisième série du WaSP café.

Le but de cet évènement est de permettre aux participants d’échanger des idées sur l’implémentation des bonnes pratiques du web sur de véritables sites en production, mais également de discuter et d’échanger des trucs et astuces sur les techniques pour résoudre les problèmes que cela peut impliquer. WaSP Paris

Les conférences

Trois conférences étaient disponibles
  1. L’accessibilité du point de vue des utilisateurs - Tanguy Loheac et Fernando Pinto Da Silva
  2. Dompter vos CSS - Marie Alhomme et Thierry Regagnon
  3. Web sémantique - David Larlet et Frédéric de Villamil

Web Sémantique

Comme le laisse penser le titre, j'ai assisté au troisième atelier/conférence opposant les microformats au "RDFa" soutenu par son fidèle défenseur David.
Ce qui suit n'est pas une transcription exacte de la soirée mais plutôt les points importants que j'ai retenus, je compte ainsi sur les auteurs pour obtenir un compte rendu plus fidèle et précis que le mien.

Constat

Aujourd'hui encore, les moteurs de recherche les plus perfectionnés sont incapables de savoir, d'identifier les éléments sémantiques contenus dans une page HTML. Pour pallier à cette lacune c'est à nous humains de fournir les éléments nécessaires à la compréhension de notre contenu. Comme me le faisait justement remarquer Fabrice Bonny, il y a plus de 2 ans. Quel bonheur quand on pourra taper creaone.fr : author afin d'obtenir les coordonnées/adresse de l'auteur.
Exemple simple:
Samuel MARTIN
Etudiant Ingénieur Imac
4 bd Toto 10 230 Paris
06 XX XX XX XX
http://ingenieurmultimedia.fr

Un humain est capable de comprendre ces données comme des éléments d'une adresse alors que pour un moteur de recherche ce n'est qu'une suite de caractères. La solution réside dans l'utilisation soit des microformats soit de "RDFa". Je prendrais naturellement l'exemple des microformats qui sont  une extension du modèle Xhtml.
Exemple sémantique:
 <div class="vcard">
<div class="fn">Samuel MARTIN</div>
<div class="org">Etudiant Ingénieur Imac</div>
<div class="street-address">4 bd Toto</div>
<div class="postal-code">10230</div>
<div class="locality">Paris</div>
<div class="tel">06 XX XX XX XX</div>
<a class="url" href="http://ingenieurmultimedia.fr">http://ingenieurmultimedia.fr/</a>
</div>

Microformats vs RDFa

Je pense que vous l'aurez compris, la soirée illustrait les deux solutions actuelles qui s'opposent sur le Web. D'un côté les microformats initialement créés par technorati pour répondre à des problématiques de tri et de l'autre RDFa lancé par notre cher W3C.
Grosso modo pour utiliser le premier il vous faudra ajouter/surcharger vos classes (Ex : class="tel") et dans l'autre ajouter de nouveaux attributs comme property, content, ressources et ne surtout pas oublier de charger les bonnes DTDs qui servent de modèle à suivre (ligne de bonne conduite).
Microformats priviligie l'humain, tandis que RDFa priviligie la machine grâce au chargement de fichier "grammaire", ce dernier est inévitablement plus complexe à prendre en main, mais semble plus flexible lors de l'apparition de nouvelles problématiques.

Microformats en détails

Les microformats permettent d'indiquer la présence de métadonnées d'après 3 attributs
  • class  - Nom donné à la fonction
  • rel - Relation de moi à quelque chose
  • rev - Relation de quelque chose à moi (moindre importance et donc oublié pour l'instant, c'est Fréderic qui le dit !)
Pour définir les formats on utilise le terme de relation "triplé"
  1. Source
  2. Relation
  3. Destination
Exemple de la relation "triplé" :
Frédéric  a un blog. "Frédéric" représente la source, "blog" la destination, et enfin le verbe avoir "a", la relation.
Pour répondre à différentes problématiques il existe plusieurs formats "microformats" voici les principaux cités pendant cette conférence :
  1. Tag - attention n'est pas une catégorie !, d'ailleurs son utilisation est plus souple, même si 3,65% de gens semblent l'utiliser
  2. hresume - Description d'un CV (terme de macroformat selon Fréderic, oui il regroupe d'autres microformats en lui)
  3. hcard - D'après le format vcard, carte de visite
  4. hcalendar - D'après le format Ical, gère les évènements
Que ce soit pour les microformats ou RDFa il existe une extension FF bien pratique : Operator. Une démonstration vidéo me semblerait utile !

Bilan

Ayant divergé quelques fois, cette présentation forte enrichissante a manqué selon moi d'une courte synthèse, ce qui est d'une importance moindre tant les explications étaient claires et souvent agrémentées de bons exemples. RDFa a semblé je pense pour beaucoup, difficile à mettre en place, difficile à appréhender, pour le coup je pense qu'une simple démonstration ne suffisait pas pour en comprendre le fonctionnement contrairement aux microformats défendus par Frédéric, David avait donc une tâche plus lourde à tenir et à défendre. Les deux intervenants m'ont donné l'envie de me plonger dans le web sémantique, je reste donc avec une préférence pour les microformats, simplicité oblige !