L'indexation des contenus audio par reconnaissance automatique du contenu, et non par intervention et classification humaine, est un magnifique projet en soi. Je me souviens l'avoir évoqué avec des gens de Babel le 11 septembre 2001... Nous cherchions, pour EasyGlider, une solution qui soit multi-locuteur, et qui reconnaisse un vocabulaire de quelques milliers de mots, pour la croiser avec notre système d'indexation d'images et de contenus videos. Autant dire mission impossible, pour cette époque.
Mais à Google, rien d'impossible. Les Google Labs proposent un outil surprenant, Gaudi (le nom plaira surement à mon amie Corinne, la fan de Barcelone). Gaudi est une sorte de YouTube de l'audio, avec des contenus, pour l'instant, principalement en anglais. Cherchez donc les sequences associées à 'France+sarkozy'.
Etonnant, non?