Il existe déjà des systèmes de ce type mais ils utilisés dans des contextes bien précis comme la Défense. Les vidéos grand public sont autrement plus complexes à analyser : quantité de voix, qualité de l'image, multitude de choses à reconnaître, etc. Blinkx s'en sort plutôt bien...
Jérôme : Comme nous l'avons vu hier avec Facesaerch, il existe déjà par exemple chez Google des technologies de reconnaissance de portraits qui fonctionnent pas mal. Nous avons également des outils de recherche visuelle comme like.com (en maintenance au moment où j'écris ces lignes) qui est vraiment très intéressant. Donc oui, je crois à la possibilité de rajouter automatiquement des méta données aux vidéos et aux images. Concernant la voix, il y a maintenant longtemps (depuis la popularisation du téléphone) que de nombreuses recherches existent sur le sujet (c'est d'ailleurs il me semble les premiers travaux à avoir utilisé les N-Grams). Donc, encore une fois oui, je crois que d'un point de vue technologique de tels moteurs peuvent voir le jour dans un avenir proche. Mais d'un point de vue économique, je suis plus réservé : le traitement des flux vidéos et photos est bien plus gourmand en ressources que celui des simples textes. Qui pourra se permettre de lancer un tel projet à l'échelle du Web ? Quel sera le modèle économique pour que les revenus équilibrent les ressources nécessaires à ce genre de moteur ? De plus il ne faut pas oublier qu'un tel traitement nécessite une forte composante linguistique : ce qui signifie qu'un tel moteur n'est pas aussi facilement transposable d'une langue à l'autre que peut l'être un moteur de recherche par mots clés.On peut s'attendre dans les prochaines années à l'apparition de moteurs de recherche nouvelle génération qui permettront, qui sait, de soumettre en guise de requête un extrait vidéo ou audio. Info ou intox ?
Bref, oui, j'y crois d'un point de vue technologique. Mais je suis plus réservé sur la faisabilité économique.