[M-R] La reconnaissance vocale, l’IHM ultime ?

Publié le 23 octobre 2011 par Brokenbird @JournalDuGeek

Article rédigé par thomaslemee, membre rédacteur du JDG Network.

Depuis les débuts de l’informatique, de nombreuses Interfaces homme-machine ont été créées. Le clavier, la souris, le joystick, la tablette graphique, le capteur de mouvement… Mais récemment un vieux rêve de tous les geeks est en passe de devenir réalité. Qui n’a jamais voulu parler et se faire comprendre par sa machine ? C’est ce que l’on appelle la reconnaissance vocale. Depuis de nombreuses années, des solutions sont proposées, mais rien n’était vraiment concluant. Apple en ayant acquis la technologie SIRI et en l’implémentant dans ses téléphones a franchi un cap. En effet quand on voit les différents avis sur cette technologie la majorité s’accorde à dire que c’est bluffant. Il est presque possible de tenir une conversation avec SIRI et même de blaguer avec. Si vous posez une question et qu’elle n’est pas assez précise, il vous demandera des informations supplémentaires. De même, il est possible de formuler des demandes de différentes façons ce qui n’était pas possible auparavant. Il fallait utiliser des termes précis pour se faire comprendre. Mais SIRI n’est pas encore parfait, le service est plus étoffé aux États-Unis qu’en France par exemple, mais comme l’a dit Apple, ce n’est qu’une bêta. La question que l’on peut se poser est de savoir si la reconnaissance vocale est l’interface homme-machine que nous utiliserons tous et tout le temps dans le futur ?

À vrai dire tout dépend du contexte et de l’objet. Prenons le cas de l’iPhone 4S puisque c’est le premier objet à proposer une solution réellement séduisante. Vous êtes à une soirée, mais votre copine n’est pas là. Elle vous envoie un texto « J’ai envie de toi mon chéri ». Allez-vous utiliser SIRI pour lui répondre devant tous vos amis ? Il n’y a donc pas d’IHM idéale, mais celles-ci doivent être adaptées aux situations. Sur un téléphone il est donc essentiel de disposer d’une IHM pouvant être utilisée les mains libres, la reconnaissance vocale, mais aussi d’une interface plus discrète comme un clavier ou un écran tactile pour pouvoir faire des choses que notre entourage n’a pas besoin de savoir.

Quand je vois ce qu’il est possible de faire avec la reconnaissance vocale je me dis que l’intégration dans une télévision serait parfaite. En effet, la télévision est un objet qui est observé par plusieurs, on n’a donc pas besoin « d’intimité » dans son utilisation. Vous êtes en train de faire la cuisine et vous pouvez demander à votre téléviseur de changer de chaîne ou de diminuer le volume ce qui évite de toucher la télécommande avec les mains qui sont en train de préparer le repas… Je ne pense pas que la reconnaissance vocale soit judicieuse sur un ordinateur par exemple. Un ordinateur est utilisé et visionné par un utilisateur unique en général, c’est donc un objet plus intimiste.

La reconnaissance vocale on l’a vu, n’est donc pas l’interface homme-machine ultime, mais en complément d’autres ou selon le contexte, l’utilisation de celle-ci peut être réellement appréciable. En tout cas, maintenant que nous avons presque atteint l’objectif de se faire comprendre et de parler avec une machine prenons-nous à rêver d’une interface neuronale qui nous permettrait de contrôler une machine par la pensée ou peut-être même de recevoir des informations directement dans notre cerveau qui sait…

Source