Grâce à une nouvelle méthode mise au point par des chercheurs, un ordinateur est capable de distinguer différences de langues.
Un ordinateur peut désormais reconnaitre n’importe quelle langue sans pré-apprentissage. Une nouvelle technologie qui révolutionne la reconnaissance automatique de la parole vient en effet d’être mise au point par le professeur Torbjørn Svendsen et son équipe de l'Université norvégienne de Science et Technologie (NTNU). Si les ordinateurs sont capables de reconnaître la parole, alors un jour il sera devenu plus fréquent de piloter son ordinateur par la voix que par le clavier. Parler à un téléphone mobile est déjà un phénomène courant pour nombre d’individus. Cette technologie pourra également être utilisée pour la recherche de fichiers audio archivés ou encore de films sur internet. Toutefois, réussir une bonne reconnaissance de la parole est une tâche difficile. La langue parlée diffère largement de la langue écrite et il existe de grandes variations dans le langage oral des individus.
Nouvelle méthode
Jusqu'à présent, deux approches différentes de systèmes de reconnaissance vocale avaient été mises au point. Le groupe de recherche a choisi une approche située entre les deux. «Nous avons une grande confiance en l'approche statistique. Cependant, nous devons aussi prendre en considération les motifs de prévisibilité qui existent dans la parole dans le monde réel» explique Torbjørn Svendsen. Ainsi, les chercheurs incluent des informations pertinentes à ce sujet dans le système et combinent les données axées sur l'apprentissage avec une approche fondée sur des règles. Les modes d'expression diffèrent en raison de la diversité de la physiologie, des dialectes, de l'éducation et de la santé des individus. Tout cela influe sur la production de la voix et la structure des phrases. C’est pourquoi les chercheurs ont développé un programme informatique qui permet de classifier les sons en étudiant la probabilité que certaines caractéristiques soient présentes ou non lors de la prononciation d’une phrase.
Formation de l’ordinateur
Les chercheurs norvégiens ont démontré que la production de la parole humaine est fondamentalement la même dans toutes les langues. Ainsi, la technologie mise au point sera applicable à n'importe quelle langue sans dépendre des données de parole de chaque langue pour la formation de la machine. Les chercheurs ont basé leur approche sur la phonétique. Ils ont également intégré dans le système des discours et des connaissances supplémentaires de la langue. Comme par exemple la correspondance entre la fréquence du son et les mots et la façon dont les mots sont mis ensemble pour former des phrases. La méthode mise au point par le Dr Svendsen et ses collègues implique la formation d'un ordinateur afin de déterminer quelles parties des organes de la parole sont en activité. Pour ce faire, il analyse la pression des ondes sonores captées par le microphone.