L'antinomie du mois : "un système efficace de reconnaissance vocale"
Publié le 09 octobre 2009 par GymglishC'est ce que vous pouvez lire dans le mensuel "Internet Pratique" ce mois-ci (octobre 2009), à propos de l'un de nos confrères (pour ne pas dire l'un de nos concurrents!). Le dossier est intitulé 'Quatre sites pour apprendre les langues', et nous, GymGlish, avons l'honneur d'y figurer auprès de trois concurrents (enfin... trois confrères). Exercice de style assez classique : benchmark synthétique, focus sur 4 produits, notes sur 10, 'les plus', 'les moins'... GymGlish récupère la note de 8,5/10, soit 17/20. Pas mal du tout, mieux que ce que nous prenions à l'école. Certes nous regrettons qu'il ne soit fait aucune mention de notre univers pédagogique scénarisé, notre DelavigneCorp, ses personnages, un point qui s'est révélé un vrai facteur d'assiduité et d'efficacité pédagogique. Mais ne nous plaignons pas, le journaliste n'a peut-être pas eu le temps de tester le produit, et puis nous sommes cités, c'est déjà très flatteur!
Ce qui nous désole en revanche, c'est l'argument "un système efficace de reconnaissance vocale", à propos de ce concurrent dont nous tairons le nom. Comment peut-on raisonnablement conseiller le consommateur sur des méthodes de langues et écrire "un système efficace de reconnaissance vocale"? Techniquement efficace? Nous n'en doutons pas. Le micro fonctionne ('un deux micro check one two...'), le logiciel fonctionne très bien également, il analyse des signaux, nous dessine de jolies courbes, lesquelles jolies courbes sont comparées à d'autres jolies courbes de natifs. Mais pédagogiquement, ces outils sont-ils réellement efficaces? Permettent-ils de progresser durablement à l'oral?
Lors de la conception de GymGlish en 2004, nous avons très vite écarté l'idée d'intégrer à notre solution un système de reconnaissance vocale, pourtant techniquement à notre portée. Nous avons testé les solutions existantes, consulté différents professionnels de la formation linguistique, professeurs d'anglais, formateurs. Il en ressort un relatif consensus de ces derniers sur la très faible valeur ajoutée pédagogique de ces outils de reconnaissance vocale, considérés par le plus grand nombre comme des 'gadgets' et non de véritables vecteurs de progression.
D'après Andrew Wickham, consultant indépendant en formation linguistique, fondateur-dirigeant de l'école de langues Nexus Langues et Communication de 1989 à 2003, et auteur en 2008 de l'étude de marché La Formation Professionnelle Linguistique en France, "les outils de reconnaissance vocale peuvent être utiles pour corriger et améliorer la prononciation (bien qu'il y ait de sérieuses limites à cela), mais elles ne peuvent en aucun cas se substituer à un dialogue réel avec un natif ou avec un professeur" (ici le texte d'origine en anglais).
Si la technologie est mûre en matière d'analyse et reconnaissance de signaux, elle l'est beaucoup moins en matière d'analyse sémantique, c'est à dire l'analyse et l'interprétation du sens. Pour comprendre le sens d'une phrase prononcée, l'être humain reste encore notre maître incontesté. Mieux vaut donc s'exercer à dialoguer avec ce bon vieil humain, qu'il soit professeur ou non, présent devant vous ou à l'autre bout d'une connexion internet. Enfin, en plus du sens, il faut de la substance, c'est à dire des démarches et contenus pédagogiques riches, authentiques, motivants pour stimuler l'assiduité et la régularité de l'effort d'apprentissage dans le temps. Il ne suffit pas de disposer de technologies pédagogiques sophistiquées, encore faut-il les exploiter régulièrement. Or parler dans un micro pour dessiner des courbes, c'est rigolo la première fois, mais c'est vite lassant.
Certes, nous sommes GymGlish, nous ne sommes pas objectifs. Chers journalistes, auteurs de banc d'essai, vérifiez donc nos propos, demandez l'avis des utilisateurs finaux (dans leur grand nombre), des professionnels de la formation (dans leur grande diversité), enquêtez et conseillez nos chers consommateurs. En attendant nous sommes au moins d'accord sur un point. La reconnaissance vocale est efficace, commercialement : ça fait vendre.
--