Facebook se lance dans la traduction « sociale » des messages dans ses pages. Comme l’indique l’article sur http://www.minutebuzz.com/2011/09/07/et-facebook-fut-traduit/ , Facebook va mixer la traduction automatique par Bing Translator avec la traduction « sociale » par les Internautes.
Facebook et Bing surfent là sur un double mécanisme; celui de toucher le plus grand nombre d’internautes en faisant tomber les barrières de la langue, démultipliant ainsi les publics cibles, et celui de comparer les traductions humaines avec leurs traductions automatiques à des fins de R&D pour ajuster leurs logiciels par l’auto-apprentissage.
Toucher le plus grand nombre
Chaque message s’adresse à une communauté cible, dans les langue de rédaction. C’est un peu limité lorsque l’interconnection est mondiale. Faire tomber les barrières des langues consisterait donc à proposer une version linguistique de chaque message dans la langue des utilisateurs. L’effet démultiplicateur serait extraordinaire. Bing et Facebook s’emploient donc à atteindre ce premier objectif, à l’instar des traductions instantanées de pages proposées il y a maintenant quelques temps par Google.
Un effort de R&D qui va s’appuyer sur les mécanismes sociaux
Les logiciels de traduction manquent de retours utilisateurs pour apprécier la pertinence des traductions. Certains mots clés et certaines formulations sont piégeuses et aucun logiciel ne permet aujourd’hui de satisfaire l’ensemble des critères culturels ni linguistiques pour réussir des traductions appropriées. En revanche, si tout d’un coup des millions d’utilisateurs apportent des correctifs aux traductions, cela apporte un retour « quantitatif » pour repérer les textes ayant nécessité une correction, et un retour « qualititif » par la re-formulation employée. Les logiciels n’auront plus qu’à progresser automatiquement en analysant les formulations les plus souvent employées dans certaines circonstances pour « deviner » quelle traduction paraît la plus adaptée pour un bloc texte. La puissance des solutions sémantiques, statistiques, et linguistiques permettent d’exploiter ces masses de données en vue d’améliorer les traductions proposées automatiquement par les logiciels. Au pire, si le succès n’est pas total, les logiciels pourront t se contenter de proposer la traduction automatique, et de suggérer dans le même temps la ou les versions alternatives issues des analyses statistiques et probabilistes.
Une belle expérience à suivre, et Tradutec ne manquera pas d’assurer une veille sur les retours d’expériences.