Du traducteur mécanique à la robotique du traduire, fin de la biotraduction ?

Publié le 11 septembre 2020 par Jean-Marie Le Ray

Du traducteur mécanique, théorisé dès 1929 par Federico Pucci, à la "robotique du traduire" annoncée dans un colloque à venir (reporté à une date encore indéterminée pour cause de COVID), la présente décennie n'a pas encore bouclé un siècle de progrès en traduction et déjà certains experts nous prédisent que d’ici 2024 l’intelligence artificielle dépassera les humains dans la traduction des langues...

En gros, je diviserais ce siècle d'incroyables progrès de la manière suivante :

  • 25 ans (1929-1954), du précurseur Federico Pucci, qui présenta son invention en décembre 1929 et publia dès 1931 la première méthode de traduction automatique à base de règles documentée au monde, en nous laissant même en héritage deux textes traduits "mécaniquement" selon sa méthode (l'un de l'italien au français, et l'autre du français à l'italien), jusqu'au 7 janvier 1954, à New York, au siège d’IBM, date et lieu de la première démonstration de l’histoire d’un système de traduction automatique à base de règles (RBMT, ou Rule-Based Machine Translation).
    À noter qu'à ce jour personne n'a encore reconnu l'importance de Pucci, tout juste mentionné en quelques lignes dans les travaux de John Hutchins avant d'être écarté par ce dernier [and nothing more is known about Pucci...], puisque tous les historiques commencent habituellement par 1933, année clé où George Artsrouni et Petr Smirnov-Trojanskij "matérialisent" leurs premières machines à traduire, et que toute la littérature actuelle sur la traduction automatique en fait remonter l'origine vers le milieu du XXe siècle ! Une histoire à réécrire...
  • Une cinquantaine d'années (1954-2007) durant lesquelles la traduction automatique à base de règles est pratiquement la seule technologie utilisée à grande échelle, sans parvenir toutefois aux résultats espérés, en termes de fidélité et de qualité des traductions. Je prends le mois d'octobre 2007 pour référence, puisque c'est à ce moment-là que Google, qui continuait jusqu'alors d'utiliser l'outil RBMT Systran, bascule sur son système maison à base de statistiques, Google Translate, ce dont j'avais rendu compte à l'époque.
    En moins de 80 ans, Google réalise donc l'utopie de Federico Pucci, sans aucun doute le seul de son époque à avoir rêvé d’une machine simple (Temps nécessaire pour apprendre à traduire : une minute…), pratique, peu encombrante et abordable (il n'aurait quand même pas pu en concevoir la gratuité !), le seul à avoir envisagé ante litteram la démocratisation planétaire de la traduction automatique telle que nous la connaissons aujourd'hui !
  • Une décennie (oct. 2007 - nov. 2016) à peine pour que Google passe définitivement de la traduction statistique à son moteur de traduction neuronal !
  • Moins d'une décennie (2016-2024) au cours de laquelle la biotraduction (ou "traduction humaine" pour les intimes) devrait toucher à sa fin, selon certains experts...
Rassurons-nous, cette "fin annoncée" ne date pas d'aujourd'hui, puisque cela fait longtemps que l'espèce en voie d'extinction des traducteurs humains agite les esprits : voir ici par exemple.
*
Donc : la traduction automatique arrive en force sur le (les) marché(s) de la traduction, c'est une évidence. Dont j'ai eu l'occasion de parler en mai dernier (dès 6'42'' sur la vidéo) lors des "rencontres sur les rives de la traduction" (Encounters at the Shores of Translation) organisées via la plateforme Zoom par Hammouda Salhi (Director of the Master’s Program in Translation and Interpreting - University of Tunis El Manar) :

Or aujourd'hui, qui dit "traduction automatique" dit "post-édition de la traduction automatique", MTPE dans le jargon. À ce sujet, le contexte du futur colloque robotrad2020 nous dit ceci : 
Comme de surcroît la machine permet des gains de productivité de l’ordre de 150 à 200% (certains traducteurs atteignent des rendements de 6000 à 8000 mots par jour), la technique de la post-édition tend à s’imposer de plus en plus dans les industries de la langue, ce que confirme en 2017 la sortie de la norme ISO 18587 (Services de traduction — Post-édition d'un texte résultant d'une traduction automatique — Exigences). Cette technique de post-édition pose un cas de conscience au traducteur : accepter de ne pas être à l’origine de sa propre traduction au profit de la machine.

Ces quelques lignes suscitent en moi quantité de réactions, de points à soulever, de non-dits à exprimer autour de la MTPE, que je qualifie personnellement d'industrialisation du good enough... 

Ou en tout cas d'un coup de force censé faire table rase de l'effet Mozart, théorisé il y a quelques années par Rory Cowan, fondateur de Lionbridge Technologies, à l'époque n° 1 de la localisation dans le monde : 

Si, en 1790, il fallait cinq musiciens pour interpréter un quintette de Mozart durant tant de minutes, aujourd'hui, en dépit des progrès techniques considérables qui ont été accomplis depuis, rien n'a changé : il faut toujours autant de musiciens jouant pendant autant de temps pour restituer la même œuvre ! 

Ce que je commentais ainsi, il y a plus de 10 ans déjà :

Cette belle métaphore sur l'incompressibilité de certains délais d'exécution souligne implicitement les limites de la technologie galopante, qui ne pourra jamais répondre à tout sans intervention humaine, notamment au plan de la productivité.
Des traducteurs en ce qui nous concerne. D'où l'inutilité de toujours les presser ... comme des citrons trop mûrs, en leur demandant à tort et à travers la quadrature du triangle !
Car à force de véhiculer un tas d'idées préconçues sur l'activité des traducteurs, par exemple en assimilant toujours plus le résultat de leur travail à une "commodité", on en finit par perdre de vue combien est fausse et nocive cette notion de commoditisation de la traduction. D'abord, une commodité en français (agrément, avantage, confort, utilité, ...) n'a absolument rien à voir avec la "commodity" anglo-saxonne, qui désigne un produit de base, une matière première.
Nous y voilà : traduction = marchandise, et plus la quantité est importante, plus la remise doit être conséquente. Or c'est oublier un peu vite le fait que la traduction n'est pas un produit comme un autre, mais un service à haute valeur ajoutée d'autant plus spécialisé que le domaine est pointu, et que la seule matière première utilisée servant à la "fabriquer" est la matière grise du traducteur. Dont la logique objective est très exactement inverse à celle du client : plus la quantité est importante, plus ça va me demander de temps et d'efforts pour maintenir le même niveau de qualité de bout en bout. Une qualité qui n'est pas acquise par enchantement, mais conquise de haute lutte. Dans la durée.
Une réalité sur laquelle les clients - et les agences qui les secondent dans cette approche pour les conserver à tout prix (c'est le cas de dire) - font trop souvent l'impasse, ce qui contribue à ternir l'image d'une profession en vérité hautement spécialisée, exigeant des années et des années de pratique et de formation continues avant de donner de bons ouvriers. De plus en plus rares. Or tout ce qui est rare est cher, qu'on se le dise.

De fait, la MTPE tente vainement d'annuler cette incompressibilité des délais d'exécution, qui demeure pourtant, envers et contre tout. Donc, lorsque l'on parle de "gains de productivité de l’ordre de 150 à 200%" et de traducteurs pouvant atteindre "des rendements de 6000 à 8000 mots par jour", il faudrait aussi préciser les conditions de tels "gains" et de tels "rendements", or c'est là où le bât blesse...

Car ces ordres de grandeur renvoient à des situations "idéales", où la qualité du moteur de traduction serait extrêmement performante et permettrait de générer un résultat brut (raw output) quasiment irréprochable, d'où une post-édition légère...

Ce qui supposerait en premier lieu d'avoir des corpus bilingues très importants pour former les moteurs de TA, voire une pré-édition humaine pour "nettoyer" ces masses de texte et fournir des corpus de qualité, etc. etc.

Je vous rassure, cela n'est presque jamais le cas dans la pratique ! Ce qui précède relève davantage du discours marketing des grands fournisseurs de services linguistiques (LSP et autres) pour mieux faire passer la pilule, car c'est surtout un excellent moyen de faire baisser (d'environ 30% au minimum) les tarifs payés aux traducteurs en bout de chaîne, ainsi qu'une bonne excuse pour raccourcir les délais de livraison : avant on pouvait raisonnablement compter sur 2500 mots/jour ouvrable en moyenne, nous en sommes aujourd'hui à une fourchette d'au moins 4000/5000 mots/jour ouvrable avec la MTPE.

Donc c'est vrai, 150 à 200% de gains de productivité, mais dans des conditions de travail loin d'être idéales : des résultats générés par la TA le plus souvent médiocres, d'où des post-éditions lourdes, à faire plus vite vu les quantités de mots à traiter augmentées, et en étant payés moins cher : la totale !

Nous en sommes toujours là, chose dont je parlais déjà en 2003 (!), en tentant d'expliquer et de dénoncer l'impossible exigence, finissant toujours par retomber sur le dos des traducteurs, qui consistait concrètement (et vainement) à leur demander de réaliser la quadrature du triangle !

Imaginez un triangle équilatéral avec aux trois côtés les légendes - DÉLAIS - COÛTS - QUALITÉ - et au centre le terme RESSOURCES :

- où la « ressource Traducteur » (seule composante « humaine » des ressources, matérielles, logicielles, etc.) est broyée dans l’engrenage irréalisable de faire cadrer des nécessités incompatibles, liées à la triple exigence des coûts, des délais et de la qualité (cités par ordre d’importance selon les clients)
- où les délais de remise de la traduction (c’est pour hier, comme on dit en italien) sont inversement proportionnels aux délais de paiement (à la fronde, et le plus tard possible)
- où le niveau des prix reconnus au traducteur (tarifs plus bas possibles) est inversement proportionnel au niveau de qualité requis (toujours être ultra-spécialisé et omni-polyvalent) (la « multicompétence » selon Gouadec).
En fait, dans cette impossible équation de la quadrature du triangle, le concept était très simple : entre DÉLAIS, COÛTS et QUALITÉ, prenez-en deux et oubliez le troisième…
Or ce n'est pas pour autant que les choses se sont améliorées avec la post-édition de la traduction automatique, au contraire, puisque nous avons plutôt tendance à régresser !
On voit d'ailleurs fort bien le déplacement des pôles d'attraction pour les clients au fil des décennies, puisque de l'accent essentiellement mis sur la Qualité dans les années 80, l'intérêt s'est reporté sur les Temps de livraison dans les années 90, pour passer au facteur Coûts dans les années 2000.
Vingt ans plus tard, avec la MTPE le secteur a résolument et ouvertement fait son choix : miser sur COÛTS et DÉLAIS aux dépens de la QUALITÉ !

Que les clients le sachent et ne s'en étonnent point : car prétendre offrir les trois à la fois est toujours une chimère, raison pour laquelle je pense que la "biotraduction" a encore de beaux jours devant elle...La "robotique du traduire" aussi, c'est certain, mais tant qu'elle ne sera pas capable d'intégrer automatiquement tous les "plus" des traducteurs humains, autrement dit tant qu'elle restera tributaire de leurs compétences, il faudra que tous les partisans et acteurs de la "robotraduction" reconsidèrent les conditions de travail imposées aux biotraducteurs, à commencer par revaloriser le rapport multifactoriel difficulté/quantité/qualité/délais/tarifs au profit des femmes et des hommes qui se forment des années durant pour exercer professionnellement leur métier et en tirer un niveau de rémunération suffisamment gratifiant pour pouvoir en vivre décemment... Ouf !