Miriam Rosen et Claude Tsao

"Demain, la traduction automatique"
- Mode d'emploi -

(article paru dans le hors-série du Monde Diplomatique
"Internet, l'extase et l'effroi" en octobre 1996)

A en croire certaines pubs, la traduction automatique est désormais au bout de la souris. «Vous tapez votre texte en français ou sélectionnez le texte à traduire, cliquez sur l'icône traduction, votre texte apparaît en Anglais», affirme une réclame pour le logiciel AccentDuo, «la première solution à vos problèmes de traduction» (1).

De même, Power Translator de Globalink propose, selon un de ses revendeurs, «une précision sans égale»: «Avec Power Translator, vous pouvez traduire rapidement et en toute facilité, pratiquement n'importe quel document... » (2).

Comment ces promesses sont-elles tenues en pratique? Admettons d'emblée que de tels outils informatiques ne sont pas conçus pour traduire Shakespeare dans la langue de Molière ni vice versa. En revanche, il ne semble pas irréaliste d'imaginer que la correspondance commerciale se prête à ce genre d'exercice. Regardons ce que donne la lettre en anglais suivante (empruntée des modèles proposés par le dictionnaire Robert- Collins):

D'abord Accent Duo (en mode «interactif» plutôt qu'automatique, ce qui permet un petit coup de main de l'utilisateur en cours de route):

Ensuite, Power Translator Professional:

On comprendra vite que si Jean Dupont peut éventuellement se servir d'AccentDuo ou de Power Translator pour décrypter un courrier de son fournisseur anglais John Smith, ce dernier n'améliora guère son image de marque avec la version française obtenue par ordinateur interposé.

Interrogés sur le niveau décevant des résultats (en thème comme en version), les représentants d'Accent et de Globalink révisent à la baisse leurs affirmations publicitaires, soulignant qu'il s'agit non pas de traduction automatique (TA) mais d'aide à la traduction. «La qualité est extrêmement variable, il faut un peu d'expérience dans la traduction et une connaissance de la langue cible pour pouvoir réviser la traduction brute», précise Norm Kreger d'Accent Software.

Certains professionnels du métier se montrent plus cyniques à l'égard de ce genre de produits généralistes commercialisés pour micro-ordinateur: «Ils se targuent de leurs ventes (20 millions de francs en 1995 pour Globalink, NDLR) tout en sachant que c'est presque de la publicité mensongère!» s'insurge John Chandioux, spécialiste de la linguistique informatique à Montréal.

Historiquement, la TA a démarré (comme l'Internet) dans un milieu plutôt éloigné des impératifs du marché: la recherche militaire. Dès la fin de la Seconde Guerre, les Occidentaux, craignant la puissance de l'URSS, veulent mettre en place une surveillance militaire et scientifique, le lancement en 1957 du Spoutnik ne fera que d'intensifier les efforts. C'est l'époque où l'informatique est censé pouvoir tout faire (jusqu'à remplacer les managers et même les psychanalystes... ) Aux Etats-Unis, la Georgetown University (Washington, D.C.) héberge d'importantes programmes de recherche sur la traduction automatique russe-anglais: IBM y fait une première démonstration en 1954, le système Systran y sera largement développé au début des années 60 par l'émigré hongrois Peter Toma. En France, le Centre d'études sur la traduction automatique (CETA), créé par le CNRS et financé en partie par l'armée de l'air (Direction des recherches et moyens d'essais), démarre ses recherches sur la traduction russe-français en 1961 à Grenoble. Ce développement stratégique sera brusquement stoppé en 1966 suite à un rapport assassin de la National Academy of Sciences aux Etats-Unis. (Les Japonais, pour des raisons commerciales plutôt que militaires, continueront leurs recherches, ce qui les met maintenant à la première place dans le domaine de la TA.)

Désormais, la recherche sur la TA sera poursuivie par les universités, les organismes internationaux et le privé. Ainsi, Systran est mis en service dès 1969 par l'armée de l'air américaine pour la traduction russe-anglais (il sera consacré mondialement lors de la mission Apollo-Soyuz en 1975), mais c'est avec le soutien de la Communauté européenne - le premier consommateur de traductions au monde - que ce système sera élaboré à partir de 1976 pour d'autres couples de langues européennes. (Entre 1983 et 1992, la CE dépensera plus de 800 millions de francs dans le cadre du programme Eurotra, qui mobilisera quelque 150 chercheurs européens.) Par ailleurs, pour ne citer que quelques exemples, le système METAL, aujourd'hui commercialisé par Siemens en Allemagne, est créé en 1970 à l'université de Texas et deux groupes de Mormons, soucieux de porter la «bonne parole» aux non-anglophones, développent les systèmes ALPS et Weidner dès 1970, tandis que l'Institut textile de France entreprend en 1973 ses propres recherches pour pouvoir diffuser sa base de données Titus en français, anglais, allemand et espagnol. Bien que l'Institut textile arrête cette activité en 1993, le système Titus IV qui en résulte sera adapté par deux instituts agro-alimentaires ainsi que par Allied Chemicals.

A la différence de la TA née sous le signe de la guerre froide (et, bien entendu, mené aussi par les chercheurs soviétiques), les systèmes ultérieurs visent, plutôt qu'un simple balayage de l'information, une véritable automatisation de la traduction. L'objectif principal est de réduire le temps, donc le coût, de la traduction dans des domaines scientifiques et techniques où les textes sont à la fois spécialisés, répétitifs et volumineux. Avec cette surenchère, privilégiant le thème sur la version et la diffusion sur la veille, le rêve de la TA proprement dit cède le pas à la réalité de la TAO, où le travail de l'ordinateur est associé à une intervention humaine, que ce soit avant (préédition), après (post édition) ou pendant (système dit interactif) le traitement de l'information (voir How That Walks ci-contre).

Titus IV de l'Institut textile de France, par exemple, exige l'utilisation d'une «syntaxe contrôlée» gouvernant et le vocabulaire et la construction des phrases, ce qui permet d'obtenir des traductions avec un taux d'erreur inférieur à 5 pour cent. Systran, en revanche, accepte n'importe quel texte, mais comme le taux d'erreur peut attendre 20 ou 30 pour cent (bien que le système russe-anglais, développé depuis plus de 30 ans, serait performant à 97 pour cent!), un travail sérieux de révision est obligatoire. Dans le cas des systèmes dits interactifs, tels ALPS ou Weidner, il s'agit d'une traduction «brute» modifiée en cours de route par l'utilisateur, puis révisée.

«Nul n'est parfait, mais la traduction automatique peut être utile» résume Christian Boitet, directeur du Groupe d'études sur la traduction automatique (GETA, le successeur du CETA à Grenoble), précisant: «Les techniques qu'on emploie dépend du but: soit on veut accéder à l'information dans une langue étrangère, soit on veut faire de la traduction technique pour diffusion, ce qui exige une grande qualité, avec des traducteurs convertis en réviseurs. Malheureusement, ces deux buts sont mélangés par les gens qui font la pub sur le marché aujourd'hui.»

John Chandioux, qui dirige sa propre société d'experts-conseils à Montréal, va encore plus loin: «Dans 98 pour cent des cas»,estime-t-il, «la traduction automatique n'est pas utilisable. Parfois on dit aux gens, «Prenez un traitement de texte et une bonne banque de terminologie.» Il est bien placé pour juger: son système METEO pour la traduction des prévisions météorologiques au Canada fait référence dans le domaine. Fonctionnant 24 h/24, 7 jours/7, METEO traduit actuellement près de 25 millions de mots par an (l'équivalent de 48 traducteurs humains) avec un taux de révision inférieur à 5 pour cent. Ce qui illustre à la fois le potentiel et les limites de la TA: plus le système est «dédié» - appliqué à un domaine particulier avec un vocabulaire et une syntaxe restreints - plus il est performant.

Pour Christian Boitet du GETA, l'avenir de la TA est clair: «Il y a une limite intrinsèque à ce qu'on peut faire automatiquement. Si on continue à créer des systèmes généralistes, on va être bloqué.»

Ce pronostic n'empêche guère les éditeurs de poursuivre la ruée vers l'or qu'est le logiciel de traduction grand public. Malgré la médiocrité des traductions obtenues, leur stratégie est d'occuper le terrain en cherchant à s'imposer non pas par la qualité technique de leur produit mais par la qualité de leur marketing. Si la mondialisation de l'économie explique l'essor actuel du marché de la traduction - 200 millions de dollars en 1995 (3) - c'est l'explosion de Internet qui déterminera sans doute le futur. Globalink, déjà présent sur le Web avec un service de traduction automatique par courrier électronique (4), annonce le prochain lancement de son Web Translator 1.0 pour Netscape, qui permettrait aux netsurfers de saisir «l'essentiel» des textes en traduisant de ou vers le français, l'allemand, l'espagnol et l'anglais.

Pour aller au-dela de cet «essentiel» - toujours le balayage d'information - il faut s'aligner sur les systèmes «dédiés». Comme le logiciel ne peut pas s'adapter au langage, on est obligé d'adapter le langage au logiciel.

Déjà on peut s'interroger sur ce dépouillement (pour ne pas dire appauvrissement) de la langue, comme le constatent à leur grand dam les traducteurs professionnels relégués à la révision par la TAO. Mais cet homogénéisation de la forme ne doit pas être dissociée du contenu qu'elle véhicule. La boulimie d'information aggravée par l'Internet produit des monceaux de textes fast-food qu'il faut traduire le plus rapidement possible et au moindre coût. On se gave et après, peut-être, on goûte. A quand l'indigestion?



(1) Vocable édition anglaise du 1-8-9 février 1996 (spécial Expolangues), p. 21.
(2) Catalogue Surcouf, février 1996.
(3) Tribune Desfossés du 13 février 1996, dossier spécial sur l'ingénierie des langues.
(4) http://www.globalink.com