L'IA, joue-t-il un rôle dans l'avancement de la traduction?
Des chercheurs travaillant sur des projets indépendants ont créé des intelligences artificielles bilingues qui peuvent nous aider à apprendre une nouvelle langue sans piocher dans un dictionnaire existant, et même sans intervention humaine. Une avancée remarquable.
Est-ce que vous avez déjà essayé a faire la traduccion du chinois en arabe? Cela semble impossible, n'est-ce pas ? Eh bien un ordinateur peut le faire. L'auteur - Mikel Artextxe vient d’announcer une méthode d'apprentissage automatique (machine learning) non supervisée capable de réaliser des traductions sans recourir à un dictionnaire. D'après cela l’ingénieur Guillaume Lample a constaté sur son dernier ouvrage qu'un réseau neuronal peut apprendre à traduire une langue sans aller piocher dans un dictionnaire.
Ces dernières années, la traduction automatique a fait d'immenses progrès grâce aux réseaux neuronaux qui ont dopé les performances de l'apprentissage automatique. Cependant, ce type d'IA nécessite de gros volumes de contenus traduits préalablement par des humains. La traduction est le fruit d'un apprentissage supervisé au cours duquel la machine fait une supposition puis reçoit la réponse correcte d'un humain, ce qui lui permet ensuite d'ajuster son traitement en conséquence. Cette méthode est efficace pour les langues très répandues, l'anglais ou le français par exemple, pour lesquelles il existe de nombreux documents parallèles. Mais elle fonctionne nettement moins bien pour des langues rares qui n'offrent pas d'un tel corpus.
L’IA fait de la géographie pour apprendre les mots
Dans le cas des deux nouvelles méthodes dont il est question, les experts ont développé un apprentissage automatique non supervisé. Pour cela, ils se sont appuyés sur les associations identiques qui existent entre des mots quelle que soit la langue. Par exemple, le mot table est souvent employé avec le mot chaise. Partant de là, la machine va cartographier ces connexions pour chaque langue, un peu comme un atlas routier où les mots remplaceraient les noms des villes. L'IA rapproche ensuite ces cartes et repère les connexions similaires mais avec des noms différents. C'est ainsi qu'on obtient un dictionnaire bilingue sans données préalables. Une sacrée prouesse technique !
Les deux systèmes d'IA sont capables de traduire non seulement des mots individuels, mais aussi des phrases complètes. Pour ce faire, deux techniques d'entraînement sont utilisées. La première, nommée back translation ou « traduction inversée », consiste à traduire grossièrement une phrase d'une langue vers une autre puis à la traduire à nouveau dans sa langue d'origine. Si la traduction de retour n'est pas identique à l'originale, le réseau neuronal ajustera son fonctionnement en conséquence. C'est exactement comme ça que J’avance personnellement quand je fais une traducion.
La seconde technique d'entraînement nommée denoising, que l'on peut traduire par « réduction du bruit », est similaire à la traduction inversée dans son principe. Elle consiste à ajouter ou retirer des mots à une phrase puis à la traduire. C'est en combinant ces deux techniques que les chercheurs ont obtenu les meilleurs résultats. De cette façon, mes phrases sont traduites plus précisément.
Dans les deux cas, je pense que nous avons effectivement fait un pas en avant mais que l'approche culturelle dans la traduction manque et cela sera encore trop difficile à réaliser.
Le machine learning non supervisé est un élément clé de l’IA de demain
Les deux systèmes ont été comparés sur des tests de traductions anglais-français tirés d'une base commune de 30 millions de phrases. Ils ont chacun obtenu un score de 15 dans un sens (anglais-français) et dans l'autre (français-anglais). Sur le même exercice, Google Traduction obtient un score de 40, mais le service utilise de l'apprentissage supervisé. Les traducteurs humains sont en tête avec un score de 50. Si la méthode non supervisée est encore loin de ces niveaux de performance, elle s'e révèle déjà meilleure que la traduction mot à mot.
De plus, les auteurs précisent que leurs IA pourraient progresser si l'on introduisait une part d'apprentissage supervisé avec quelques milliers de phrases traduites en parallèle. Le système est encore balbutiant mais il va assurément progresser. Et le simple fait qu'une machine soit capable d'apprendre à traduire sans intervention humaine est déjà un immense progrès.
J'utilise des outils de traduction depuis des années et je me rends compte que les résultats ne font pas de doute. Je peux conclure mes projets encore plus rapidement. Si mon texte est écris en utilisant des expressions "street", je les remplace par un langage plus acceptable afin d'obtenir un résultat plus correct.