Impact de l'intelligence artificielle dans l'industrie de la traduction automatique
La traduction automatique est un sujet que beaucoup de gens savent qu'il existe mais ne comprennent pas de quoi il s'agit. Oui, nous savons que c'est une traduction automatisée, mais comprenez-vous comment cela fonctionne ? Le terme, utilisé pour désigner les textes traduits par un logiciel, est principalement utilisé en linguistique computationnelle.
En tant qu'outil automatisé, la traduction automatique a le potentiel de changer l'ensemble du domaine de la traduction. C'est parce que, en raison de sa nature technologique, elle peut réduire considérablement les coûts de traduction de millions de documents. Cela aidera, à son tour, les entreprises à se développer à l'international, catalysant la mondialisation. Pour ce faire, les scientifiques ont déjà utilisé de nombreuses approches, telles que les serveurs basés sur des règles et statistiques. Cependant, l'avenir pointe vers un moyen beaucoup plus rapide - et plus efficace - de traduire automatiquement : en utilisant l'intelligence artificielle. Voici tout ce que vous devez savoir sur le sujet !
Comment la traduction automatique a commencé
La traduction automatique, également connue sous le nom de TA, peut être retracée jusqu'en 1629. Cette année-là, le philosophe français René Descartes a lancé une conversation sur une langue universelle. En utilisant le principe des symboles et de la logique, Descartes a proposé une nouvelle forme de communication.
Cette langue universelle serait capable de communiquer des idées équivalentes dans différentes langues à travers un symbole. À l'origine, Descartes et Gottfried Wilhelm Leibniz - un mathématicien allemand - réfléchissaient tous les deux aux nombres. Cependant, avec le temps, le concept d'une langue universelle a commencé à être appliqué à la traduction automatique.
Depuis les années 50, de nombreuses recherches ont été menées pour traduire des textes mathématiques dans différentes langues. Finalement, cela a abouti à la forme moderne de traduction automatique. Les 3 principales approches de la traduction automatique sont :
- Traduction automatique basée sur des règles (1950 - 1980)
- Traduction automatique statistique (1990 - 2015)
- Traduction automatique neuronale (2015 - présent)
Traduction automatique basée sur des règles
La traduction automatique basée sur des règles a commencé à être développée dans les années 70. Cette approche est également connue sous le nom d'approche "classique" de la TA et repose fortement sur des règles linguistiques. À cet égard, elle utilise une multitude de dictionnaires bilingues pour chaque paire de langues. La traduction automatique basée sur des règles se concentre sur la cartographie des règles dans différentes langues.
Traduction Automatique basée sur les statistiques
La traduction automatique basée sur les statistiques a commencé à être étudiée près d'une décennie après la traduction automatique basée sur des règles et repose sur les paramètres des modèles statistiques. Ces sont développés grâce à l'analyse d'un ensemble de textes bilingues. Contrairement aux serveurs basés sur des règles, la traduction automatique basée sur les statistiques vise à créer une reconnaissance de motifs et nécessite. Par conséquent, elle nécessite un énorme corpus linguistique pour fonctionner comme prévu.
Neural Machine
La traduction automatique neuronale (NMT) utilise l'IA et l'apprentissage profond pour obtenir des traductions plus précises. Les réseaux de neurones artificiels apprennent à reconnaître des motifs en traitant de grandes quantités de données.
Ces réseaux sont des algorithmes d'apprentissage qui appliquent une fonction non linéaire à un groupe d'entrées formant une couche. L'opération génère des sorties qui serviront de ressources pour la couche suivante. Il y a plusieurs couches impliquées dans le réseau neuronal, connectées avec des poids/paramètres. Toutes ces couches reçoivent une entrée avec des caractéristiques non linéaires qui augmentent les combinaisons possibles.
Par conséquent, le réseau neuronal encodeur traite une phrase dans la langue source et la transforme en représentations vectorielles à utiliser dans le réseau neuronal décodeur, pour prédire la phrase dans la langue cible. Le NMT peut apprendre à partir de plusieurs sources de données et s'adapter à différents contextes, car le modèle est facile à ajuster et à mettre à jour avec n'importe quelle base de données souhaitée.
La phase de formation dure quelques semaines, mais le système peut automatiquement corriger ses paramètres. Une fois que la sortie est générée et comparée à la référence attendue, vous pouvez envoyer des commentaires à la machine et elle ajustera le poids sur les couches et les connexions.
Statistique versus Machine Neuronale
On a besoin de traductions existantes pour alimenter le système de traduction automatique statistique afin qu'il puisse générer l'hypothèse.En rassemblant des corpus de textes bilingues pour servir d'entrée, les résultats de la SMT peuvent varier en fonction de la qualité de ces traductions précédentes.
Dans le cas d'une langue moins courante, il peut être difficile de fournir suffisamment de matériel bilingue pour obtenir de bonnes traductions. Les expressions idiomatiques, l'argot et les expressions nouvelles, les néologismes, les jeux de langage et autres éléments des textes littéraires et créatifs peuvent également poser problème à la traduction statistique si ces utilisations de la langue ne sont pas présentes dans les corpus utilisés pour former le système.
Lorsque l'ordre des mots d'une langue source est très différent de celui de la langue cible, les résultats peuvent également être moins précis. Un autre inconvénient est que, une fois le système mis en place, il est plus difficile de corriger les bugs, car il faut le redémarrer et vérifier d'autres erreurs mineures lors de l'introduction des données.
source: SyncedReview
MT alimenté par l'intelligence artificielle
Bien que les approches basées sur les règles, statistiques et neuronales aient leurs avantages et leurs inconvénients, il est indéniable qu'elles ont ouvert la voie à ce qui va suivre en termes de traduction automatique.
Si vous ne savez pas de quoi nous parlons, voici un conseil : cela est fortement lié à la technologie. La prochaine génération de traduction automatique reposera sur l'intelligence artificielle et l'apprentissage profond. Et c'est une excellente nouvelle ! L'IA et l'apprentissage profond ont le potentiel de transformer MT et de le porter à un tout autre niveau, car il sera capable de prendre des décisions contextualisées en ce qui concerne le sens des mots et des termes. L'IA permettra également à la TA de mieux reconnaître les schémas entre une paire de langues. L'ensemble du processus de traduction ne dépendra pas uniquement des traducteurs - ils changeront de rôle, devenant des relecteurs et des testeurs de la sortie.
Cela se traduira par des documents traduits plus rapides et moins chers, ce qui permettra finalement d'obtenir de meilleurs résultats et de faciliter la communication entre les personnes qui parlent différentes langues. Nous pourrions optimiser le taux de mots traduits par 3, 4 ou 5 fois plus qu'auparavant - le ciel est la limite ! Dans ce sens, il est également important d'apprendre de nouvelles façons dont nous pouvons mesurer la qualité du contenu traduit.
L'une des meilleures façons de le faire est d'utiliser le score BLEU, un algorithme capable de mesurer la qualité des textes traduits automatiquement. La traduction automatique basée sur l'IA et l'apprentissage profond permettra à des milliers d'entreprises de envisager une expansion à l'échelle mondiale. Cela aidera également les organisations internationales à rester sur le marché et même à entrer dans d'autres marchés. Comme les coûts seront considérablement réduits, les entreprises n'auront plus à prendre des décisions basées sur les coûts lorsqu'il s'agit de déterminer quelles langues privilégier.
Les entreprises seront disponibles partout de manière localisée. Ça semble génial, n'est-ce pas? Et ça l'est! Cependant, il est important de remarquer que nous parlons du futur. Nous avons encore du chemin à parcourir avant d'arriver au point où nous pourrons nous rapporter uniquement à l'IA pour traduire. Comme avec toute autre approche naissante, il faudra probablement quelques années pour développer pleinement cette nouvelle technologie - et quelques années de plus pour assimiler complètement la technique.
L'avenir du traducteur
Bien sûr, il y a aussi quelques défis à relever en cours de route. Le rôle d'un traducteur, par exemple, devra être presque entièrement redéfini pour ne pas devenir obsolète. Cependant, cela représente également une excellente opportunité pour ces professionnels de se réinventer.
Nous devons considérer cela comme un défi à relever - pas comme un problème. De cette façon, nous serons en mesure de profiter des aspects positifs que l'Intelligence Artificielle et l'apprentissage profond peuvent apporter à la traduction automatique. En étant ouverts à la nouveauté, à l'apprentissage et à l'adaptation, nous pouvons transformer la TA en une profonde transformation sociale et économique et émerger de l'autre côté en tant que personnes plus conscientes et mieux équipées capables de relever les défis auxquels nous sommes confrontés.