Commentaire d'un expert de Lionbridge : analyse de la traduction automatisée

Les experts en technologie de Lionbridge évaluent les paradigmes de la traduction automatique et de l'IA générative pour vous donner un aperçu des dernières tendances en matière de traduction automatique.

La technologie de traduction automatique reste pertinente malgré la nature révolutionnaire de l'IA générative

De nombreux changements sont à venir : comprendre l'évolution de la traduction automatique

Il y a quelque temps déjà, nous avons annoncé que le paradigme de la traduction automatique (TA) était sur le point de connaître une révolution. Lisez les commentaires de nos experts pour savoir pourquoi.

Nos experts en traduction automatique livrent des informations sur de nombreux sujets, notamment :

Les performance de traduction des moteurs de TA et des modèles d'IA générative (GenAI) à des moments donnés et la signification des résultats dans un contexte plus global
Les limitations des outils de traduction automatique
Les façons d'améliorer l'efficacité de la traduction automatique

Mieux vous comprenez la TA et la GenAI, plus vous pouvez déployer les outils qui répondent à vos besoins. Profitez des points forts offerts par chaque paradigme pour améliorer l'efficacité de la traduction, augmenter la génération de contenu et favoriser les économies.

Commentaire d'un expert de Lionbridge

Les particularités notables de GPT-4, octobre 2023

Face à la prévalence et aux promesses de l'IA générative (GenAI) / des grands modèles de langage (LLM), nous avons amélioré le rapport Machine Translation (MT) Quality Tracker de Lionbridge. Dorénavant, le rapport comprendra les résultats de la traduction par GPT-4 en plus des résultats de GPT-3.5 et de Davinci et, bien sûr, les performances du moteur de MT neuronale (NMT).

Quelles sont certaines de nos dernières conclusions ? Quelques particularités notables pour GPT-4.

Nous avons rencontré plusieurs problèmes liés à GPT-4, comme une lenteur des performances, son incapacité à fournir des traductions pour différentes raisons, et un comportement incohérent : par exemple, il manquait des traductions dans certaines exécutions, mais pas dans d'autres.

Conclusion n° 1 : GPT-4 ne peut pas traduire certaines phrases.

Au cours de notre ensemble de tests de TA, GPT-4 n'a pas pu traduire une phrase en particulier.

Après quelques recherches, nous avons remarqué qu'un terme pouvant avoir une connotation sexuelle dans certains contextes avait causé le problème. Précisons toutefois que la phrase issue de notre test était parfaitement classique et acceptable. Néanmoins, le terme a tout de même déclenché le filtre de contenu sexuel de GPT-4. L'IA a donc censuré la traduction de cette phrase et n'a donné aucun résultat. Ce résultat nous a surpris pour deux raisons :

L'utilisation typique de ce terme isolé ne posait pas de problème.

Le contexte de cette phrase en particulier ne présentait aucune interprétation problématique.

Cette observation nous a poussés à conclure qu'une partie du mécanisme de filtrage de GPT-4 était peut-être basée sur une simple liste de mots interdits, comprenant également des termes ambigus. Cette approche est problématique, car elle est sujette aux déclenchements abusifs et provoque des faux positifs. Cela constitue un problème important pour la traduction professionnelle.

Les technologies précédentes de traduction automatique, comme les moteurs de TA neuronale, ne présentent pas ce type de problème de filtrage de contenu. Nous pouvons donc en conclure qu'il s'agit d'une limitation de la technologie des LLM.

Cette limitation a des répercussions sur des scénarios concrets. Par exemple, imaginez que vous ayez besoin de traduire du contenu médical associé à la gynécologie ou à l'éducation sexuelle. Vous pourriez avoir la surprise de découvrir que le LLM refuse de traduire une partie de votre contenu.

Fait intéressant, nous n'avons rencontré ce problème que lors de la traduction de cette phrase vers une langue en particulier, le chinois, mais pas en la traduisant vers d'autres langues. Ce résultat indique que le filtre était appliqué à la sortie de GPT-4. La solution consiste à désactiver les filtres de contenu pour les tâches de traduction.

Conclusion n° 2 : la variabilité de la sortie de GPT-4.

Après cinq semaines de suivi, nous avons découvert que la sortie de la traduction automatique par LLM était hautement variable, en particulier avec GPT-4.

Nous nous attendions à ce résultat pour l'IA générative, mais la variabilité a été plus importante que prévu, même lorsque nous avons utilisé les réglages de paramètres Température et Probabilité supérieure (Top_p) pour réduire la créativité et rendre la sortie plus déterministe. La sortie de traduction était différente dans chaque exécution de GPT que nous avons menée, même lorsque nous avons effectué des traductions immédiatement l'une après l'autre.

Les deux traductions peuvent être acceptable, même si elles sont différentes. Néanmoins, il s'agit d'un autre aspect à contrôler et d'une autre différence par rapport au paradigme précédent de TA neuronale.

Nous commençons à deviner que ce changement de paradigme potentiel, de la NMT à la TA par LLM, pourra être un changement technologique, et qu'il nécessitera également un changement d'état d'esprit : Nous devrons peut-être nous préparer à vivre avec des sorties moins déterministes, même lorsque nous utilisons la même entrée et les mêmes paramètres, et nous devrons nous attendre à voir plus de variabilité que ce à quoi nous étions habitués avec l'automatisation actuelle.

Nous devrons peut-être vivre avec plus d'incertitude, dans une certaine mesure, mais il reste possible d'utiliser des mécanismes et des bonnes pratiques pour mieux contrôler cette variabilité.

Enfin, tandis que vous consultez notre tableau, veuillez noter que la diminution de l'Edit Distance pour GPT-4 n'est pas synonyme de qualité en baisse. Elle reflète simplement la variabilité des sorties de GPT. Le mois prochain, la ligne montera peut-être. Consultez régulièrement cet espace pour découvrir les évolutions et d'autres informations.

– Rafa Moral, vice-président de Lionbridge, Innovation

Index des sujets des commentaires d'experts

Parcourez les résumés ci-dessous pour explorer les sujets de nos commentaires d'experts précédents.

Mars 2023 — un grand modèle de langage (LLM) surpasse un moteur de traduction automatique (MT) neuronale : et ensuite ?

Février 2023 — Amélioration de la traduction automatique (TA) : personnalisation de la TA vs entraînement de la TA

Janvier 2023 — Comparaison de la qualité des traductions entre ChatGPT et les principaux moteurs de traduction automatique

Novembre 2022 — Amélioration de Microsoft MT

Octobre 2022 — Trad Auto et formalité linguistique

Septembre 2022 — Utilisation de la terminologie pour améliorer la qualité de la TA

Août 2022 — Surmonter les erreurs catastrophiques lors de la TA

Juillet 2022 — Classement des langues en matière de TA

Juin 2022 — Analyse précise de la qualité de la TA

Mai 2022 — Performances d'Amazon et de Yandex en mai

Avril 2022 — Performances de Yandex en avril

Mars 2022 — Évaluations comparatives de TA personnalisées

Février 2022 — L'avenir de la traduction automatique neurale (NMT)

Janvier 2022 — Performances du moteur TA en janvier

Décembre 2021 — Lionbridge ajoute Yandex MT au contrôle concurrentiel MT Quality Tracker

Novembre 2021 — Bing Translator apporte des améliorations

Octobre 2021 — Progression du moteur TA d'Amazon

Septembre 2021 — Amazon améliore la qualité de la traduction automatique

Août 2021 — Principales entreprises de pointe et progression de leur moteur TA

Le système Lionbridge Machine Translation Tracker

Le système Machine Translation Tracker de Lionbridge est la plus ancienne mesure de la TA dans le secteur.

Le Tracker mesure les performances globales des cinq principaux moteurs de TA neuronale et de plusieurs modèles de GenAI. Il évalue également la qualité de la traduction en fonction des paires de langues et des domaines. GenAI ne dépasse pas les principaux moteurs de TA neuronale, à quelques exceptions près. Cependant, ces modèles offrent de bons résultats, surtout compte tenu du fait qu'ils n'ont pas été formés de manière explicite pour les traductions.

Que faut-il en retenir ? Malgré le vif intérêt témoigné envers le déploiement de la GenAI/des LLM, la traduction automatique démontre toujours qu'elle est un outil de traduction automatique intéressant.

Les résultats de traduction évoluent constamment et le système Tracker capture ces fluctuations.

Accéder au système Tracker

Commentaire d'experts de Lionbridge

Bénéficiez des informations livrées par nos experts en traduction automatique.

Mars 2023

L'intelligence artificielle (IA) générative a atteint un jalon important : elle a surpassé un moteur de traduction automatique (MT) neuronale au cours de l'une de nos évaluations comparatives. Plus spécifiquement, le grand modèle de langage (LLM) GPT-4 a fourni une qualité légèrement supérieure par rapport à Yandex pour la paire de langues anglais-chinois, comme le montre la Figure 1.

Cette évolution est notoire, car c'est la première fois qu'un autre type d'approche de la MT surpasse un moteur de MT neuronale depuis l'avènement de cette dernière. De plus, une approche non-MT, une automatisation de langage multi-objectifs, non préparée spécifiquement pour la traduction automatique, a surpassé le moteur de MT neuronale.

Pourquoi cet événement doit-il vous interpeller ? Si vous êtes un fournisseur de MT, pour rester concurrentiel, vous devez vous maintenir au premier plan des avancées technologiques et vous demander en quoi elles impacteront votre offre MT actuelle. Si vous êtes un acheteur de MT, vous devez vous tenir informés de ces évolutions afin de réaliser des investissements avisés, qui devront probablement inclure des technologies basées sur le LLM et non des solutions uniquement fondées sur la MT neuronale.

Il est important de souligner que l'IA générative n'en est qu'à ses premiers pas. Elle ne répond donc pas aux attentes dans certains domaines clés. Par exemple, elle produit des résultats variables sur plusieurs exécutions, son interface de programmation d'application (API) présente des instabilités, et elle fait plus d'erreurs que les moteurs de MT neuronale. Ces problèmes doivent être résolus pour permettre à la technologie de mûrir. Nous percevons déjà des améliorations à la vitesse de la lumière.

La vitesse incroyable à laquelle les LLM peuvent s'améliorer renforce l'idée selon laquelle ils deviendront le nouveau paradigme de la traduction automatique. Nous nous attendons à vivre une période hybride, au cours de laquelle les fournisseurs de MT neuronale intégreront certains aspects des LLM dans leur architecture de MT neuronale, à mesure que le paradigme évolue.

Lisez notre article de blog pour découvrir une comparaison de la qualité de traduction entre la MT neuronale et les LLM pour deux autres paires de langues, et des réflexions complémentaires pour déterminer si nous assistons au début de la fin pour le paradigme de la traduction automatique neuronale.

– Rafa Moral, vice-président de Lionbridge, Innovation

	Personnalisation de la TA
Qu'est-ce que c'est et comment ça marche	Adaptation d'un moteur de traduction automatique préexistant avec un glossaire de traduction et à une liste de termes à ne pas traduire (DNT – Do Not Translate) dans le but d'améliorer la précision des traductions générées.
Objectif	Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition
Avantages spécifiques	Permet aux entreprises d'adhérer à leur marque et à leur terminologie mais aussi de produire des variantes régionales
Risques	Lorsqu'elle n'est pas exécutée correctement, la TA peut formuler de mauvaises suggestions et avoir un impact négatif sur la qualité globale
Utilisation	Solution idéale pour le contenu technologique et axé sur les détails et tout contenu nécessitant : Des traductions précises de la terminologie Des variantes régionales, lorsque vous manquez de données suffisantes pour l'entraînement de la TA
Facteurs de succès	Un spécialiste expérimenté en TA, capable de gérer avec succès les règles de normalisation des entrées et des sorties, les glossaires et les listes DNT
Coûts	Prévoyez un coût unique pour mettre à jour le profil qui entre dans le moteur de TA et des coûts permanents pour la tenue d'un glossaire au fil du temps ; les coûts sont relativement peu élevés si l'on tient compte des avantages potentiels et sont généralement inférieurs aux coûts d'entraînement de la TA

	Entraînement de la TA
Qu'est-ce que c'est et comment ça marche	Création et entraînement d'un moteur de TA au moyen de nombreuses données bilingues, issues de corpus et de mémoires de traduction (MT), dans le but d'améliorer la précision des traductions générées.
Objectif	Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition
Avantages spécifiques	Permet aux entreprises de conserver une voix, un ton et un style de marque spécifiques et de produire des variantes régionales
Risques	Si les données de qualité sont insuffisantes pour entraîner le moteur, l'entraînement de la TA risque de n'avoir aucun impact sur le résultat ; si des auteurs inexpérimentés font un usage inapproprié de la terminologie. la TA risque de formuler de mauvaises suggestions et d'avoir un impact négatif sur la qualité globale
Utilisation	Solution idéale pour le contenu hautement spécialisé, le marketing et le contenu créatif, et tout contenu nécessitant : Une voix, un ton ou un style de marque spécifique Des variantes régionales, lorsque vous avez suffisamment de données pour l'entraînement de la TA
Facteurs de succès	Un minimum de 15 000 segments distincts pour entraîner correctement le moteur
Coûts	Prévoyez des coûts liés au premier entraînement, ainsi que des coûts potentiels pour tout entraînement supplémentaire, qui peuvent être envisagés au fil du temps si le contrôle des performances de la TA indique une marge d'amélioration ; l'entraînement de la TA peut valoir l'investissement dans certains cas si l'on tient compte des avantages potentiels.

	Personnalisation de la TA	Entraînement de la TA
Qu'est-ce que c'est et comment ça marche	Adaptation d'un moteur de traduction automatique préexistant avec un glossaire de traduction et à une liste de termes à ne pas traduire (DNT – Do Not Translate) dans le but d'améliorer la précision des traductions générées.	Création et entraînement d'un moteur de TA au moyen de nombreuses données bilingues, issues de corpus et de mémoires de traduction (MT), dans le but d'améliorer la précision des traductions générées.
Objectif	Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition	Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition
Avantages spécifiques	Permet aux entreprises d'adhérer à leur marque et à leur terminologie mais aussi de produire des variantes régionales	Permet aux entreprises de conserver une voix, un ton et un style de marque spécifiques et de produire des variantes régionales
Risques	Lorsqu'elle n'est pas exécutée correctement, la TA peut formuler de mauvaises suggestions et avoir un impact négatif sur la qualité globale	Si les données de qualité sont insuffisantes pour entraîner le moteur, l'entraînement de la TA risque de n'avoir aucun impact sur le résultat ; si des auteurs inexpérimentés font un usage inapproprié de la terminologie. la TA risque de formuler de mauvaises suggestions et d'avoir un impact négatif sur la qualité globale
Utilisation	Solution idéale pour le contenu technologique et axé sur les détails et tout contenu nécessitant : Des traductions précises de la terminologie Des variantes régionales, lorsque vous manquez de données suffisantes pour l'entraînement de la TA	Solution idéale pour le contenu hautement spécialisé, le marketing et le contenu créatif, et tout contenu nécessitant : Une voix, un ton ou un style de marque spécifique Des variantes régionales, lorsque vous avez suffisamment de données pour l'entraînement de la TA
Facteurs de succès	Un spécialiste expérimenté en TA, capable de gérer avec succès les règles de normalisation des entrées et des sorties, les glossaires et les listes DNT	Un minimum de 15 000 segments distincts pour entraîner correctement le moteur
Coûts	Prévoyez un coût unique pour mettre à jour le profil qui entre dans le moteur de TA et des coûts permanents pour la tenue d'un glossaire au fil du temps ; les coûts sont relativement peu élevés si l'on tient compte des avantages potentiels et sont généralement inférieurs aux coûts d'entraînement de la TA	Prévoyez des coûts liés au premier entraînement, ainsi que des coûts potentiels pour tout entraînement supplémentaire, qui peuvent être envisagés au fil du temps si le contrôle des performances de la TA indique une marge d'amélioration ; l'entraînement de la TA peut valoir l'investissement dans certains cas si l'on tient compte des avantages potentiels.

CE QUE NOUS FAISONS

IA GÉNÉRATIVE

SECTEURS

LANGUAGE CLOUD™

NOTRE ENTREPRISE

Commentaire d'un expert de Lionbridge : analyse de la traduction automatisée

La technologie de traduction automatique reste pertinente malgré la nature révolutionnaire de l'IA générative

De nombreux changements sont à venir : comprendre l'évolution de la traduction automatique

Commentaire d'un expert de Lionbridge

Les particularités notables de GPT-4, octobre 2023

Quelles sont certaines de nos dernières conclusions ? Quelques particularités notables pour GPT-4.

Conclusion n° 1 : GPT-4 ne peut pas traduire certaines phrases.

Conclusion n° 2 : la variabilité de la sortie de GPT-4.

Index des sujets des commentaires d'experts

Le système Lionbridge Machine Translation Tracker

Commentaire d'experts de Lionbridge

Mars 2023

Février 2023

Personnalisation et entraînement de la traduction automatique

Janvier 2023

Novembre 2022

Octobre 2022

Septembre 2022

Août 2022

Juillet 2022

Juin 2022

Mai 2022

Avril 2022

Mars 2022

Février 2022

Janvier 2022

Décembre 2021

Novembre 2021

Octobre 2021

Septembre 2021

Août 2021

Rencontrez nos experts en traduction automatique

Rafa Moral

Yolanda Martin

Thomas McCarthy

Contactez-nous

LANGUAGE CLOUD™

SECTEURS