A woman interacts with a holographic computer interface

Résumé du webinar : L'IA générative pour le contenu international

L'IA générative et les grands modèles de langage, les moteurs vont fortement impacter les initiatives de localisation

Dernière mise à jour: Juin 28, 2023 5:39PM

En quoi consistent exactement les technologies d'IA générative (GenAI) et de grands modèles de langage (LLM) ? Comment la GenAI et les LLM, comme ChatGPT, vont-ils impacter la traduction et la localisation ? Comment pouvez-vous utiliser les LLM pour améliorer vos flux de travail liés au contenu international ?

Vincent Henderson, responsable des équipes Produit et Développement chez Lionbridge, répond aux questions que vous vous posez.

Vous avez manqué notre webinar, vous pouvez le revoir à la demande.

Regarder notre webinar

Vous n'avez pas beaucoup de temps ? Découvrez quelques-uns des thèmes abordés par Vincent au cours du webinar

En quoi consistent l'IA générative et les grands modèles de langage ?

L'IA générative et les LLM sont des moteurs d'intelligence artificielle (IA) qui apprennent comment les humains rédigent du texte à partir du corpus d'Internet. Si vous leur soumettez une entrée, ils compléteront n'importe quel texte avec la suite la plus probable issue de son entraînement.

Avec la nouvelle IA, ces technologies déterminent le résultat à produire en s'appuyant sur toutes leurs connaissances, fondées sur une immense quantité de données.

Si leur capacité à déterminer le résultat ultérieur le plus plausible peut sembler triviale, la tâche est extrêmement sophistiquée. Lorsqu'il reçoit le texte, le modèle peut l'étudier de manière holistique et déterminer comment il s'intègre à la vision d'ensemble du langage afin de produire le résultat. Il détermine les éléments les plus importants dans l'invite et dans le corpus d'entraînement, et ceux qui doivent faire l'objet d'une attention plus poussée.

Les LLM ont ainsi l'étonnante capacité à produire du texte qui semble avoir été créé par des humains. Cette technologie semble comprendre nos intentions, réfléchir et agir comme nous.

Que peuvent faire les LLM ?

D'après ses apprentissages, un LLM, tel que ChatGPT, peut réaliser plusieurs actions :

Il répond à des questions : soumettez-lui du texte sous forme de question et il vous fournira le texte le plus plausible constituant une réponse.
Il suit des instructions : fournissez-lui un ensemble d'instructions et il émettra le résultat le plus probable de la façon dont cette instruction serait appliquée.
Il apprend grâce aux exemples : donnez-lui quelques exemples et entrez le même format, et il vous fournira le texte le plus plausible, en appliquant l'exemple de format aux informations de la saisie.

Pourquoi les LLM impactent-ils autant la traduction ?

Pour comprendre en quoi les LLM comme ChatGPT sont avantageux pour la traduction et la localisation, examinons tout d'abord certaines des difficultés liées à la traduction automatisée lorsque nous utilisons la traduction automatique neuronale (NMT).

À ce jour, les entreprises emploient des moteurs de traduction automatique (MT), des grands modèles de langage hautement spécialisés et optimisés pour prendre une chaîne de termes et en déterminer la traduction correspondante. Les entreprises qui utilisent un moteur MT générique produisant des résultats non optimaux pourraient améliorer ces résultats en affinant l'entraînement du moteur à l'aide de dizaines de milliers de données pertinentes.

Cette opération est coûteuse, et les entreprises qui utilisent des moteurs de MT doivent sans cesse déterminer si le ré-entraînement du moteur mérite les efforts et les dépenses encourus chaque fois qu'elles mettent en place une nouvelle initiative, comme un nouveau lancement de produit ou une nouvelle campagne marketing.

À l'inverse, les LLM apprennent les attentes d'une entreprise uniquement à partir de quelques exemples, étant donné que ces moteurs ont déjà énormément de connaissances. Ils peuvent également appliquer leur apprentissage à de nouvelles initiatives. Ils permettent donc d'obtenir les résultats de traduction souhaités avec des invites beaucoup plus légères tenant compte du contexte, sans un entraînement du modèle spécifique à la tâche et nécessitant de grandes quantités de données.

Cependant, au moment de la rédaction de cet article, les LLM offrant ces fonctionnalités subissent une demande importante, et ils ne peuvent pas encore traiter les volumes de contenu liés à une localisation à l'échelle sectorielle. Cette situation évoluera bientôt, mais nul ne sait quand.

Qui traduit le mieux : les LLM ou les moteurs de MT ?

Quelles sont les performances de traduction brutes des LLM par rapport aux moteurs de MT ? Lionbridge a comparé la qualité de la traduction produite par les principaux moteurs de MT neuronale et par les modèles GPT pour une phrase de l'anglais vers le chinois, de l'anglais vers l'espagnol et de l'anglais vers l'allemand.

De manière générale, GPT ne fonctionne pas aussi bien que les meilleurs moteurs de MT actuels. Mais les LLM s'en rapprochent. Dans un exemple, comme le montre la Figure 1, GPT-4 a légèrement surpassé le moteur de MT Yandex pour la paire de langues anglais-chinois.

Comparaison de la qualité de la traduction automatique entre les modèles de GPT et les principaux moteurs de MT neuronale pour la paire de langues anglais-chinois

Pour consulter d'autres résultats comparatifs de moteurs en fonction de différents domaines et langues, visitez le Machine Translation Tracker de Lionbridge, la mesure la plus ancienne des performances globales de la traduction automatique.

Quelles sont les autres performances des LLM tels que GPT par rapport aux principaux moteurs de MT ?

Vocabulaire, grammaire et précision

Sans instructions spécifiques, les LLM tels que GPT traduisent de manière plus vernaculaire que les principaux moteurs de MT. Cette pratique peut aller à l'encontre de la démarche des traducteurs professionnels et peut être considérée comme une erreur. De plus, GPT peut parfois créer des néologismes ou de nouvelles expressions, chose que les traducteurs évitent.

Il est facile de faire en sorte que les LLM utilisent une terminologie en particulier : il suffit de le leur demander. À l'inverse, il est plus long d'intégrer une terminologie aux moteurs de MT. Il faut entraîner le moteur de MT ou créer une superstructure au-dessus du moteur de MT pour injecter la terminologie dans les résultats ou dans la source. Cette pratique crée généralement des problèmes de conjugaison ou de concordance.

GPT étant très axé sur le langage, il fait rarement des fautes, comme des erreurs de concordance. Généralement, il se corrige lui-même si on le lui demande.

Quelles sont les autres utilités des grands modèles de langage ?

Analyse et amélioration de la source ou de la cible

Les LLM sont polyvalents. Vous pouvez les utiliser pour améliorer non seulement le texte cible, mais aussi la source. L'analyse va au-delà des vues quantitatives de fréquences, de volumes et de longueurs, avec une évaluation qualitative et des améliorations automatiques. Demandez aux LLM d'agir d'une certaine manière pour obtenir le résultat souhaité.

Utilisez ChatGPT pour :

Simplifier la terminologie complexe ou réécrire du contenu plus simplement, pour améliorer la lisibilité et la traductibilité
Raccourcir les phrases longues sans en modifier le sens, pour améliorer la lisibilité et la traductibilité

L'utilisation des LLM pour faciliter la lecture des contenus les rend plus accessibles au public. L'amélioration de la source et la réduction du nombre de mots peuvent diminuer vos coûts de localisation.

Assurance qualité linguistique et post-édition

Vous pouvez demander aux LLM de post-éditer vos traductions, comme vous le demanderiez à un traducteur professionnel. Les LLM livrent-ils de bonnes performances en post-édition ? Une analyse a déterminé qu'ils avaient fortement réduit les efforts nécessaires pour obtenir la version finale d'une phrase, ou Edit Distance, de 48 à 32 %. Ils détectent également les erreurs telles que les espaces supplémentaires, suggèrent de meilleurs choix de mots et réécrivent le texte cible pour l'améliorer.

Comment les prestataire de services linguistiques tels que Lionbridge favorisent les améliorations des flux de contenu issus de l'IA générative ?

L'IA générative va révolutionner les flux de travail pour le contenu multilingue. Lionbridge peut fournir des services en lien avec ces changements.

Services de génération de contenus multilingues

La capacité des LLM à générer du contenu multilingue sera sans doute l'évolution la plus importante dans le monde de la localisation depuis le lancement des mémoires de traduction (TM).

Voici comment les LLM peuvent générer du contenu multilingue en partant de zéro : donnez des informations aux LLM. Demandez-leur de produire du contenu dérivé et de produire ce contenu multilingue en partant de zéro.

Les LLM permettront aux entreprises de générer des descriptions de produits, des tweets et d'autres supports en fonction des données que vous possédez déjà. Vous ne risquez donc pas de rencontrer les hallucinations que les LLM ont tendance à produire lorsque vous leur posez des questions sur des éléments réels.

Auparavant, les flux de contenu international étaient basés sur deux flux de travail différents, un pour la production nationale de contenu et l'autre pour la production internationale de contenu. Lorsque vous utilisez des LLM, vous ne produisez pas de contenu dérivé en employant d'abord des rédacteurs dans votre langue source, puis en démarrant votre flux de travail de localisation. Vous produisez le contenu dérivé dans toutes les langues souhaitées, puis vous faites post-éditer le texte par des post-éditeurs dans chaque langue, y compris la vôtre.

Lionbridge occupe une position idéale pour fournir des services de post-édition multilingues, basés sur du contenu généré de manière multilingue, grâce à sa grande équipe de traducteurs.

Prise en charge des initiatives d'IA générative multilingues des clients

L'utilisation de LLM pour générer du contenu multilingue requiert une ingénierie en matière d'invites. Or, celle-ci est chronophage et implique la multiplication d'essais et d'erreurs potentielles. Aider les entreprises à créer des invites adaptées est une catégorie de services naissante dans la localisation. Lionbridge peut apporter son aide dans ce domaine.

Lionbridge peut simplifier l'utilisation de l'IA avec un développement backend et peut aider les clients à organiser le type de contenu utilisé en tant qu'exemple, ainsi que les invites pour les initiatives d'IA générative multilingues qu'ils exécutent pour eux-mêmes.

Optimisation des ressources multilingues

GPT peut modifier les ressources linguistiques, comme les mémoires de traduction (TM) et les règles stylistiques.

Lionbridge a utilisé GPT-4 pour informaliser la totalité d'une mémoire de traduction (TM) française, en adaptant le ton et le style aux spécifications du client, de manière plus abordable que ce qui était possible auparavant.

Détails de l'étude de cas

250

Unités de traduction

4.5

Million de mots

98.5%

Taux de précision

Améliorations des flux de localisation

Cette catégorie concerne l'utilisation de LLM pour rendre la post-édition plus simple, plus rapide et moins chère, et pour rendre finalement tout le flux de traduction plus efficace et économique.

L'amélioration des flux de localisation rend le concept de la localisation plus accessible pour les entreprises.

Conclusion : quelles perspectives pour l'avenir ?

Les LLM vont transformer la localisation. Au fil du temps, les flux de travail vont se lisser.

Au lieu d'utiliser des flux de travail nationaux et internationaux séparés, les entreprises pourront définir des objectifs de contenu, planifier du contenu et générer du contenu immédiatement en plusieurs langues.

Les nouvelles technologies provoquent souvent la crainte de perdre son travail, mais Lionbridge n'a pas peur que les LLM ne remplacent les prestataires de services linguistiques (LSP) ni les traducteurs.

Les entreprises qui utilisent des LLM pour générer du contenu multilingue auront toujours besoin d'experts pour réviser le contenu de la machine. C'est ce que l'on appelle la post-édition de la traduction automatique. Elle prendra peut-être un autre nom à l'avenir.

« Tout le secteur linguistique doit réagir au défi que présentent les LLM. C'est enthousiasmant. Nous n'en sommes qu'au début d'une multiplication exponentielle des cas d'utilisation que la technologie LLM peut traiter. »

Vincent Henderson, Lionbridge Head of Product, Language Services

Pour en savoir plus sur l'IA générative et la découvrir concrètement dans des démonstrations, regardez le webinaire dès à présent.

Contactez-nous

Si vous souhaitez découvrir comment Lionbridge peut vous aider à mieux répondre à vos besoins en matière de contenu international grâce aux dernières technologies, contactez-nous dès aujourd'hui.

RÉDIGÉ PAR

Janette Mandell

#technology
#webinar
#translation_localization
#ai
#generative-ai
#blog_posts

CE QUE NOUS FAISONS

IA GÉNÉRATIVE

SECTEURS

LAⁱNGUAGE CLOUD™

NOTRE ENTREPRISE