A futuristic hologram depiction of technology superimposed over a person typing on a keyboard

Lionbridge 现向您分享利用自有 Tracker 监测 GPT-4 机器翻译表现的结果

Lionbridge 已将 GPT-4 加入自有 Machine Translation Tracker,以便您了解颇具前景的 GPT 大型语言模型目前在专业翻译方面的表现

将大型语言模型,尤其是 GPT-4,纳入机器翻译比较评估至关重要

在撰写本文之际,GPT-4 是 GPT 系列最先进、实用的大型语言模型 (LLM)。与前几代 GPT 模型相比,它更适合执行机器翻译 (MT) 任务。

  • 这种生成式 AI (GenAI)/LLM 模型目前的 MT 表现如何?

  • 与主流神经网络 MT (NMT) 引擎相比如何?

Lionbridge Machine Translation Tracker 是业内长盛不衰的 MT 引擎表现分析评估工具,可以为您提供上述问题的答案,并让您能够监测 LLM 随时间推移取得的进展。

由于从 NMT 范式转向 LLM MT 范式的趋势日益凸显,Lionbridge 已将 GPT-4 加入自有 MT Tracker,现在可评估 GPT-4 MT 针对部分领域和语言对的表现结果。此外,此 Tracker 还评估了其他两个 LLM 和五个主流 NMT 引擎的结果。

Lionbridge Machine Translation Tracker 评估了以下 AI 引擎:

LLM 主流 NMT 引擎
GPT-4 Google NMT
GPT-3.5 Bing NMT
GPT-Davinci Amazon
  DeepL
  Yandex

LLM 和 NMT 引擎的翻译表现有何不同?

目前,NMT 引擎的表现普遍优于 LLM,但只是略胜一筹。虽然 LLM 尚不能取代 NMT 引擎(部分是因为出于当前的成本考虑以及性能和可扩展性方面的问题),但我们可以通过特定的方式应用该技术,以优化翻译工作流程并降低成本。

根据我们在 2023 年 5 月发布的结果,GPT-4 模型在某一次情况下的表现优于 NMT 引擎。我们认为这预示着未来的发展方向;随着该模型日趋成熟,其实用性只会与日俱增。

我们对 GenAI/LLM 模型开展的测试越多,就更了解其特殊性、局限性和所带来的机遇。您可以阅读我们利用 MT Tracker 开展的原创研究和随附评论,获取最新的 GPT-4 MT 数据。

阅读我们 2023 年 10 月的专家评论,了解以下信息:

  • 与 GPT-4 相关的一些值得注意的特点。

  • 如何缓解使用该技术时产生的不利问题。

  • GPT-4 目前的翻译表现与其他引擎相比如何。

“虽然在向 LLM MT 范式转变的过程中,我们可能不得不面对译文质量的更多不确定性,但我们可以利用一些机制和优秀实践,在一定程度上控制这种多变性。”

— Rafa Moral,Lionbridge 创新副总裁

Lionbridge MT Tracker 能够为您提供哪些帮助?

Tracker 评估工具提供了有关引擎表现的重要数据,使全球企业能够跟上 GenAI/LLM 激动人心的技术发展速度。

然而,开发一款有效的 MT 解决方案来满足贵公司的需求并非易事。这是因为更具优势的卓越方法要根据引擎处理内容独特方面的能力,利用多个引擎。将 LLM 用于引擎组合会让本已充满挑战的任务变得更加复杂。

联系我们

想了解 Lionbridge 如何利用 LLM/GenAI 机会和应用程序定制解决方案,以产生可观的业务价值?欢迎立即联系我们!

请输入企业邮箱地址
勾选以下复选框即表示,您同意接收我们的营销电子邮件。您将收到 Lionbridge 提供的有关语言服务前沿思想、最佳实践和市场趋势的信息。

如需取消订阅以及了解我们如何处理您的个人数据,请参阅我们的隐私政策

linkedin sharing button

Janette Mandell 
作者
Janette Mandell 
  • #banking_finance
  • #consumer_packaged_goods
  • #ai
  • #life_sciences
  • #generative-ai
  • #blog_posts
  • #automotive
  • #industrial_manufacturing
  • #legal_services
  • #technology
  • #translation_localization
  • #retail