Lionbridge 专家评论：针对自动化翻译的分析

Lionbridge 技术专家评估了机器翻译 (MT) 和生成式 AI (GenAI) 范式，并就自动化翻译最新趋势分享了独特见解。

尽管 GenAI 具备颠覆性的特质，但 MT 技术仍占据一席之地

变化比比皆是：了解自动化翻译的进展

我们一直认为，MT 范式迎来颠覆性变革的时机已然成熟。我们的专家评论将与您道破其中缘由。

我们的自动化翻译专家针对诸多话题发表了见解，话题包括：

MT 引擎和 GenAI 模型在特定时间点的翻译表现，以及这些结果在更大范围内所产生的影响
自动化翻译工具的局限性
提高 MT 效果的方法

您对 MT 和 GenAI 了解得越深，就越能有选择性地部署这些工具来满足需求。您可充分利用各种范式的优势，最终提高翻译效率、增加内容产出并节约成本。

Lionbridge 精选专家评论

GPT-4 值得注意的特点，2023 年 10 月。

生成式人工智能 (GenAI)/大型语言模型 (LLM) 技术大行其道、前景可期，Lionbridge 的机器翻译 (MT) Quality Tracker 报告也因此进行了升级。今后，该报告不仅会发布 GPT-3.5、Davinci 和神经网络 MT (NMT) 引擎的表现，还将为您介绍 GPT-4 的译文结果。

我们最新发现了 GPT-4 一些值得注意的特点。

我们发现 GPT-4 存在一些问题，比如性能缓慢，出于多种原因而无法提供译文，译文水平参差不齐（有时会漏译，有时又不会）。

专家评论主题索引

浏览以下执行摘要，了解往期专家评论主题。

2023 年 3 月 — 大型语言模型 (LLM) 表现超越神经网络机器翻译 (MT) 引擎：如何把握当下？

2023 年 2 月 — 改善机器翻译 (MT) 质量：MT 定制与 MT 训练

2023 年 1 月 — ChatGPT 与主流MT 引擎的翻译质量对比

2022 年 11 月 — Microsoft MT 的改善情况

2022 年 10 月 — MT 和语言正式性

2022 年 9 月 — 使用术语库提高 MT 质量

2022 年 8 月 — 克服 MT 中的重大错误

2022 年 7 月 — 语言的机器可翻译性排行榜

2022 年 6 月 — 准确分析 MT 质量

2022 年 5 月 — Amazon 和 Yandex 5 月表现

2022 年 4 月 — Yandex 4 月表现

2022 年 3 月 — 客制化 MT 比较评估

2022 年 2 月 — 神经网络机器翻译 (NMT) 的未来

2022 年 1 月 — 1 月 MT 引擎性能概览

2021 年 12 月 — Lionbridge 将 Yandex MT 纳入了 MT Quality Tracker 对比检查

2021 年 11 月 — Bing Translator 的表现取得进步

2021 年 10 月 — Amazon MT 引擎取得了哪些喜人进展

2021 年 9 月 — Amazon MT 质量更胜以往

2021 年 8 月 — 科技巨头及其 MT 引擎开发

Lionbridge Machine Translation Tracker

Lionbridge Machine Translation Tracker 长期衡量行业内 MT 的表现。

该工具评估五种主要神经网络 MT (NMT) 引擎和几种 GenAI 模型的整体表现。它还可以针对语言对和领域评估翻译质量。除个别情况外，GenAI 的表现并未超过主要的 NMT 引擎。不过，这些 GenAI 模型的翻译表现尚可，尤其是考虑到它们并未专门针对翻译进行过训练。

结论是什么？在人们对部署 GenAI/LLM 产生浓厚兴趣的同时，MT 也在不断证明自己是一种值得尝试的自动化翻译工具。

翻译表现不断发生变化，Lionbridge Machine Translation Tracker 可以捕捉到这些质量起伏。

前往 Tracker

Lionbridge 专家评论

获悉自动化翻译专家的深刻洞见。

2023 年 3 月

生成式人工智能 (AI) 实现了重大的里程碑式发展：在我们的一项比较评估中，它表现出色，超越了神经网络机器翻译 (MT) 引擎。具体来说，大型语言模型 (LLM) GPT-4 的英语-中文语言对翻译质量比 Yandex 略胜一筹，如图 1 所示。

这是自神经网络 MT 问世以来，表现首次逊色于另一种 MT 方案，因此，这一发展值得关注。而且，打败神经网络 MT 引擎的是多用途语言自动生成模型，这种“非 MT”方案并非专为 MT 而研发。

为何您应关注这一事件？如果您是 MT 提供商，那么您必须站在科技进步的前沿，考虑这对您现有 MT 服务的影响，以保持竞争力。如果您是 MT 买家，那么您必须掌握这些技术发展的情况，以进行明智的 MT 投资，可能要采用一些基于 LLM 的技术，而不仅仅局限于神经网络 MT 服务。

值得注意的是，生成式 AI 仍处于早期发展阶段。难免会在某些关键领域出现短板。例如，针对同一份源文多次运行生成式 AI，生成的译文不固定；其应用程序编程接口 (API) 不稳定；出错率高于神经 MT 引擎。欲使该技术走向成熟，必先攻克这些弊端。而我们已然看到，生成式 AI 应用程序在以惊人的速度得到改进。

LLM 令人难以置信的优化速度印证了它将成为下一代 MT 范式的观点。我们预计，随着该范式的发展，神经网络 MT 提供商会将部分 LLM 技术集成至神经网络 MT 架构，也就是说将出现两种技术结合使用的时期。

阅读我们的博客文章，了解神经网络 MT 和 LLM 针对另外两个语言对的翻译质量比较，以及我们对以下问题的其他看法：这是否代表神经网络 MT 范式开始走向终结。

— Rafa Moral，Lionbridge 创新副总裁

	MT 定制
概念和工作原理	利用词汇表和保留不译 (DNT) 清单对已有的机器翻译引擎进行调整，以提高机器生成的译文的准确性
用途	提高 MT 建议的质量，让译文更准确并减少后期编辑工作
具体优势	让公司能够遵循其品牌名称和术语，并实现地区化差异
使用风险	执行不当时，MT 可能会提出糟糕的建议，并对整体质量产生负面影响
适用情形	适合侧重技术和细节的内容以及任何有以下要求的内容：准确翻译术语体现地区化差异，但您缺乏充足的数据进行 MT 训练
成功因素	经验丰富的 MT 专家，能够妥善管理输入和输出规范化规则、词汇表和 DNT
成本考虑因素	更新 MT 引擎配置文件的一次性成本，以及随着时间推移维护词汇表产生的一些持续成本；考虑到潜在优势，成本相对便宜，并且通常低于 MT 训练成本

	MT 训练
概念和工作原理	通过使用来自语料库和翻译记忆库 (TM) 的大量双语数据来构建和训练 MT 引擎，以提高机器生成译文的准确性
用途	提高 MT 建议的质量，让译文更准确并减少后期编辑工作
具体优势	让公司能够获得特定的品牌形象、语气和风格，并实现地区化差异
使用风险	如果没有足够多的优质数据来训练引擎，MT 训练可能无法影响译文结果；如果经验不足的作者过度使用术语，MT 可能会生成糟糕的建议并对整体质量产生负面影响
适用情形	适合专业性很强的内容、营销和创意内容，以及任何有以下要求的内容：呈现特定品牌形象、语气或风格体现地区差异，并且您有足够多的数据进行 MT 训练
成功因素	至少 1.5 万个独特句段以充分训练引擎
成本考虑因素	初次训练成本，如果监测 MT 性能后表明存在提升空间，可能随着时间推移需要考虑投入额外训练成本；考虑到潜在优势，在某些情况下，值得投资 MT 训练

	MT 定制	MT 训练
概念和工作原理	利用词汇表和保留不译 (DNT) 清单对已有的机器翻译引擎进行调整，以提高机器生成的译文的准确性	通过使用来自语料库和翻译记忆库 (TM) 的大量双语数据来构建和训练 MT 引擎，以提高机器生成译文的准确性
用途	提高 MT 建议的质量，让译文更准确并减少后期编辑工作	提高 MT 建议的质量，让译文更准确并减少后期编辑工作
具体优势	让公司能够遵循其品牌名称和术语，并实现地区化差异	让公司能够获得特定的品牌形象、语气和风格，并实现地区化差异
使用风险	执行不当时，MT 可能会提出糟糕的建议，并对整体质量产生负面影响	如果没有足够多的优质数据来训练引擎，MT 训练可能无法影响译文结果；如果经验不足的作者过度使用术语，MT 可能会生成糟糕的建议并对整体质量产生负面影响
适用情形	适合侧重技术和细节的内容以及任何有以下要求的内容：准确翻译术语体现地区化差异，但您缺乏充足的数据进行 MT 训练	适合专业性很强的内容、营销和创意内容，以及任何有以下要求的内容：呈现特定品牌形象、语气或风格体现地区差异，并且您有足够多的数据进行 MT 训练
成功因素	经验丰富的 MT 专家，能够妥善管理输入和输出规范化规则、词汇表和 DNT	至少 1.5 万个独特句段以充分训练引擎
成本考虑因素	更新 MT 引擎配置文件的一次性成本，以及随着时间推移维护词汇表产生的一些持续成本；考虑到潜在优势，成本相对便宜，并且通常低于 MT 训练成本	初次训练成本，如果监测 MT 性能后表明存在提升空间，可能随着时间推移需要考虑投入额外训练成本；考虑到潜在优势，在某些情况下，值得投资 MT 训练

我们的服务范围

人工智能

行业

Lionbridge 专家评论：针对自动化翻译的分析

尽管 GenAI 具备颠覆性的特质，但 MT 技术仍占据一席之地

变化比比皆是：了解自动化翻译的进展

Lionbridge 精选专家评论

GPT-4 值得注意的特点，2023 年 10 月。

我们最新发现了 GPT-4 一些值得注意的特点。

最新发现 1 — GPT-4 无法翻译某些内容。

最新发现 2 — GPT-4 译文水平参差不齐。

专家评论主题索引

Lionbridge Machine Translation Tracker

Lionbridge 专家评论

2023 年 3 月

2023 年 2 月

机器翻译定制与机器翻译训练

2023 年 1 月

2022 年 11 月

2022 年 10 月

2022 年 9 月

2022 年 8 月

2022 年 7 月

2022 年 6 月

2022 年 5 月

2022 年 4 月

2022 年 3 月

2022 年 2 月

2022 年 1 月

2021 年 12 月

2021 年 11 月

2021 年 10 月

2021 年 9 月

2021 年 8 月

认识我们的机器翻译专家

Rafa Moral

Yolanda Martin

Thomas McCarthy

联系我们

行业