Modern technology with bright lights

參考依機器可譯性排序的語言排名,更有效地運用機器翻譯

了解哪些是機器處理起來相對簡單的語言,進而更聰明地部署機器翻譯

公司企業面臨越來越大的壓力,需要更快速地翻譯更多內容,而機器翻譯 (MT) 則公認是解決這個挑戰至關重要的一個工具。因此,比較例如 Google NMT、Bing NMT、Amazon、DeepL 和 Yandex 等各主流 MT 引擎的成效,決定哪個引擎最符合您的需求,自然是頗為划算的投資。事實上,Lionbridge 每月都會透過 MT 追蹤工具分析各大 MT 引擎的表現,這也是市面上歷史最悠久的主流 MT 引擎評估工具。但進一步的評估仍舊有其必要,特別是因為從我們的分析便可以看出,這些引擎目前的表現其實不相上下。 

為了充分發揮 MT 的效用,不妨深入了解哪一種 MT 引擎可更輕易翻譯特定的語言組合,這又稱為語言的機器可譯性或 M 可譯性。為了協助您比較這些語言,我們在表 1 列出了從英文譯出時,前 28 種目標語言的 M 可譯性排名。

為何要審視不同語言組合的 M 可譯性?

了解不同語言組合的 M 可譯性,有助您更清楚知道哪些語言組合會需要投入更多翻譯心力,進而得以在規劃各個語言的翻譯費用時更妥善地分配預算。 

因此,對語言的複雜性有深入了解,不但能協助您做出更明智的商務決策,也有助您回答以下的問題:

  • 是否應該將大部分的預算,投入較複雜語言組合的譯後編修
  • 在預算吃緊的情況下,小幅譯後編修,或是只針對內容中重要部分進行譯後編修的重點譯後編修,對某些語言是否便已足夠?哪些語言應該使用這些譯後編修作法?
  • 在思考預算的最佳分配方式,特別是那些低預算的專案時,公司是否應該將語言排名納入商務和文化因素的考量?如果某個文化可以接受較低的品質,公司是否應該將內容翻譯至 M 可譯性排名較低的語言?
Digital stream of information

M 可譯性的計算方式

計算語言的 M 可譯性並不是個簡單直覺的流程,不同語言之間也有不同的挑戰需要解決;此外,對某個語言而言成效良好的因素,對另一個語言可能就稍嫌不足。然而,我們還是可以使用一些指標來進行評估。 

舉例來說,編輯更動程度,也就是譯後編修人員為確保最終譯文擁有與人工翻譯相同的品質,而對機器翻譯之內容所做的更動次數,就有助於我們了解語言的複雜性,進而有助我們決定各個語言組合的 M 可譯性,即使通常我們不會使用這些指標進行跨語言的比較。

Lionbridge 的 M 可譯性分析結果:語言的排名結果與原因

這個對 28 個目標語言所做的 M 可譯性排名,是根據 Lionbridge 處理過的數百萬個句子分析所得的結果。

從分析結果可以看出,複雜性跟語系是相關的。 

羅曼語系

當譯出語為英文時,多數羅曼語系的語言,例如葡萄牙文、西班牙文、法文和義大利文等,通常只要稍做修改就能得到高品質的譯文。我們發現這些目標語言是機器最能輕鬆處理的語言,它們也名列我們 M 可譯性排名的前四名。

值得注意的是,排名中另一個屬於羅曼語系的語言羅馬尼亞文,則僅列於第十名,對這個較少翻譯的羅曼語系語言來說,較低的排名很可能是因為訓練 MT 引擎的雙語訓練語料庫規模較小,以及羅馬尼亞文本身文法較為複雜 (有點類似拉丁文)。  

簡體中文

簡體中文是迥異於英文的一種語言,但卻緊接著前四名的羅曼語系,名列可譯性排名的第五位。我們認為這樣高的名次,是因為 MT 在過去幾年對這個語言組合經常有更新和改進,這從我們這段期間對 MT 的持續追蹤便可看出。而各 MT 公司之所以會對這個語言組合投入大量心力,希望產出更優異的成效,則是因為商界對這個語言所屬市場的高度關注。

複雜的語言

匈牙利文和芬蘭文這兩個烏拉爾語系的語言,則屬於較為複雜的語言,因而在我們的可譯性排名中墊底,分別是第 27 和第 28 名。同一語系的另一個複雜語言愛沙尼亞文,則是第 24 名。

韓文的名次也屬於後段班,名列排名的第 25 名。

Person working on computer with analytical data

從 M 可譯性排名可以總結出哪些重點?

雖然語言比較仍有其侷限,但我們的排名以及複雜性跟語系的關聯性,能提供一些有趣的深入見解,協助您更妥善地管理多語言專案。

表 1

語言 M 可譯性排名

排名 語言 (由英文譯出) 排名 語言 (由英文譯出) 排名 語言 (由英文譯出)
1 葡萄牙文 11 泰文 20 中文 (繁體)
2 西班牙文 12 挪威文 21 立陶宛文
3 法文 13 德文 22 捷克文
4 義大利文 14 瑞典文 23 阿拉伯文
5 中文 (簡體) 15 土耳其文 24 愛沙尼亞文
6 荷蘭文 16 斯洛伐克文 25 韓文
7 丹麥文 17 希伯來文 26 俄文
8 日文 18 拉脫維亞文 27 匈牙利文
9 希臘文 19 波蘭文 28 芬蘭文
10 羅馬尼亞文        

表 1

語言 M 可譯性排名

排名 語言 (由英文譯出)
1 葡萄牙文
2 西班牙文
3 法文
4 義大利文
5 中文 (簡體)
6 荷蘭文
7 丹麥文
8 日文
9 希臘文
10 羅馬尼亞文
11 泰文
12 挪威文
13 德文
14 瑞典文
15 土耳其文
16 斯洛伐克文
17 希伯來文
18 拉脫維亞文
19 波蘭文
20 中文 (繁體)
21 立陶宛文
22 捷克文
23 阿拉伯文
24 愛沙尼亞文
25 韓文
26 俄文
27 匈牙利文
28 芬蘭文

與我們聯絡

若想深入了解 Lionbridge 如何能協助您研擬有效的 MT 策略以解決您的翻譯需求,歡迎立即與我們聯絡

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

Rafa Moral 與 Janette Mandell
作者
Rafa Moral 與 Janette Mandell