Binary code around and emanating from a globe

機器翻譯以及正式與非正式用語

在使用機器翻譯時更妥善地調控語言正式度,就能與全球客群建立更穩固的連結

請先想像一下,您會如何跟朋友描述某部有趣的電影。接著,再想像一下您如何跟某位大企業的老闆描述同一部電影。您會使用一樣的用語嗎?應該不會。人類其實非常擅長判斷什麼時候該使用正式用語,什麼時候又該使用非正式用語。但機器翻譯 (MT) 引擎通常沒辦法做出這些判斷,除非有人從旁協助。

為了能與目標客群培養穩固的關係,請務必要意識到 MT 有這樣的侷限,並採取步驟克服這個問題。

什麼是語言正式度?

語域 (register) 或語言風格,是指民眾根據社會文化脈絡、習慣和溝通管道使用語言的方式。換句話說,它代表了人們表達自我意見時的正式程度。正如前述例子,我們通常不會以跟朋友說話的方式,去跟公司老闆說話。

正式度的級別,也就是正式用語跟非正式用語,是決定人們交流時語氣的基本原則。視語言、國家/地區、社會團體或職業環境而定,不同的書寫風格、慣用語、代名詞變化及動詞形態,往往會展現不同等級的正式度。

如何判斷您的書面內容適合使用哪種級別的正式或非正式用語? 

在撰寫內容時,請先思考以下問題,以判斷什麼樣正式度級別才合適:

  • 與目標對象溝通的意圖為何?
  • 我希望對方使用我的產品時有什麼樣的感受?

  • 他們是否有什麼明確的特色?

將內容翻譯至不同語言時,客戶通常會製作風格指南,說明包括目標客群特色、專案脈絡,以及所欲使用的語氣和正式度級別。

為何機器翻譯引擎難以產出正確的語言正式度?

要使用 MT 引擎以目標語言產出一致的語言正式度已屬不易,如果來源語言的正式度級別較目標語言來得少,就更加困難。 

一般而言,MT 模型會為輸入的每個分段文句傳回一種翻譯。但若是輸入的分段文句有岐義時,模型就必須在數個有效選項中擇一輸出,而不會考量目標對象是誰。

而任由模型自行在不同的有效翻譯選項中選擇,就可能會造成翻譯不一致,或是翻譯的正式度有誤。 

Geometric shapes and patterns on a dark background

正式及非正式用語對翻譯為何很重要? 

請務必在翻譯內容中展現正確的正式度風格。 

有些特定文化非常重視正式度級別,若使用了錯誤的級別,可能會讓對方有粗俗無禮的感覺。此外,許多案例也顯示使用正式用語有時根本不適宜,倒不是因為會讓人感到冒犯,而是完全不適當並顯得很突兀。這些錯誤往往會讓目標對象開始疏遠您。舉例來說,翻譯電腦遊戲和教育程式時,就需要使用較為日常、沒那麼正式的語氣。 

公司企業如果願意花時間與心力,將翻譯內容調整為適合目標對象的風格,就能讓客戶強烈感覺自己受到重視。這些心力甚至能吸引到更多潛在顧客的關注。而有效地與目標對象建立連結,自然有助您成功達到目標。

進行翻譯,尤其是使用機器翻譯時,為何難以配合目標對象使用合適的正式度級別?

進行翻譯,尤其是使用 MT 時,往往難以根據目標對象使用合適的正式度級別。有些語言是透過語法表達多種不同的正式度級別,在將內容從英文翻譯至這類語言時,就很容易發生問題。 

每種語言都會以各自的方式,透過語法或詞彙來區別不同的正式度。 

有些語言有明確規範的正式度形式,像是西班牙文的「tú」跟「usted」,德文的「du」跟「Sie」,法文的「tu」跟「vous」,諸如此類。即使在中文,不管是正體還是簡體中文,也一樣有「你」與「您」這樣的差別。韓文則至少有六種正式度級別。而日文和其他語言,可能會透過主動詞、一些名詞和形容詞的詞法標記變化,以及特定的詞彙選擇,來表達不同程度的敬語。

但比如說英文等某些語言,並沒有可以標記這種正式度區別的代名詞,這時就得靠上下文脈絡來表達這樣的概念。 

這種情形便對多數 MT 引擎形成問題,使它們因難以區別正式/非正式用語而無法產出一致的翻譯風格。 

使用機器翻譯時可以如何調控正式度級別? 

有一些策略可以讓 MT 系統產出不同的正式度風格。

規則式技巧

規則式技巧可以讓您以所需的風格或正式度,產出一致的機器翻譯結果。 這些規則會分析第三方系統傳回的正確翻譯,如果發現有可判斷為不合適風格的要素,就會確實地加以取代。

非規則式技巧 

非規則式技巧可以用來開發自訂的機器翻譯模型,進而以所需的風格或正式度產出一致的翻譯結果。這種方式是採用監督式訓練並在語料庫中註解禮貌程度,進而獲得禮貌度功能。  

這種方式的目標,是要以多元的資料訓練出單一系統,進而調整並產出特定的正式度風格。

Binary code in sunburst pattern

哪些商用 MT 系統有提供調控正式與非正式用語的功能? 

多數的 MT 系統並不支援語言正式度或性別參數,然而有些引擎提供這類支援,我們也預期對這些功能的需求會日漸升高。 

目前,DeepL (API) 和 Amazon (主控台及 SDK) 均可針對特定幾種語言的翻譯,提供可調整正式度的功能。 

輸出之正式度級別的調控選項共有三種:預設、正式以及非正式。

預設選項不會變更神經機器翻譯 (NMT) 輸出的正式度。正式/非正式功能則可讓使用者選擇正式或非正式的語氣,更明確地說,這個功能會決定翻譯中所使用的代名詞及相關詞彙。 

Lionbridge 提供什麼解決方案,可在 MT 輸出中達成最合宜的正式度?

Lionbridge 的企業級機器翻譯解決方案 Smart MT™,可以設定語言規則並套用至目標文本,以便依照所需的風格或正式度生成機器翻譯結果。 

我們的專業人員會維護最新的規則資料庫,並回去分析 MT 輸出以調控結果。 

如果足夠資料的話,我們還可將規則式策略與自訂的機器翻譯模型相結合,取得最合宜的結果。 

與我們聯絡

若想深入了解 Lionbridge 新一代的機器翻譯技術,以及 Lionbridge 如何能協助您充分發揮機器翻譯的效益,歡迎立即與我們聯絡

linkedin sharing button

作者
Yolanda Martin 與 Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization