Using a laptop for complicated computations

ChatGPT 到底有何優缺點,又為何說它可能徹底改變本地化產業

Lionbridge 對這個新技術的看法,以及接下來該如何充分發揮它的潛力

自 2022 年 11 月 30 日推出後,ChatGPT 便一夕爆紅,光速吸引了全球目光,受到的關注與評論可說是史無前例。經過幾天 (幾夜) 的時間與 ChatGPT 聊天後,筆者認為真最重要的其實只有以下幾個問題:

  • 它有什麼優點?

  • 它有什麼缺點?

  • 我們可以如何使用它?

想了解這些問題的答案,以及筆者預見這個本地化新工具有哪些潛力嗎?歡迎閱讀部落格文章。我們也將很快就這個議題,發表一份篇幅較長、說明更為詳細的白皮書。

ChatGPT 有什麼缺點?

有些事情你不能靠 ChatGPT 完成:

  1. 它所說的並非事實,ChatGPT 會根據群眾提供的資訊,講述群眾想聽的內容。

  2. 它完全不了解真實的世界。ChatGPT 對世界的認知是來自群眾對真實世界的看法,它會篩選並運用這些資訊,以非常具說服力的語言呈現它所學習到的世界。

  3. 它不能計算。我透過一個較為複雜的計算,試著重現 Jonas Degrave 在 Engraved 上發表的模擬實驗,但得到的結果卻是錯誤的。ChatGPT 知道如何模擬,並正確地試圖依照這個 Python 指令將兩個數字相乘,這點確實很厲害,然而它就是無法正確地計算。

  4. 它不能思考。ChatGPT 通常可以根據我的要求,寫出準確描述前提與真實陳述的內容,但卻會充滿自信地應用錯誤。基本上它無法自行推理,它並不是一台有限狀態機 (finite state machine)。

  5. 它看似謙虛,實則自傲,反應也讓人尷尬。ChatGPT 行文非常沉穩且有權威感,也會羞怯地聲稱自己只是在幫你;如果你說它錯了的時候,它卻會以讓人不自在的方式道歉。
The vast scope of human intelligence and reasoning

ChatGPT 的優點

了解 ChatGPT 的能力範圍在哪裡之後,我們來看看將它當成文字翻譯和生成工具的話,它可以發揮什麼作用。ChatGPT 可以:

  • 寫得比你好。我跟 ChatGPT 聊過許多次之後,這種感覺越來越強烈。它能使用非常複雜的詞彙,撰寫不同複雜程度的文章。在我看來,這個生成式 AI 的品質,可以媲美前十分之一的內容寫作人員

  • 遵從指示。無論是形式還是內容,它都能以特定方式將文本修改到完美的境地。最重要的是,即使你以最日常的方式跟它溝通之前寫過的內容,它也能理解並保持對話的脈絡不變。

  • 在維持原意的情況下調整文本。不管給它什麼文本,ChatGPT 都能遵照指示,對內容、形式和風格進行任何調整。它可以保持文本的語意內涵,或根據你的要求加以調整。

  • 管理多語言術語,這點對本地化非常重要。我不知道目前是否能它處理大規模的本地化作業,但在導入特定術語並編輯之前翻譯好的素材 (即使它不是原譯者) 這方面,我覺得 ChatGPT 確實可以做得很好。

  • 偵測冒犯文字。我從美國某聯邦刑事案件摘錄了一些內含種族歧視及恐同內容的簡訊,將其輸入 ChatGPT 後要求它辨識冒犯文字,所得到的結果很不錯,而且它也能夠解釋理由。

  • 執行實體識別 (entity detection)。我要 ChatGPT 執行一個典型的實體識別,並以標記標出找到的實體。雖然它漏失了幾個實體,但多給幾個提示後就能輕易地完成標記。

  • 依分類區分事項。ChatGPT 最令人驚訝的其中一個特點,就是它能夠將一般常識應用在特定情況上。

我們現在知道,你不能仰賴 ChatGPT 說事實或知道什麼是正確的(也就是說內容創作者必須要檢查它是否在亂講話),然而一旦取得我們滿意的有意義文本,ChatGPT 便可以在保持原本意涵的情況下運用或更改其形式或內容。這將是本地化供應商可以善用的能力,因為這樣一來我們就不必從頭打造具意義的內容。讓我們更深入地探討本地化活動的樣貌,以及 ChatGPT 可能會對我們目前的工作產生什麼影響。簡言之,這個生成式 AI:

  • 翻譯技巧嫻熟。以那些擁有龐大語料庫的語言來說,ChatGPT 的翻譯結果跟那些引擎最先進、立即可用的機器翻譯輸出可謂不相上下,某些方面甚至有過之而無不及。

  • 在遵守術語指示上效果頗為卓越。

  • 能夠套用風格指示,而且範圍可大可小。相對而言,要讓機器翻譯引擎正確地執行這類工作,則不是件簡單的事。

  • 頗為擅長將事物區分至特定分類,尤其是文本。這個能力對本地化產業非常有益處,因為我們有時需要將特定的指示套用至特定類型的內容上。

  • 對輸入的文本具有超群的編輯能力,而這正是高品質本地化最重要的一項元素。在審閱及翻譯文本的四大主要環節上,它的表現都很不錯。

  • 有助進行內容分析,可分析文本以利有效的處理、改進或提高 ROI。它能協助我們完成許多事項,包括:預測或防範翻譯品質問題;進行細微調整以便在觸及率、SEO、CTA/CTR 成效等方面有效地獲致成效;改善來源以及目標文本的可讀性等。

  • 能協助我們撰寫與編輯可用的程式碼。頂尖的程式設計師會說,ChatGPT 寫的程式應該遠不及他們優異,看來確實是如此。但是,當我請它寫個 XML 內容擷取程式碼的時候,它倒是產出了我能執行的可用程式碼。因此,非程式設計專業人士可以更輕鬆地運用它建立 (與學習如何建立) 程式碼。

我們需要發展新的技巧與實務來因應 ChatGPT

使用一陣子後,我開始了解 ChatGPT 需要什麼類型的提示。這個特殊的技術只接受自然語言輸入,因此想要將這個技術應用在生產上,我們就必須培養提供有效提示的專業能力。以特定的方式改寫內容,很可能需要連續提多個提示,而每個提示都會執行不同的任務,像是清理、前處理及後處理等。如何在我們的自動化作業程序中使用自然語言提示,以便取得脈絡上相關而且也可合理預測的成果,相信會是個非常有意思的過程。

The nuances of digital tools

接下來該何去何從?

我們現在很明確地知道,這個新的生成式 AI 絕對不容忽視,它很可能會嚴重衝擊到我們這個產業。如果不能化被動為主動,設法引領並帶動這個語言自動化的趨勢,我們將會被後浪遠遠拋在腦後。ChatGPT 能夠更改與註解文本,不但成果媲美一般的人工編輯,執行這些工作的效率可能還更高。對於那些必須具備許多技巧的工作,大概沒有任何一個人類能夠像它一樣辦得到,而且它還可以將自己的知識推廣應用到新的情況。

最重要的是,它似乎有望解決本地化自動化作業中一些懸宕已久的問題。當然,用一些玩樂性質的例子跟它對話是一回事,想要使用它大規模地執行這些動作,又是另一回事。放眼未來,我們應該:

  • 以大量的實際案例進行測試,針對此處探討的各種本地化與編輯工作類型,評估其錯誤率。

  • 針對本地化價值鏈中的宏觀與微觀使用者歷程進行詳細分析,找出這類文本自動化作業可能會對哪些地方造成衝擊。

  • 了解如何提示和提供 ChatGPT 大量的相關脈絡,並記錄可能的錯誤及最佳實務做法。

  • 研發新的自動化工作流程以及人機迴圈 (human-in-the-loop) 編輯工作流程,並以納入這個嶄新 AI 為前提,發想日後該怎麼進行譯後編輯與品管 (QA)。

  • 針對每個可能改善的地方,為本地化公司及客戶設計新的自動化與使用者體驗 (UX) 互動場景。

  • 確認授權、部署費用及維護等相關經濟條件對我們的業務而言是合理的。

關於語言及 Chat GPT 真實世界應用的一些想法

我覺得 ChatGPT 最令人驚訝的其中一點,就是它執行複雜數字運算時步驟幾乎都是正確的,但結果卻還是錯的。這意味著它不會欺騙,它的一切「知識」,真的都是從訓練的語言中學習而來的。事實上,從它對超過特定數量級的某個運算幾乎得出正確結果 (以及數字較小時能得到正確結果) 來看,就可以知道一個語言的語料庫規模如果夠龐大,就能囊括真實世界中具統計顯著性的知識。但這同時也顯示,它需要有專有的形式系統 (例如數學),才能產生對真實世界而言有意義、可靠且正確的資訊。

ChatGPT 是個發人省思的現象,提醒我們一個自我指涉、自我一致 (自洽) 的系統,本身並不能傳達世界的真相,因為後者是獨立於這個系統存在的,而這也呼應了 Gödel 的不完備定理。身為具有意識的人,在一個強加於我們、且我們無法單憑語言定義的現實中,我們是無法將自己的認知,與形塑我們理解世界的形式或物質系統相解離。

與我們聯絡

您有翻譯或本地化專案嗎?需要確保在不超出預算的情況下,正確且迅速地完成這些專案嗎?我們能運用像 ChatGPT 這類創新的生成式 AI 來協助您達成目標。歡迎立即與我們聯絡,深入了解 Lionbridge 的翻譯與本地化服務

linkedin sharing button

產品語言服務主管 Vincent Henderson
作者
產品語言服務主管 Vincent Henderson
  • #technology
  • #blog_posts
  • #translation_localization