言語を選択する:

Black background illuminated by swirls of light, numbers nd letters

言語テクノロジーの未来: 機械翻訳の未来

機械翻訳は進化し続けており、適切に運用すれば翻訳の生産性向上に大きく貢献します

この記事は、テクノロジーの進歩が言語品質にもたらす影響を探るライオンブリッジの「【シリーズ】言語テクノロジーの未来」の第 3 回です。

現代は、かつてないほど膨大な量のコンテンツが量産されており、企業は迅速かつ効率的にコンテンツを翻訳する方法を見つける必要に迫られています。機械翻訳 (MT) は急速に広まっていますが、まだまだ完璧とはいえず、品質の問題は常に避けて通れません。しかし、お客様のローカリゼーションのプロセスを改善することは可能です。 

ライオンブリッジは機械翻訳に影響を与える要因を見つけ出し、機械翻訳テクノロジーを最大限に活用してお客様のローカライズ戦略にメリットをもたらす方法をお伝えします。

機械翻訳 (MT) とは

機械翻訳とは、原文を別の言語に自動的に翻訳する技術です。翻訳者は関与せず、機械が翻訳を行います。機械翻訳は比較的新しい概念ですが、実は登場してから数十年が経過しています。 

SYSTRAN は 1960 年代後期に機械翻訳システムを開発した先駆的な企業の一社で、米国空軍と提携し、冷戦中の機密情報の翻訳を手掛けました。その目的は、人間の翻訳者がその意味を十分に理解でき、翻訳を簡単に改善できるよう機械にコンテンツを翻訳させることです。当時の機械翻訳エンジンでは、機械翻訳を実行するために開発されたルールや辞書に基づいて翻訳を処理していました。それに比べ、現在では言語テクノロジーが飛躍的に進歩しています。   

機械翻訳の進化に影響を与えた要因

統計モデルおよびハイブリッド エンジン

機械翻訳の開発は主に 1990 年代に行われ、IBM などの企業が統計モデルを採用し、翻訳品質が著しく向上しました。統計的機械翻訳 (SMT) エンジンは当時の最新技術で、高度な統計メソッドとインターネットの膨大なデータを活用し、増え続ける大量のコンテンツを翻訳することを特徴としています。後に Google は、このテクノロジーを大規模に採用し、すべての人間の知識を検索可能にしようと試みました。  

初期の統計的機械翻訳エンジンはルール ベースのエンジンよりも優れていましたが、まだ多くのエラーがありました。そこで、各企業は、統計的機械翻訳にルール ベースの機械翻訳を組み合わせたハイブリッド機械翻訳エンジンの実験を開始します。これらの技術革新は、機械翻訳テクノロジーを世に知らしめ、世界規模の採用へと繋がりました。 

ニューラル機械翻訳

2017 年にニューラル機械翻訳 (NMT) が登場し、機械翻訳は新たに飛躍的な進歩を遂げました。ニューラル機械翻訳は、人工知能 (AI) を活用し、ニューラル ネットワークを使用して翻訳を生成する機械翻訳の手法です。 

前述のメソッドとは対象的に、ニューラル ネットワークは、起こりそうな結果を「推量」するのではなく、翻訳者の思考プロセスそのものを模倣します。その結果、より自然な翻訳となり、センテンスの意味やニュアンスをより正確に捉えられるようになりました。ニューラル機械翻訳の開発によって機械翻訳は実用的な技術となり、膨大な量の文書を理解したり要点を把握したりするだけでなく、ミッションクリティカルではない一般的なビジネス文書にも対応できるようになりました。 

また、ニューラル機械翻訳は、自動翻訳の読み難さや、韓国語をはじめとする特定言語との非互換性の問題など、長らく存在した機械翻訳の欠点を解消しました。ニューラル機械翻訳を改善する取り組みは現在でも続けられています。ニューラル機械翻訳について詳しくは、当社のブロク記事「ニューラル機械翻訳: 言語を翻訳する際に人工知能 (AI) が果たす役割」をご覧ください。  

Smiling man looking at laptop screen

ニューラル機械翻訳の改善度合い

ライオンブリッジの研究開発チームの見積もりでは、ニューラル機械翻訳は毎年 3 ~ 7% 改善されています。当社のエキスパートは、編集距離 (ED) と呼ばれる測定方法で改善率を数値化しています。編集距離は、機械翻訳の出力に対して、翻訳者による翻訳品質と同等にするために人間が行わなければならない編集の数を算出するものです。

ニューラル機械翻訳は、翻訳サービスの需要が増加し、マシン ラーニングが自動学習型のニューラル機械翻訳エンジンで改善されるにつれて、これからも進化し続けるでしょう。

ニューラル機械翻訳の将来の採用率を牽引する要素とは

ローカリゼーションを必要とするコンテンツが急増するにつれて、ニューラル機械翻訳は将来急速に普及すると予想されています。

新型コロナウイルス (COVID-19) による危機が多くのビジネスのデジタル変革を加速し、より多くの翻訳サービスが必要とされるようになりました。それと同時に、コンテンツの目的を明確にしつつ多様化させる必要が生じています。市場の現状を鑑みるに、人間が翻訳品質を管理するしないに関わらず、コンテンツを翻訳する際に機械翻訳を使用する機会は今後増えていくはずです。

人間が介入することで品質を向上させる仕組みとして、「機械翻訳 + ポストエディット (MTPE)」という手法があります。機械翻訳に翻訳者による翻訳を組み合わせたハイブリッドな手法です。ポストエディットでは、機械翻訳プロセスに従って翻訳されたテキストの品質を改善していきます。詳細については、当社のブログ記事「機械翻訳 + ポストエディットを導入すべきケース」をご覧ください。

ニューラル機械翻訳の採用率が翻訳サービスにどのような影響を与えるか

ニューラル機械翻訳を導入すれば、企業は少なくともいくつかの言語において翻訳サービスのコストを低減できます。コストを削減することによって参入できる市場の数が増え、対象となる市場に製品をすばやく送り込むことができるようにもなるはずです。

ニューラル機械翻訳を採用すると、グローバル経済が内包するデジタル変革は避けて通れないため、競合はこれまで以上に増加することになるでしょう。エンドユーザーは、製品に関する情報を母国語で受け取ることを益々求めるようになります。参入を図るすべての市場でユーザーの要望に応えるのは、例外的なことではなく、むしろ当たり前となっていくことが予想されます。

自動化ツールキット: 翻訳メモリとは何か

翻訳の自動化という点において、翻訳ツールキットにはの機械翻訳以外のツールも存在します。翻訳メモリ (TM) は機械翻訳が登場する前から存在していたテクノロジーで、これまでローカリゼーションにおいて重要な役割を担い、今後も引き続き活用されていくでしょう。機械翻訳と翻訳メモリは組み合わせて使用することがほとんどですが、翻訳メモリの役割は今、変化の時を迎えています。 

1990 年代の始めに開発された翻訳メモリは、過去の翻訳のデータベースとして、新規のコンテンツを翻訳する際の負荷を減らす目的で利用されてきました。 

翻訳メモリは、コンピューター支援翻訳 (CAT) ツールまたは翻訳メモリツール (TM ツール) を介して実装されています。これらのツールを使用すれば、対象となるコンテンツを複数の翻訳者で分担して翻訳しているときに、同じコンテンツ内で一度翻訳された言葉やフレーズが別の箇所で出現した場合、同じ翻訳を流用することができます。

翻訳メモリの利用することで得られるメリットは次の通りです。

  • 用語に対する翻訳の一貫性を確保
  • コストの削減
  • 翻訳プロセスのスピードと生産性を向上

歴史的に見て、翻訳メモリによるコスト削減効果は高く、特筆するに値します。

Woman wearing glasses and sitting on couch looks away from her laptop

機械翻訳と翻訳メモリの違い

機械翻訳と翻訳メモリは両者とも翻訳プロセスを自動化するための手段であることに違いはありませんが、その実体は大きく異なります。 

翻訳メモリは過去の翻訳のレポジトリやデータベースとして機能するため、原文の文章全体または文章の一部と照合することによって翻訳を生成するという観点から見ると、受動的な役割とならざるを得ません。それに比べ、機械翻訳はテクノロジーとしてはるかに洗練されています。機械翻訳は、過去の翻訳に加え、自然な言語処理を行うための様々な技術を活用することにより、原文に対して考えられる翻訳を積極的に提示します。

両者のテクノロジーは互いに補い合う存在だといえるでしょう。同時に、これらのテクノロジーは翻訳者による翻訳の効率を高め、生産性向上に寄与します。用語に対する翻訳の一貫性を確保するなど、品質面でもメリットがあります。これらのテクノロジーは、高品質の翻訳を提供するために緊密に統合されており、相互に連携して動作します。 

機械翻訳と翻訳メモリのテクノロジーはいかにして相互に発展を遂げてきたか 

この数年間、様々な企業が機械翻訳と翻訳メモリを自社の翻訳案件に利用しており、企業の注目が実務の遂行とテクノロジーの効果的な実装に注がれるようになってきました。

機械翻訳は翻訳メモリをはるかに凌ぐ効率を誇るものの、その定義はある種の翻訳メモリに基づいているという事実により、2 つのテクノロジーは次第に混ざり合うようになってきています。しかし、機械翻訳は翻訳の生産性を高める主要なツールとして、多くの翻訳支援ツールに搭載され始めています。 

翻訳業界およびローカリゼーション業界における主要な生産性向上ツールとして機械翻訳テクノロジーが台頭したことで、翻訳メモリの役割は変化しようとしているのです。翻訳メモリは今後、機械翻訳エンジンをトレーニングするためのツールという側面が強くなり、従来の翻訳データベースとしての役割は影を潜めていくことになるでしょう。 

機械翻訳のメリットとは

人がチェックしていない実行直後の機械翻訳は、顧客の目に触れにくい比較的シンプルな文章に最適です。従来、このような機械翻訳は、レビューやフォーラム、eBay をはじめとするオークションなど、ユーザーが作成したコンテンツに対して実装されてきました。品質に対する期待値、コンテンツの種類および目的によっては、機械翻訳がめざましい働きをすることもあります。翻訳対象がシンプルで一般的な内容のビジネス文書であり、ターゲット言語との相性が良い場合です。機械翻訳の使用機会を増やせば、企業のメリットも大きくなります。翻訳メモリを使用することで得られるメリットに似ていますが、より顕著な効果をもたらすといえるでしょう。具体的には以下の通りです。

  • コンテンツをよりすばやく市場に投入可能
  • 用語の一貫性を確保
  • 翻訳の生産性を大幅に向上
  • 翻訳にかかるコストを低減

重要なのは、翻訳者の数は限られているという事実です。機械翻訳によって特定の業務にかかる時間を減らすことができれば、その分自由になる時間が増え、他のプロジェクトにも取り組めるようになります。それによって、市場に増え続ける同業他社の圧力を低減することもできるでしょう。 

機械翻訳によって、翻訳者の作業効率はときに 3 ~ 5 倍になることもあります。少ない時間でより多くのコンテンツをローカライズできるようになるのです。生産性の向上とコストの削減により、今後はより多くのコンテンツをより多くの言語に翻訳することが可能となっていくでしょう。 

機械翻訳テクノロジーはお客様のローカリゼーション戦略にどのように影響を及ぼすか 

コンテンツ戦略を設計し、参入する市場を選定する場合、注意しなくてはならないのは、機械翻訳と関連する現代的なテクノロジーを使用することで効率がどう変わるかです。

経験豊富な言語サービス プロバイダー (LSP) と提携すれば、機械翻訳を実装することによって期待する成果を得ることができるでしょう。重要なのは、業務提携によってコンテンツの制作と改善を図れるだけでなく、市場参入の戦略も開発できるようになるということ。ライオンブリッジをはじめとする LSPは、デジタル マーケティングの分野に積極的に参入しており、ローカリゼーション関連のコンテンツだけでなく、コンテンツ全体の管理をサポートするようになってきています。 

強力なローカリゼーション パートナーの手引きによってローカリゼーション戦略を綿密に練り上げ、実行に移せば、機械翻訳テクノロジーのメリットを存分に享受することができるでしょう。そうすれば御社のリソースをさらに解放し、他のコンテンツを作成したり、予算を増やすことなく参入市場を増やしたりすることもできるようになります。 

以下の画像をクリックして、機械翻訳を理解するための主な定義をご覧ください。 
 

お問い合わせください

機械翻訳サービスの全体について詳しくは、機械翻訳について説明した当社のホワイトペーパーをご覧ください。機械翻訳、翻訳メモリ、翻訳者による翻訳を組み合わせ、自社に最適な効果を得ることに興味をお持ちの方は、ぜひ当社までお問い合わせください

勤務先のメール アドレスを入力してください
以下のチェック ボックスをオンにすると、ライオンブリッジからの電子メールを受け取ることに同意いただいたものとして、言語サービスに関するベスト プラクティス、マーケット動向などの最新情報をお受け取りいただけます。

登録解除、および個人データの扱いについては、ライオンブリッジのプライバシー ポリシーをご覧ください。

linkedin sharing button
  • #retail
  • #translation_localization
  • #resources
  • #blog_posts

カジェタン マリノフスキーおよびジャネット マンデル
著者
カジェタン マリノフスキーおよびジャネット マンデル