言語を選択する:

Binary code around and emanating from a globe

機械翻訳 (MT) におけるフォーマル/カジュアルな言葉遣い

機械翻訳の訳文のフォーマルさを適宜調整することで、世界中のオーディエンスとのつながりを強化

突然ですが、面白い映画について友達に話している状況を想像してください。次に、同じ映画について大企業の社長に話している状況を想像してください。あなたは同じ言葉や表現を使うでしょうか。そんなことはまずないでしょう。人はフォーマルな言葉遣いとカジュアルな言葉遣いを使い分ける状況を適切に判断できますが、機械翻訳 (MT) エンジンでは、何らかの支援がなければそういった判断ができないというのが定説です。 

対象オーディエンスとの関係を構築・強化するには、この MT の限界を認識し、それを克服するための対策を取ることが重要です。

言葉遣いにおける「フォーマルさの度合い」とは

私たちは社会文化的な文脈、習慣、コミュニケーション手段に応じて言語のトーン (語調) やスタイルを使い分けます。「フォーマルさの度合いに応じて表現方法を変える」という言い方もできます。先に挙げたように、私たちは、相手が友達の場合と会社の社長の場合に同じように話すことはありません。

フォーマルさの度合い、つまり言葉遣いがフォーマルかカジュアルかで対話のトーンが決まります。言語、国、社会集団、または職業環境が変われば文体や慣用表現、代名詞の種類、動詞の語形も異なり、それぞれフォーマルさの度合いも異なると考えられます。

フォーマルまたはカジュアルな言葉遣いの度合いを適切に判断する方法 (書き言葉の場合) 

コンテンツの文章を書く際は、以下の質問を考慮することで適切なフォーマルさを判断してください。

  • オーディエンスとコミュニケーションを取る意図は何か。
  • オーディエンスが自社製品を使用する際にどう感じてほしいか。

  • 具体的なオーディエンス像があるか。

コンテンツの翻訳に際しては、対象のオーディエンス像、当該案件のコンテキスト、想定されるトーンとフォーマルさの度合いを含む翻訳スタイルガイドをお客様側で作成するのが一般的です。

機械翻訳エンジンがフォーマルさの度合いを適切に判断するのが苦手な理由

全般的に、MT エンジンでは対象言語 (ターゲット言語) の訳文で一貫性のあるフォーマル表現を維持することが容易ではなく、特に、元の言語よりも多様なレベルのフォーマル表現が存在する言語に訳す場合は非常に難しくなります。 

MT モデルでは通常、入力セグメントごとに 1 つの翻訳が返されることが原因です。入力セグメントに曖昧さがある場合は、妥当な選択肢の中から 1 つの翻訳が選ばれますが、このときに対象のオーディエンスについては考慮されません。

このように、妥当性のある複数の訳文の 1 つをモデルに選択させることで、翻訳の一貫性が損なわれる場合や、フォーマルさの度合いが適切でない訳文が生成される状況が発生します。 

Geometric shapes and patterns on a dark background

翻訳でフォーマル/カジュアルな言葉遣いが重要な理由 

コンテンツの訳文のフォーマルさが適切であるかどうかは非常に重要です。 

文化によっては、適切な度合いのフォーマル表現を用いていないコンテンツは失礼にあたる可能性があります。逆に、フォーマルな言葉遣いがふさわしくない事例も多数あります。多くの場合は、それが不快だからではなく、単に状況にそぐわないことが理由です。こういった誤認識や表現のギャップにより、オーディエンスが離れてしまう可能性もあります。たとえば、コンピューター ゲームや学生向けのプログラムの翻訳では、フォーマルな表現よりもカジュアルなトーンが適していると言えます。 

また、コンテンツの翻訳にあたり、企業が費用や手間を惜しまずに対象オーディエンスに適したスタイルを取り入れる努力をすることで、顧客を重視しているという暗示的なメッセージを対象市場に届けることにもつながります。こういった努力は潜在的顧客の注意も引き、効果的なアピールとなり得ます。多くのオーディエンスと効果的に関係を構築・強化できれば、成果にもつながります。

特に機械翻訳でフォーマルさの度合いをオーディエンスに合わせることが難しい理由

翻訳の際、特に機械翻訳を利用している場合には、訳文のフォーマルさの度合いを対象オーディエンスに合わせることが難しいことがあります。この問題が生じるのは、特に文法上、フォーマルさに複数のレベルが存在する言語に向けて翻訳する場合です。 

フォーマルさの違いを文法的および語彙的にどのように表現するかは、言語によって大きく異なります。 

一部の言語では、フォーマルさの度合いを示す方法がより明確に定められています。たとえば、スペイン語では "tú" と "usted"、ドイツ語では "du" と "Sie"、フランス語では "tu" と "vous" を使い分けます。いずれの言語も一つ目がカジュアルな二人称、二つ目がフォーマルな二人称です。中国語についても、繁体字と簡体字の両方でこういった区別が存在します。また、韓国語にはフォーマルさの度合いが少なくとも 6 段階あります。日本語やその他の言語では、本動詞の語形変化、一部の名詞や形容詞、特定の語彙的な選択などによって区別し、丁寧な言葉遣いを表現することがあります。

英語などのその他の言語ではこれらの違いを示す代名詞がないので、コンテキストに沿ってこの概念を表現する必要があります。 

これにより、ほとんどの MT エンジンで、訳文でのフォーマル/カジュアルな表現に一貫性を持たせることができないという問題が生じます。 

機械翻訳におけるフォーマルさの度合いを制御する方法 

複数の対策を講じることで、MT システムでさまざまな度合いのフォーマルなスタイルを生成できるようになります。

ルールに基づく手法

ルールに基づく手法により、機械翻訳のスタイルやフォーマルさを統一できます。 これらのルールにより、望ましくないスタイルの要素は、その意味は維持されつつも、サードパーティ製 MT システムによって返された正しい翻訳に置き換えられます。

ルールに基づかない手法 

ルールに基づかない手法を使用して、スタイルやフォーマルさが統一された訳文を生成するカスタム機械翻訳モデルを開発するという選択肢もあります。このアプローチでは教師ありトレーニングを実施し、コーパス セットで丁寧さに関する注釈付けを行うことで、丁寧さに関する特徴を取り込みます。  

多様なデータでトレーニングし、指定したフォーマルさに合わせて結果を生成できるシステムの構築を目指します。

Binary code in sunburst pattern

フォーマル/カジュアルな言葉遣いを制御できる商用 MT システムとは 

現在、ほとんどの MT システムはフォーマルさの度合いや性別の違いに対応していませんが、一部のエンジンではこういった違いに対応しており、当社では、こういった機能に対する需要が今後ますます高まると予測しています。 

現時点では、DeepL (API) と Amazon (コンソールおよび SDK) に、一部の言語の翻訳においてフォーマルさの度合いを制御できる機能が確認されています。 

出力 (訳文) のフォーマルさの度合いは、3 つのオプション (デフォルト、フォーマル、カジュアル) で制御されます。

デフォルトでは、ニューラル機械翻訳 (NMT) 出力のフォーマルさの度合いは変更されません。フォーマル/カジュアルのオプションでは、ユーザーがフォーマルまたはカジュアルなトーンを選択できます。具体的には、この機能では、翻訳で使用される代名詞と関連する単語を設定します。 

適切なフォーマルさの MT 翻訳を実現するライオンブリッジのソリューション 

当社のエンタープライズ向け機械翻訳ソリューション Smart MT™ では、ターゲット言語のテキストに対して言語ルールを適用でき、スタイルやフォーマルさの度合いを指定して機械翻訳を生成することができます。 

当社の専門家によって最新の状態に維持されたルール データベースを MT 出力の解析に適用し、MT 出力を制御します。 

十分なコンテンツがある場合は、ルールベースの手法とカスタム機械翻訳モデルを組み合わせることで最適な結果を得られます。 

お問い合わせ

ライオンブリッジの次世代機械翻訳テクノロジーや、機械翻訳を最大限に活用するための当社の支援サービスについてご興味・ご質問があれば、ぜひ当社までお問い合わせください。 

linkedin sharing button

著者
ヨランダ マーティン、ジャネット マンデル
  • #technology
  • #blog_posts
  • #translation_localization