
翻訳メモリテクノロジーの未来
専門知識を持つエキスパート2人をSDL社内からご紹介します。Product Management部門DirectorのDaniel BrockmannとPrincipal Research EngineerのKevin Flanaganです。Danielは翻訳業界で長年の経験を積んだベテランであり、Kevinはソフトウェア開発と翻訳の両分野を専門としています。
DanielとKevinには、最初にTMの将来の役割について考えを聞きました。そこから本題に入り、今おそらく最も注目を浴びている人工知能(AI)の話題を取り上げました。
AIは将来、翻訳メモリに対してどのような役割を果たすと思いますか?
DB:AIと機械学習は、SiriやAlexa、自動運転、個人健康管理など、誰もが関心を持っている話題です。AIは急速に進歩しています。SDLは、機械学習ではすでにある程度の開発経験があり、2016年には革新的な自己学習型Adaptive MTテクノロジーを発表しました。しかし問題は、それが翻訳メモリにとってどのような意味があるのかということです。想定されるシナリオは、AIが翻訳の生産性をさらに高め、翻訳支援ツールの中核になるというものです。
ここで具体的な側面として挙げられるのが、訳文候補の品質向上です。例えば、翻訳メモリに用語集やニューラル機械翻訳(NMT)を組み合わせることで、いちから翻訳するよりも、常に最も一致率の高い訳文を取得してレビューできるようになると考えられます。その一例が、NMTエンジンを特定分野の膨大なTMや用語ベースでトレーニングし、個々のユースケースにさらに特化してNMTの品質を向上させるというものです。また、NMTの結果を翻訳メモリと用語集のコンテンツで補強し、それぞれの長所をすべて活かすという構想もあります。
いずれにしても、目的は翻訳者の代わりになることではなく、翻訳者をサポートすることであり、これによって翻訳者は翻訳プロセスをより効率的に管理し、最初の訳文をきめ細かく調整できるようになります。
KF:AIは、翻訳者の生産性の中心的なユースケース以外に、プロジェクトの効率化にも役立ちます。TMの解析を実行したり、新規プロジェクトに最も関連性の高いTMを判断したりすることが可能です。複数のプロジェクトやリソースを同時に扱っているプロジェクトマネージャーにとって、これは極めて有益です。コンテンツをプロジェクトのサプライチェーンにさらに効率的に割り当てることも可能になります。
翻訳メモリは将来、クラウドでどのように機能するのでしょうか?それにはどのようなメリットがありますか?
DB:クラウドベースでTMを利用することで、サプライチェーンのすべてのメンバーにまったく新しい可能性が広がります。最終的に、TMの共有は共通化されるでしょう。共同で作業する個人翻訳者のグループや、資産をより簡単に共有できる翻訳会社、大型の翻訳プロジェクトを動かす大企業など、誰もがTMを利用できるようになるのです。こうした作業方法を、機能豊富で強力なデスクトップ環境に統合できる者が、このレースの勝者になれます。例えば、SDL Trados Studioの最新機能LookAheadは、ハードディスク上のローカルTMを使った作業に勝るとも劣らないパフォーマンスをクラウドベースのTMで発揮します。
強化された翻訳環境でTMはどのように機能するでしょうか?
DB:翻訳者がより簡単かつ効率的に作業できるように、現在3つの主なリソースが用意されています。1つ目は、100%一致やコンテキスト一致を最も重視する従来のTMです。2つ目は、従来の用語集管理です。翻訳の品質と一貫性を用語レベルで確保するためのものです。そして3つ目が、ニューラル機械翻訳(NMT)です。NMTにより、それをすぐに利用できる言語ペアにおいて、機械翻訳は「余裕を持って」翻訳フローに完全かつシームレスに組み込めるようになりました。特に翻訳発注者と翻訳受注者の両者にますます受け入れられるようになっています。
これらの3つのリソースを連係させて使用しているとしましょう。用語によってNMTの訳文候補を強化したり、NMTのフラグメントによってあいまい一致を補強するといったことが可能になります。とても素晴らしい未来像です。有効利用の期間が数十年ではなく数年であっても、高品質なTMを作成し、それを高品質な用語集、そしてまさにシフトが起こっている高品質な機械翻訳と連係させて使用する価値はあります。ここでは、すべての翻訳が機械によって完璧に出力されるわけではありません。逆に、NMTによって自然な翻訳候補が提示されている場合は、極めて注意が必要になります。自然な表現が必ずしも正確であるとは限りません。ここに翻訳者やレビュアーが関与し、できるだけ注意を払って、翻訳に顧客が期待する高い品質を確保できるようにする必要があります。
いろいろと述べてきましたが、NMTは、あらゆる翻訳フローに対応する画期的な新ツールであることに間違いはありません。
翻訳メモリとニューラル機械翻訳、どちらが将来有望でしょうか?
DB:今後、あいまい一致の新しい処理方法が登場する可能性があります。これは何を意味するのでしょうか?NMTの訳文候補は、編集が一切不要なものもあり、編集が必要な70%~80%のあいまい一致だけでなく「修正済み」のあいまい一致よりも品質が優れている場合があります。したがって将来は、TM = 100%と90%以上のあいまい一致に最適、NMT = 90%以下のあいまい一致に最適という流れになりそうです。これはもちろん、長期的な価格モデルにも影響を与えます。NMTエンジンによって新規コンテンツが手頃な価格で適切に翻訳されるようになれば、翻訳発注者はディスカウントを求めるのではないでしょうか?翻訳受注者はすぐにそれを受け入れられるでしょうか?両者が合意に至るために共同でできる作業はあるでしょうか?
こうした予算関係の疑問に加え、現在の編集環境をTMとNMTを組み合わせた作業用に最適化できるかという疑問も出てきます。
短期的に見れば、SDL Trados Studioなどのオープンプラットフォームの翻訳支援ツール環境は、「どんな」NMTエンジンにも組み込むことができ、既知の方法で作業を継続できる点は素晴らしいと言えます。これらの環境は状況にうまく適応し、ユーザーが使用してきたなじみのあるリソースの組み合わせにNMTを違和感なく追加することができます。こうしたリソースは決して過小評価できません。また、現在のNMTエンジンは分節レベルで機能します。これはつまり、分節ベースの作業にスムーズに適応するということです。
要約すると、少なくとも短期的には、SDL Trados Studioのような翻訳支援ツールは、NMTに簡単に「組み込む」のに最適であるということです。
KF:もっと高い品質が求められるようになった場合、長期的に見ると、グリッドベースのエディタを再検討する必要が出てくるでしょう。状況に応じて、異なる編集環境を新しい作業方法に合わせて最適化し、NMTコンテンツのレビュー用に最適化します。いちからの翻訳のために多くの機能を搭載することはありません。以前と同じやり方は不要になります。ただし移行段階では、SDL Trados StudioでNMTをリソースの組み合わせに追加するだけで、この方法で最適な生産性とコスト削減を実現しているという話をお客様から聞いています。
将来、翻訳メモリを使用する際のユーザー体験を向上させるにはどうすればよいでしょうか?
KF:編集環境を再検討するとともに、将来TMに対してよりドキュメント重視のアプローチを取ることを考えています。これによって、TMで一致する訳文について元のドキュメントと翻訳を詳細に調べ、ドキュメント全体のコンテキストを確認できます。
また、TMに対してよりナレッジベースのアプローチを取ることも検討します。単にできるだけ多くの単語が一致している翻訳一致を探すのではなく、適切な翻訳一致が見つからない場合に「最も重要なコンセプト」や用語に注目し、分節の逐語訳ではなくコンセプトや用語に関する情報を提示しているTMの翻訳一致を探すことで、それらを理解(および翻訳)できるようになります。
upLiftの将来の展望は?
KF:upLIFT翻訳メモリは、継続的に改善される機能です。サブ分節の訳文候補、いわゆる「フラグメント」の品質は、単語の整合機能の向上によって高まります。一致の修正ケースの処理も改善されます。また、以下についても検討します。
- upLIFT TMテクノロジーによって、訳文候補の品質を向上させるとともに、適切な用語抽出のためのベースを提供
- upLIFTのビルディングブロックを利用して自動タグ配置機能(一致の修正にも対応)を開発
- upLIFTの単語整合結果に基づくスマートなTM管理により、誤訳、データ破損、ドキュメント/分節の不整合を特定
お読みいただいたとおり、翻訳メモリのテクノロジーには、AIからNMT、クラウドまで、将来有望で画期的な開発が多数存在します。最も興味のあることや、翻訳メモリの将来について、ぜひ以下のコメント欄からご意見をお聞かせください。
翻訳メモリについて詳しくは、SDLの翻訳メモリハブをご参照ください。TMに関する必要な情報がすべて揃っています。