翻訳メモリテクノロジーの過去と現在

Camille Avila 2019年2月6日 読了目安時間:10分

翻訳メモリという概念が誕生したのは1970年代初頭。1980年代になると、それがさらに発展しました。しかし、SDLの翻訳メモリが形になったのは1990年代に入ってから。Windows版Translator Workbenchの誕生によってです。これは本当の意味で幅広く普及したTMエンジンの第1号となり、1995年に16ビット版、1998年には32ビット版が登場しました(前世代のDOS版も90年代初頭にある程度普及していましたが、ユーザーは非常に少数でした)。

なぜ飛躍的に普及したのでしょうか?当時、機械翻訳は進化中ではありましたが、品質はあまりにもお粗末でした。また、Windows PCが組織や家庭に本格的に普及し、個人翻訳者も組織の翻訳者も、デジタルコンテンツの増加に対応するため、テクノロジーを積極的に取り入れ始めました。さらに、特定のニーズを持つオーディエンス専用のソリューションを提供することが、大きな支持を得るきっかけとなりました。たとえば、Freelanceエディションの登場です。

翻訳メモリは翻訳支援ソフトウェアの心臓であり脳であるとも言えます。ところが、このテクノロジーは当初、懐疑的に見られていました。今では、翻訳メモリのない環境など想像できません。Tradosは1990年代から翻訳メモリの開発を続け、お客様にとっての使いやすさを常に追求してきました。


翻訳メモリの進化

SDLは2005年にTradosを買収し、翻訳メモリを根本から見直してTrados StudioTrados GroupShareを生み出しました。当時の重要な目的の1つが、それまでお客様からWorkbench TMエンジンに寄せられていた要望に応えることでした。これには、訳文言語での訳語検索、コンテキスト一致や構造一致の概念の採用、完全なXML規格エンジンなどがあります。


翻訳メモリ機能の拡張

Tradosの翻訳メモリは汎用性が非常に高く、生産性を強化する機能を提供するために何年もかけて進化してきました。たとえばAutoSuggest辞書です。

AutoSuggest辞書は、翻訳メモリコンテンツから作成され、翻訳作業中にAutoSuggestを通じて語句やフラグメントを翻訳者に提案します。訳語検索もあります。これは、用語ベースなどから一致として検出されない単語やテキストを翻訳メモリで検索する機能です。

AutoSuggest辞書と訳語検索は翻訳支援ソフトウェアを日常的に使用するユーザーにおなじみの機能ですが、SDLのTMの進化に伴い、その他にもあまり知られていない非常に便利で高度な機能が追加されています。

Tradosの翻訳メモリは分節ベースですが、段落ベースの分節化にも対応します。これは、アジア言語のような、文の構造が欧米言語と異なり、分節単位ではなく段落単位のほうが翻訳しやすい言語で便利です。興味深いことに、段落ベースの分節化がニューラル機械翻訳(NMT)によって若干復活してきているようです。段落ベースであれば、分節単位で翻訳するのではなく、段落全体のコンテキストを確認しながら翻訳できるためです。

Trados独自の機能として、ドキュメント構造を利用し、TM内でコンテキストを提供することもできます。単にコンテキスト一致を判別するだけでなく、ドキュメント内の構造的なコンテキスト(索引マーカー、見出し、リストアイテムなど)も考慮できるのです。構造的なコンテキストに応じて、分節の翻訳を変えなければならないことがあります。たとえば、英語では索引エントリーを小文字で記述しますが、見出しでは同じ内容の分節を大文字にする必要があります。


柔軟性

Tradosの翻訳メモリの柔軟性は、翻訳業界唯一のアプリストアに現れています。Trados Studio自体にもTMを管理、維持するさまざまな仕組みが用意されていますが、各種アプリを導入することで、さらに高度な作業方法が実現します。たとえば、次のようなアプリを使用すると、原文テキスト、訳文テキスト、原文&訳文テキストをさまざまなファイル形式に変換できます。

  1. SDLXliff2Tmx
  2. TmConvert

データとデータ保護への関心データ高まっています。AppStoreからダウンロードできる「Trados Data Protection Suite」アプリを使用すれば、TM内のデータを匿名化することもできます。


拡張性

Tradosでは常に「規模への対応」を重視しています。つまり、翻訳メモリでは、数百人ものユーザーが同時アクセスできるように規模を拡大できることだけでなく、インターネットに接続せずにローカルで作業する個人ユーザーにも配慮することが同じように重要なのです。

どのような場合でも、優れた操作性とパフォーマンスが欠かせません。これを実現するには、さまざまなストレージメカニズムや作業方法を可能にするソフトウェアの設計アプローチが必要です。Tradosではこのアプローチを、ローカルデスクトップ環境で作業する「ファイルベース」と、複数のユーザーが同じリソースを同時に共有する「サーバーベース」に分けています。

TradosのファイルベースのTMは個人ユーザーや最大3名の小規模チームに、サーバーベースはそれ以上の規模のチームに最適で、それぞれに適した効率性をもたらします。

TradosのサーバーベースのTMは、数百人のユーザー(Trados StudioとTrados GroupShare)に対応でき、一元管理された翻訳メモリに対して統制されたアクセス権を期間限定で提供することで、より一貫した翻訳を実現します。翻訳作業中に資産をリアルタイムで共有できるため、コンテンツの再利用率が、デスクトップのみの環境では実現しないレベルに向上します。

生産性を向上する機能が強化されたファイルベースの翻訳メモリとサーバーベースの共有の両方を提供するため、TMによる共同作業をお客様の状況に応じて進められます。つまり、個人翻訳者にも、短納期で大量の翻訳プロジェクトに対処しなければならない翻訳会社や企業にも対応できます。


upLIFT翻訳メモリテクノロジーの登場

長年にわたるTMの進化を経て、Tradosにとって大きな節目となったのがTrados Studio 2017のリリースです。翻訳支援ソフトウェアの主要機能をよりインテリジェントにするupLIFTテクノロジーが登場しました。

冒頭で、生産性の高いTM拡張機能としてAutoSuggest辞書と訳語検索を取り上げましたが、設定と作業を手動で行わなければならないという欠点がありました。それを変えたのがupLIFTテクノロジー、つまり「Fragment Recall」です。

Fragment Recallを支えるテクノロジーが、高精度の整合というプロセスです。TMは整合済みの分節ペア(翻訳単位:TU)から構成されています。よって、分節のあいまい一致や保存されている提案訳の取得といった分節レベルの処理は簡単です。これに対し、TU分節の一部分(1文内の語句や用語など)の一致や訳文の対応する部分の取得など、分節レベルよりも細かい処理は、より複雑になってきます。Trados Studio 2017がこれを変えました。Fragment Recallにより、ユーザーが何も操作しなくてもTU全体のフラグメントを自動的に確認できるようになったのです。

2016年のリリース以降、Fragment Recallはさらに高度になり、精度が向上しています。現在では、フラグメント一致のソースをアイコンチップで確認することや、Trados Studioのあいまい一致の修正機能によって自動修正されたあいまい一致を却下することもできます。

機能強化はこれで終わりではありません。Trados Studio 2017 Service Release 1ではLookAheadという新機能が登場しました。翻訳メモリ(TM)の検索結果をバックグラウンドで取得することで、検索結果にこれまでよりも速くアクセスできるようにする機能です。翻訳作業中に分節を移動すると、その分節を翻訳している間にTrados Studioが次の2分節の検索を実行するのです。これにより、検索結果(存在する場合)が事前に取得されているため、分節を移動するたびに検索結果がほぼ瞬時に表示されるという利点があります。


新しいコンテンツの追加が簡単

もちろん、翻訳メモリの管理や操作は重要ですが、コンテンツの追加登録も同様に重要です。

翻訳支援ソフトウェアの使用経験に関係なく、既存のコンテンツから翻訳メモリを作成できる翻訳の整合は、翻訳資産を即座に作成できる効率性に優れた手法です。Trados Studio 2019 Service Release 1では、新しい選択機能と接続機能が追加され、分割機能と検索機能が強化されたことで、整合プロセスの汎用性と操作性が大幅に向上しています。


翻訳メモリ機能がさらに向上

コンテキスト一致とあいまい一致の精度を高め、翻訳一致がこれまで以上に多くなりました。コンテキスト一致の算出方法を改善して一致の精度を向上させただけでなく、ヨーロッパ言語の語幹解釈を強化し、あいまい一致の質も向上しています。

さらに、日本語の半角文字と全角文字をより正確に認識できるようにしました。この点はDTPでよく問題になることから、日本語の市場において大きな進歩だと思います。

この最新のService Releaseは、TMの改良に終わりはなく、強化の余地が尽きないことを示しています。Trados Studio 2019では、AutoSuggest、upLIFT Fragment Recall、あいまい一致の修正などの大々的なイノベーションを語幹解釈の強化やあいまい一致の質の向上などの細かな進化と組み合わせることで、TMの活用率が劇的に向上しています。

これまでご説明したように、翻訳メモリは長い年月をかけて進化してきました。今後も、新たなイノベーションや機能を取り込んで進化を続け、TMの使用と管理がさらに容易になることでしょう。

タグ
Trados Studio
Camille Avila
制作者

Camille Avila

Product Marketing Manager
Camille Avilaは、翻訳業界で8年間の経験を持つRWSのSenior Product Marketing Managerです。現在、Trados製品スイートを統括しています。法人市場向けのローカリゼーションに取り組むCamilleの主な役割は、コンテンツを確実に理解されるようにして顧客との効果的なコミュニケーションを支援することです。
この執筆者の全記事: Camille Avila