バイリンガルの翻訳環境で多言語コンテンツを処理する 

バイリンガルの翻訳環境で多言語コンテンツを処理する 

Patrick Andrew Hartnetのこのブログでは、バイリンガルの翻訳環境で多言語コンテンツを処理する方法をご説明します。

「多言語原文ファイルの形式について、本当に理解しているのですか?」

この質問を受けたのは、私のチームがTrados Studioでの多言語原文ファイルのサポート向上に取り組んでいた昨年の初めでした。当時は、知識が乏しく、複数の言語の翻訳可能なコンテンツが含まれていることや、そのようなファイルのレイアウトが標準形式ではないことぐらいしか知りませんでした。そのため、一般的なサポートの提供ですら、かなり手こずっていたのです。

この質問に対し、私は、そもそもなぜ多言語形式のサポートに手こずらなければならないのだろうと思いました。Trados Studioでは、バイリンガルドキュメントの処理方法が確立されているのではなかったのでしょうか?  原文ファイルのコピーを作成してから、訳文言語ごとにバイリンガルドキュメントを作成し、既存の翻訳をささっとコピーして、残りの部分を翻訳する。最後に魔法の杖を振って、すべての翻訳を多言語のネイティブファイルにコピーして、完成!だったら、簡単ですよね。   

このような魔法は、あなたが風の強いシャイアを歩く魔法使いのガンダルフでない限り、簡単には習得できません。  プロジェクトマネージャーは、代わりに2つのコマンド(Ctrl+CとCtrl+V)で武装し、翻訳をつなぎ合わせる必要があります。準備作業時はバイリンガルドキュメント、翻訳完了後は多言語原文ファイルでつなぎ合わせ作業をするのです。ただ、これではあっという間に手根管症候群になってしまいます…。

翻訳環境で多言語形式の管理が困難になる理由は何でしょうか?バイリンガルドキュメントではなく、多言語ドキュメントを標準として管理しないのはなぜでしょう?コンピュータ支援翻訳(CAT)ソフトウェアは、リンギストが品質と一貫性を確保しつつプロジェクトをより迅速に提供できるようにする機能を備えています。さまざまな原文ファイル形式から翻訳可能なコンテンツを抽出し、訳文言語ごとにバイリンガル形式のファイル(SDLXLIFF)を構築するように設計されているのです。 

関連する課題をしっかり理解するためには、翻訳環境で多言語ドキュメントの概念を導入しない理由を確認する必要があります。まずは、一般的な例として、複数の訳文言語で翻訳するコンテンツがあり、各言語の専門リンギストに翻訳作業を分配する場合を考えてみましょう。  このプロセスは、通常、訳文言語ごとに担当の翻訳者が1人おり、バイリンガルドキュメントの管理には適しています。翻訳支援ソフトウェアの使用により、各バイリンガルドキュメントを個別に配布できます。

次に、段落のテキストの分節化が、言語によって異なる場合がある点についても考えてみましょう。  バイリンガルドキュメントでは、原文と訳文が1対1の関係にあるため、スムーズに処理されます。元の段落の整合性を維持しながら、翻訳単位(TU)をさらに分節化したり結合したりすることもできます。多言語ドキュメントでは、原文コンテンツの分節化の方法が訳文言語ごとに異なる場合があり、1つの翻訳単位に複数の翻訳をそのまま関連付けられないため、魔法の力が必要になることがあります。

もうお気づきかもしれませんが、実際の問題は、「なぜTrados Studioでは多言語ドキュメントを管理しないのか?」ではなく、バイリンガルが主体の環境で多言語形式をどのように管理できるかということなのです。   

Trados Studioには、原文ファイルからの翻訳可能なコンテンツの抽出、そのあとのバイリンガルドキュメントの作成、さらに分析や一括翻訳といったタスクを作成する基本的な機能が備わっています。そのため、最初のうちはTrados Studioなら簡単と思うでしょう。  では、多言語の原文ファイルから訳文言語ごとにバイリンガルドキュメントを作成するプロセスを自動化するのはどのくらい難しいのでしょうか?結果を言ってしまえば、まったく難しくありません!Trados StudioにはAPIが用意されており、開発者は独自のファイル形式や特定の目的を果たす一括タスクを作成できます。

つまり、Trados Studioでの多言語原文ファイルのサポート問題を解決する最も実用的な方法は、Trados Studioの主要機能を簡単に利用できるファイル形式を開発し、2つの新しい自動化タスクを導入することなのです。1つ目のタスクは「多言語翻訳のインポート」で、訳文言語や、翻訳者に役立つ文脈情報もインポートします。  このタスクは、Trados Studioの通常の分節規則を使用して原文の分節化が終了した後に実行されます。  このとき考慮すべきなのは、原文を適切に翻訳するために段落内の文の数が変化していることがあり、原文と訳文が完全に対になるとは限らないため、段落に複数の文が含まれている場合は、訳文が、対応する最初の原文のみに配置されるということです。  2つ目のタスクは「多言語翻訳の生成」です。プロジェクトが完了すると、多言語原文ファイルが再生成されます。元の多言語原文ファイルに翻訳を反映するために、コピー&ペーストしたり、スクリプトを作成したりする必要はもうありません。

最初のステップとして、多言語のExcelファイル形式とXMLファイル形式をサポートできるようにしました。これらが多言語翻訳で最も一般的に使用されるファイル形式だからです。多言語Excelファイルは、ゲーム業界において、ローカリゼーション対象文字列を提供するための事実上の標準と言えます。用語の保存にもよく使用されます。

Trados Studioで配布されるAPIは、RWSのエコシステムにおいて重要な役割を担っています。APIにより、開発者がビジネスニーズに合わせて独自の機能を翻訳環境に追加できます。  Trados AppStoreチームが開発した多言語ファイル形式は、可能なことの一例にすぎません。私たちの開発のほとんどは、GitHubやRWS Communityでオープンソースとして公開されています。RWSは、開発者の皆さんにこのようなプロジェクトへの参加を呼び掛けています。共通の問題を解決するために、互いに学び、新しい革新的なソリューションを継続的に開発しましょう。また、サードパーティの開発者が開発したアプリの成功事例も多数あります。そのようなアプリはRWS AppStoreから入手できます。ぜひご確認ください!

RWSの新しい多言語アプリについては、こちらをご覧ください。