13-translation-tips-for-2018-ata-58

適切なファイルタイプの選択 - HTMLファイル編

みなさま、こんにちは。SDLジャパンの土田です。こちらのブログで、Trados Studioを中心としたSDL製品の技術的な情報をお届けしています。

先日、Trados Studio 2011からTrados Studio 2019にアップグレードされたお客様からご質問をいただきました。

こちらのお客様はHTMLファイルの翻訳プロジェクトをStudio 2011で行われていたのですが、2019でプロジェクトを作成したところ、翻訳対象として抽出されない箇所が出てきたり、分節化が2011のようになされないところがあるとのことでした。

HTMLファイルのバージョンを確認する

まずはテスト用の原文HTMLファイルをお預かりし、私の環境のTrados Studio 2011とTrados Studio 2019にそれぞれ読み込ませ、結果を比較しました。すると確かにご報告どおり、おかしなところで分節化が起こったり、2011では翻訳対象として抽出されている箇所が2019では脱落していたのです。

そこで、HTMLファイルをテキストエディタで開き、問題の起こっているテキストの周辺を確認したところ、気づいたことがありました。抽出の異常が起こっている箇所には、<font>タグが存在していたのです。

こちらのタグは、HTML5ですでに廃止されたタグの一つです。つまりこの原文ファイルは、HTML4に準拠したファイルであるということになります。

プロジェクトの設定を確認したところ、やはり適用されていたのは「HTML5」のファイルタイプでした。 そしてStudio 2011には、HTML5用のファイルタイプは実装されていません。問題はこちらにありそうです。

HTML4とHTML5の違いについては、W3Cによる下記のページをご覧ください。廃止された要素は「3.5 Obsolete Elements」の項で説明されています。

HTML5 Differences from HTML4
https://www.w3.org/TR/html5-diff/

Traods Studioでファイルタイプを選択する

ここで、Trados StudioがHTMLファイルの読み込み時に使用するファイルタイプの種類を調整してあげる必要があります。[ファイル]>[オプション]より、[ファイルの種類]を開きます。

既定では、HTMLファイル(拡張子が.htmlあるいは.htmのファイル)に対しては[XHTML 1.1]のファイルタイプが適用されるようになっています。ここで下図のように[XHTML 1.1]および[HTML5]のチェックを外し、[HTML4]が適用されるように設定します(同じ拡張子に対して、複数のファイルタイプにチェックが入っている場合、上に表示されているファイルタイプが優先的に適用されます)。

2019-06-28 _1

このように設定を変更し、プロジェクトを作成しなおしたところ、希望通りにHTMLファイルの抽出が行われました。

プロジェクトを作成する際、原文ファイルがどのバージョンで作成されているか事前に確認することは後々のトラブルを防止する上でとても有効です。今回はHTMLファイルでしたが、他のファイル形式の事例についても、いずれお話したいと思います。