13-translation-tips-for-2018-ata-58

翻訳メモリの分節規則をカスタマイズする

こんにちは。SDLジャパンの土田です。こちらのブログで、Trados Studioを中心としたSDL製品の技術的な情報をお届けしています。

SDL Trados Studioが翻訳対象の原文ファイルを読み込む際に、原文テキストは文および段落の単位で区切られます。その区切りの単位にもとづいて翻訳作業が行われますが、この区切りを分節(セグメント)と呼んでいます。そして分節ごとにテキストを区切る処理のことを分節化(セグメンテーション)と呼んでいます。

この分節化は翻訳メモリによって制御されているのですが、主に以下の2点に基づいて区切りの処理が行なわれます。

・文の終わりの記号(ピリオド、コロン、句点、感嘆符)
・改行

しかしながら、原文の種類によっては必ずしも望ましい場所で分節化が行なわれない場合があります。

こちらを回避するため「分節の結合」あるいは「分節の分割」機能によって分節の形を調整し、正しい文で翻訳例を翻訳メモリに登録するという方法もあるのですが、該当箇所が多ければそちらも煩雑になってきます。

このような場合、TM上に設定されている分節規則をカスタマイズし、原文ファイルの読み込み時に分節化を望ましい形に設定することが可能です。今回は、実際にお問い合わせをいただいた事例をもとに、分節規則のカスタマイズを具体的にご説明したいと思います。


Case 1 : Excelのセル内改行で分節化を行なう

原文ファイルがExcel形式であった場合、分節化は原則としてセル単位で行なわれます。したがってセル内に改行があった場合、既定では読み込み時に分節化は行なわれません。

2019-12-20_1

そこで[翻訳メモリ]ビューで使用するTMを開きます。右クリックで表示されるコンテキストメニューより[設定]を選択するか、リボンの[タスク]より[設定]をクリックします。

2019-12-20_2

[翻訳メモリの設定]ウィンドウが表示されますので、[言語リソース]>[分節規則]を選択し、[編集]をクリックします。

2019-12-20_3

[分節規則]ウィンドウが開きます。[追加]をクリックし、分節規則を新たに作成します。

2019-12-20_4

[説明]には任意の規則名を指定します。ここでは仮に「Soft Return」と入力します。[分節の前]および[分節の後]はどちらも[問わない]を選択します。次に、[詳細ビュー]をクリックします。

2019-12-20_5

[詳細ビュー]とは、分節規則を正規表現で指定する画面です。

2019-12-20_6

ここで[分節の前]のフィールドに、以下の正規表現パターンを入力します。

.[\n]+

[分節の後]のフィールドは変更せず、半角ピリオドのみが入力されていることを確認します。すべてのウィンドウで[OK]をクリックし、設定を確定します。

設定を変更したTMで原文ファイルを読み込みなおすと、セル内の改行で分節化が行なわれています。

2019-12-20_7


Case 2 : 全角小数点による分節化を防ぐ

法務知財関連の日本語文書では多くの場合、英数字に表記に全角文字が用いられます。この際に小数点として使用されている全角ピリオドが文の終わりとして認識され、分節化が行なわれてしまいます。

2019-12-20_8

こちらもTMの分節規則を変更することで回避できます。やはりTMの[設定]より[分節規則]を開きますが、今度は分節規則を追加するのではなく、既存の分節規則を編集します。[Terminating punctuation (full stop, question mark, exclamation mark, variants)]を選択し、[編集]をクリックします。

2019-12-20_9

[分節の前]および[分節の後]はどちらも[問わない]を選択します。また[終了句読点を含める]にチェックが入っていることを確認します。次に[例外]より[追加]をクリックします。

2019-12-20_10

分節規則の例外を追加します。分節化の対象となる終了文字であっても、特定の条件で分節化を行なわないよう指定することができます。

2019-12-20_11

[説明]には任意の規則名を指定します。ここでは仮に「Double-byte Dot」と入力します。[終了文字]には全角のピリオドを入力し、[分節の前]および[分節の後]にはどちらも以下の正規表現パターンを指定します。

[0123456789]

その後すべてのウィンドウで[OK]をクリックし、設定を確定します。

設定を変更したTMで原文ファイルを再度読み込みます。

2019-12-20_12

全角の小数点での分節化が行なわれず、固定要素として認識されています。


Case 3 : 括弧内の句点による分節化を防ぐ

こちらも日本語原文の事例なのですが、括弧内の文に句点が存在した場合、そこで分節化が行われることが望ましくない場合があります。

2019-12-20_13

この場合でも先ほどと同様に、分節規則に例外を追加します。TMの[設定]より[分節規則]を開き、やはり[Terminating punctuation (full stop, question mark, exclamation mark, variants)]の[編集]をクリックします。

2019-12-20_14

[終了句読点を含める]のチェックを外し、[分節の後]は[問わない]を選択します。その後、[例外]の[追加]をクリックします。

[説明]では任意の規則名を指定します。ここでは仮に「In Bracket」と入力します。[終了文字]には全角の句点を入力します。

2019-12-20_15

[分節の前]は[問わない]を選択し、[分節の後]には以下の正規表現パターンを指定します。連続している閉じ括弧は、半角と全角を入力しています。

.*[))]

設定を変更したTMで原文ファイルを再度読み込みます。括弧内の句点では分節化が行なわれません。

2019-12-20_16

以上、実際にいただいたお問い合わせをもとに分節規則のカスタマイズ例をご紹介しました。