how-adaptivemt-banishing-myths

Meine 7 Lieblingsfunktionen in SDL Trados Studio 2017

Es gibt eine Menge toller neuer Features in Studio 2017. Hier ein paar meiner Lieblingsfunktionen, wobei die Reihenfolge keine Rolle spielt.

1. Vorschau für Dateityp

Mit Studio 2017 wurde eine Funktion eingeführt, mit der sich der Benutzer ansehen kann, wie eine bestimmte Datei mit den ausgewählten Einstellungen nach dem Öffnen in Studio aussehen wird. So lässt sich viel Zeit sparen, da der Benutzer die Einstellungen im Handumdrehen ändern und sich die Auswirkungen auf die Datei nach dem Öffnen in Studio ansehen kann. In diesem einfachen Beispiel kann ich durch Aktivieren bzw. Deaktivieren von „Sonderzeichen als Inline-Platzhalter-Tags behandeln“ in den Einstellungen für den Word-Dateityp überprüfen, welche Auswirkungen dies auf die Datei hat. Hier wird das geschützte Leerzeichen, das zu den Sonderzeichen gehört, in ein Inline-Platzhalter-Tag umgewandelt.

Vorschau für Dateityp in Studio 2017 – Platzhalter-Tag

Hier wird das geschützte Leerzeichen nicht in ein Inline-Tag umgewandelt. Vorschau für Dateityp – Geschütztes Leerzeichen

In diesem Beispiel wird der Dateityp Word verwendet, aber die Vorschaufunktion steht auch für andere Dateitypen zur Verfügung.

2. Terminologieerkennung: Überlappende Termini ermöglichen

Diese neue Studio-Funktion gehört vielleicht nicht zu den Hauptfunktionen, aber ich finde sie sehr nützlich. Mit ihr werden auch solche Begriffe erkannt, die Teil einer Phrase sind. In den Vorgängerversionen von Studio 2017 war dies nicht möglich und bei der Terminologieerkennung enthielt die Liste der gefundenen Begriffe ausschließlich die mehrteiligen Begriffe, die in einem Segment gefunden wurden. Sehen wir uns zur Veranschaulichung das folgende Beispiel an. In den Standardeinstellungen wird nur „average temperature“ im Fenster „Terminologieerkennung“ aufgeführt, obwohl aus Termbankansicht hervorgeht, dass die Terminologiedatenbank „average“ und „temperature“ als getrennte Begriffe enthält.

Terminologieerkennung in Studio 2017

In Studio 2017 haben wir nun die Möglichkeit, in den Sucheinstellungen der Terminologiedatenbank die Option „Überlappende Termini ermöglichen“ zu aktivieren.

Sucheinstellungen der Terminologiedatenbank in Studio 2017

Nun zeigt die rote Linie oberhalb der erkannten Begriffe an, dass es innerhalb der Phrase mehr als einen erkannten Begriff gibt, und in der Trefferliste der Terminologieerkennung werden drei Begriffe angezeigt. Terminologieüberschneidungen – Terminologieerkennung in Studio 2017

So kann der Benutzer die vorhandene Terminologie flexibler und effektiver einsetzen.

3. Das Standardlayout der Terminologiedatenbank-Ansicht

Diese neue Funktion gibt es nicht nur für Studio 2017, sondern auch für MultiTerm 2017. Sie ist benutzerfreundlicher als die alten Layouts. Früher habe ich immer das Fahnen-Layout verwendet, einfach weil es standardmäßig in Studio ausgewählt war, aber ich fand die Bearbeitung von Begriffen nicht besonders intuitiv. In dem neuen Standardlayout braucht man nur den Cursor dort zu platzieren, wo man eine Änderung vornehmen möchte, etwas einzugeben und die Eingabetaste zu drücken – fertig. Es gibt sogar Schaltflächen, die gewöhnliche Aufgaben wie Hinzufügen oder Löschen von Begriffen vereinfachen.

Neues Standardlayout in SDL MultiTerm 2017

4. Der erweiterte Anzeigefilter

Diese Funktion habe ich mir schon immer gewünscht und sie seit ihrer Einführung auch schon sehr häufig genutzt. Die Vorgängerversionen von Studio 2017 besaßen zwar bereits einen einfachen Anzeigefilter, aber es konnten nicht mehrere Suchkriterien miteinander kombiniert werden. Manchmal muss man aber z. B. nach nicht gesperrten, übersetzten Wiederholungen filtern, in denen das Wort X im Ausgangssegment und das Wort Y im Zielsegment vorkommt und die eine Fehlermeldung aufweisen. Mit dem neuen erweiterten Anzeigefilter ist dies nun kein Problem mehr.

Erweiterter Anzeigefilter in Studio 2017

Ein weiterer Vorteil des erweiterten Anzeigefilters besteht darin, dass reguläre Ausdrücke optional verwendet werden können, was beim einfachen Anzeigefilter nicht der Fall ist. Dies bedeutet, dass Regex-Metazeichen wie [\^$.|?*+(){} beim einfachen Anzeigefilter anhand ihrer Regex-Bedeutung interpretiert werden und nicht als Literalzeichen. Im Beispiel unten wird bei der Suche nach einem Fragezeichen im einfachen Anzeigefilter eine Fehlermeldung ausgegeben, da das Fragezeichen in regulären Ausdrücken als Quantifikator fungiert.

advanced-display-filter-2

Beim erweiterten Anzeigefilter kann der Benutzer selbst festlegen, ob das Zeichen buchstabengetreu (Standardeinstellung) oder als Regex-Metazeichen interpretiert werden soll, indem er das Kontrollkästchen „Regulärer Ausdruck“ (de)aktiviert. In diesem Beispiel wird im erweiterten Anzeigefilter ein Segment angezeigt, das Fragezeichen enthält.

Segment mit Fragezeichen – Erweiterter Anzeigefilter

Bei aktivierter Option für reguläre Ausdrücke wird hier kein Filter angewendet und der Benutzer erhält eine Fehlermeldung.

advanced-display-filter-4

5. Fuzzy-Match-Optimierung

Wir alle ärgern uns sicherlich über Segmente mit hohen Fuzzy-Matches, bei denen die einzige Abweichung in einem Satz- oder Aufzählungszeichen oder dem einen oder anderen Begriff besteht. Bisher mussten die nötigen Anpassungen manuell vorgenommen werden, doch dank der neuen Fuzzy-Match-Optimierungsfunktion von Studio werden diese Segmente jetzt dynamisch vollständig oder teilweise korrigiert. Und der geringere Bearbeitungsaufwand wirkt sich natürlich positiv auf die Produktivität aus. Die Match-Optimierung ist in neuen Projekten standardmäßig aktiviert. Die entsprechenden Einstellungen finden Sie unter Projekteinstellungen – Sprachpaare – Alle Sprachpaare.

Einstellungen für die Fuzzy-Match-Optimierung

Bei aktivierter Match-Optimierung wird im Segmentstatus der entsprechenden Segmente ein kleiner Schraubenschlüssel angezeigt. Das bedeutet, dass das Segment optimiert wurde.

Schraubenschlüssel-Symbol für Fuzzy-Match-Optimierung

Im Beispiel oben fehlen im Vergleich zur ursprünglichen, im Translation Memory (TM) gespeicherten Übersetzungseinheit das Wort „Mars“, das vorangehende Komma, das Leerzeichen und der Punkt am Ende des Satzes. Dies ist eine perfekte Fuzzy-Match-Optimierung. Der Benutzer braucht das Segment nur noch zu bestätigen, ohne es selbst bearbeiten zu müssen. Manchmal müssen nur noch einige Kleinigkeiten nachgebessert werden, wie im Beispiel unten, wo der Artikel „la“ vor „Júpiter“ entfernt werden muss. Dies ist nämlich kein Fehler der Fuzzy-Match-Optimierung. Studio kann nicht wissen, dass es im Spanischen zwar „la tierra“ heißt, bei „Júpiter“ jedoch kein Artikel steht. Studio hat einfach die Übersetzung für „Earth“ durch die für „Jupiter“ ersetzt, die aus der Terminologiedatenbank stammt, wie Sie ganz rechts im Screenshot erkennen können. scr11

Obwohl die Fuzzy-Match-Optimierung auf Grundlage der vorhandenen Ressourcen wie z. B. unserer TMs und Terminologiedatenbanken ausgeführt wird, funktioniert dieses Feature auch mit begrenzten Ressourcen. Für die Beispiele oben habe ich ein TM mit nur 22 Übersetzungseinheiten und eine Terminologiedatenbank mit nur 20 Begriffen verwendet.

6. upLIFT Fragment Recall (Fragment-Matching)

Schon als AutoSuggest-Wörterbücher zum ersten Mal vorgestellt wurden, kam mir der Gedanke, wie nützlich es wäre, diese Ressource während der Eingabe von Inhalten in das TM dynamisch zu aktualisieren. Mit upLIFT hat sich mein Wunsch erfüllt … und noch einiges mehr. Die upLIFT-Technologie in Studio 2017 analysiert die Informationen im Translation Memory und identifiziert passende Segmentfragmente, die dem Benutzer während der Übersetzung angeboten werden können. Hierzu müssen vorhandene Translation Memorys durch das sogenannte Fragment-basierte Alignment vorbereitet werden. Dieser Vorgang ist jedoch bei sehr kleinen TMs nicht möglich: Es werden TMs mit mindestens 5.000 Übersetzungseinheiten empfohlen, obwohl ich aus persönlicher Erfahrung berichten kann, dass ich bereits Übersetzungsmodelle für TMs erstellt habe, die nur ein paar Tausend Übersetzungseinheiten enthielten. Wie wir weiter unten sehen, kann das Fragment-basierte Alignment zwar für ein kleines TM wie das aus den Beispielen aktiviert werden, aber es ist nicht möglich, ein Übersetzungsmodell zu erstellen. Der Inhalt des TM reicht einfach nicht aus. (Sie gelangen zu diesem Bildschirm, indem Sie Projekteinstellungen – Alle Sprachpaare – Translation Memory und Maschinelle Übersetzung auswählen, das entsprechende TM auswählen und dann auf „Einstellungen“ klicken).

Fragment-basiertes Alignment für Ihr Translation Memory

Für die Beispiele unten verwende ich eines meiner Haupt-TMs, das zuvor wie unten dargestellt mit dem Fragment-basierten Alignment vorbereitet wurde.

scr13

Während das Fragment-basierte Alignment eine Funktion des Translation Memory ist, stellt die Verwendung der alignierten Fragmente für das Segment-Matching eine projektspezifische Funktion dar, die, wie wir hier sehen, in den Projekteinstellungen aktiviert und optimiert werden kann.

fragment-recall-3

In der Standardeinstellung ist die Option für die Fragmentierung der Übersetzungseinheiten (TU-Fragment) deaktiviert. Um optimale Ergebnisse zu erzielen, sollten Sie sie aktivieren. Hinweise:

  • Die Fragmenterkennung für Ganze TU funktioniert mit allen TMs; es ist keine TM-Vorbereitung erforderlich. Selbst kleine TMs können hierfür eingesetzt werden, wenn sie kurze Übersetzungseinheiten (Translation Units, TUs) enthalten, die als Teil längerer Segmente erkannt werden können.
  • Der Fragmenterkennungstyp TU-Fragment funktioniert nur dann, wenn das TM entsprechend vorbereitet und das Kontrollkästchen aktiviert wurde. Für diese Funktion sind größere TMs erforderlich.

Mit den oben genannten Einstellungen wird mir dies nun im Fenster „Gefundene Fragmente“ angezeigt. Beachten Sie die unterschiedlichen Symbole für „Ganze TU“-Matches und „TU-Fragment“-Matches. Da TU-Fragment-Matches Teil einer längeren Übersetzungseinheit sind, können Sie auf das Symbol klicken, um sich die vollständige Übersetzungseinheit anzeigen zu lassen.

Fragmenterkennungs-Fenster in Studio 2017

Während der Übersetzung werden diese Matches und die zugehörigen Teilfragmente als AutoSuggest-Treffer angeboten, sobald man den ersten Buchstaben eingibt. Wie Sie sehen, habe ich das Fragmenterkennungs-Fenster so platziert, dass es immer in der rechten Bildschirmhälfte sichtbar ist. So sehe ich sofort, welche Fragment-Matches für ein Segment verfügbar sind.

scr14

Noch ein letzter Hinweis: Sie können die Anzahl der angezeigten Fragment-Matches ändern, indem Sie die Werte für die Match-Einstellungen für „Ganze TU“ und „TU-Fragment“ anders festlegen.

7. AdaptiveMT

Die letzte Funktion, die ich vorstellen möchte, ist die adaptive maschinelle Übersetzung. Wenn ich früher mit einer Engine für maschinelle Übersetzungen gearbeitet habe, musste ich in vorübersetzten Segmenten häufig dieselben Dinge korrigieren, die ich bereits im vorigen Segment geändert hatte. Dank der neuen AdaptiveMT-Funktion von Studio 2017 ist dies nicht mehr nötig. Die SDL Language Cloud, „lernt“ aus Nachbearbeitungen und übernimmt sie für die nachfolgenden Segmente. Hinweise:

  • Neben anderen kostenpflichtigen Modellen beinhaltet Studio 2017 im Rahmen des kostenlosen Language Cloud-Modells eine AdaptiveMT-Engine und 400.000 Zeichen pro Monat.
  • Wählen Sie „Datei“ und dann „Language Cloud“ aus, um auf Ihr Language Cloud-Konto zuzugreifen. Hierfür benötigen Sie Ihre SDL Anmeldeinformationen.

Um die AdaptiveMT-Funktion zu nutzen, wählen Sie einfach „Maschinelle Übersetzung mit SDL Language Cloud“ als Translation Memory-Provider aus. Wechseln Sie dann zu den Einstellungen und richten Sie Ihre adaptive Engine ein oder wählen Sie eine vorhandene Engine aus.

Erstellen einer AdaptiveMT-Engine

Das TM für „Maschinelle Übersetzung mit SDL Language Cloud“ lässt sich mit anderen TMs kombinieren. In diesem Beispiel verwende ich jedoch nur dieses TM. Beachten Sie, dass die Option „Aktualisieren“ aktiviert werden sollte, damit alle Bearbeitungen gespeichert werden. Bei Verwendung von AdaptiveMT wird beim Symbol für den Segmentstatus neben dem „AT“ eine Glühbirne angezeigt, um darauf hinzuweisen, dass es sich um eine maschinelle Übersetzung handelt. Im Beispiel unten bietet die Übersetzungs-Engine „dióxido“ für „dioxide“ an, ich suche jedoch nach „bióxido“. Ich bekomme also zunächst Folgendes von der Übersetzungs-Engine der SDL Language Cloud angeboten:

scr17

Nachdem ich beide Übersetzungseinheiten bearbeitet und bestätigt habe, sehen sie jetzt so aus:

adaptivemt-3

Da es keine weiteren aktiven TMs in diesem Projekt gibt, werden die Übersetzungen nicht lokal gespeichert und ich aktualisiere einfach nur die AdaptiveMT-Engine. Wenn ich nun den Inhalt der Zielsegmente lösche und sie mithilfe der SDL Language Cloud AdaptiveMT-Engine wieder übersetzen lasse, verwendet die maschinelle Übersetzung den gewünschten Eintrag.

scr18

Die AdaptiveMT-Engine hat meine bevorzugte Terminologie also „gelernt“, sodass ich in den kommenden Segmenten weniger Nachbearbeitungen vornehmen muss. Dies ist nur ein Beispiel mit beschränkten Möglichkeiten, aber Sie werden feststellen, dass die AdaptiveMT-Engine sich immer mehr an Ihren Stil und Ihre bevorzugte Terminologie anpasst und diese Daten für zukünftige Projekte speichert. Ich hoffe, dass auch Sie diese Features von Studio 2017 hilfreich finden und dass sie nicht nur Ihre Produktivität steigern, sondern Ihre Arbeit insgesamt angenehmer gestalten.

Sind Sie an weiteren Tipps von Übersetzern zur Verwendung von SDL Trados Studio interessiert? Hier klicken>>