Finger points to circular rings

Richtige Terminologie für bessere maschinelle Übersetzungen

Eine erstklassige Terminologieverwaltung kann Ihnen helfen, die Qualität Ihrer maschinellen Übersetzung zu verbessern

Da Fachleute und die Öffentlichkeit zunehmend herkömmliche, frei verfügbare Systeme für maschinelle Übersetzungen (Machine Translation, MT) verwenden, ist es wichtig, sich bewusst zu machen, dass diese Systeme fehlerhafte Übersetzungen produzieren können. Schlechte Qualität oder kritische Fehler können sich nachteilig auf Unternehmen auswirken. Es gibt jedoch Möglichkeiten, die Qualität der maschinellen Übersetzung zu verbessern, wie beispielsweise eine effektive Terminologieverwaltung.

Welche Herausforderung stellt die Terminologie für die maschinelle Übersetzung dar?

Aufgrund der komplexen Beziehungen zwischen Konzepten und deren Repräsentation durch Terminologieeinheiten bleibt die Terminologie eine der größten Herausforderungen für die maschinelle Übersetzung.

Das Verwenden kostenfreier MT-Engines für bestimmte Bereiche kann vor allem im Hinblick auf die Terminologie unerwünschte Ergebnisse hervorrufen. Dies kann sich insbesondere in den Bereichen Medizin und Recht negativ auswirken.

Die MT-Systeme können zwar mit dem Korpus zu einem bestimmten Fachgebiet „trainiert“ werden, um schlechte Ergebnisse bis zu einem gewissen Grad zu vermeiden, aber eine konsistente oder genaue Terminologie kann dadurch nicht garantiert werden.

Die Qualität der Übersetzung durch eine MT-Engine hängt unter anderem von der Qualität des zweisprachigen Trainingskorpus ab. Daher kann eine genaue Übersetzung der Terminologie nur dann gewährleistet werden, wenn dieses Korpus die relevanten Begriffe sowohl im Ausgangs- als auch im Zieltext enthält.

Obwohl Systeme für neuronale maschinelle Übersetzungen (Neural Machine Translation, NMT) auf Wahrscheinlichkeitsverteilungen von Begriffen beruhen, ist ihr Vorhandensein zwar notwendig, aber nicht ausreichend, um qualitativ hochwertige Übersetzungen zu gewährleisten. Die Häufigkeit der Begriffe im Korpus muss ausreichend sein, damit der Decoder die exakten Entsprechungen erhält. Wenn die Häufigkeit eines bestimmten Begriffs unzureichend ist, erhält er nicht die ausreichende Gewichtung, um als Kandidat für Äquivalente zu gelten. Dementsprechend wird er nicht korrekt übersetzt.

Eine Hand greift nach einer Kugel, die Bilder von Menschen enthält

Inwiefern führt das herkömmliche MT-Training zu fehlerhaften Übersetzungen?

Herkömmliche MT-Systeme werden oft mit einer Vielzahl unterschiedlichster Inhalte trainiert. Daher kann es vorkommen, dass der häufigste Kandidatenbegriff und sein mögliches Äquivalent zu einem anderen Bereich gehören als der zu übersetzende Begriff. Dies wiederum kann dazu führen, dass Begriffe ungenau in die Zielsprache übersetzt werden.

Der spanische Begriff fósforo kann beispielsweise als Streichholz (ein Gegenstand zum Entzünden von Feuer) oder als Phosphor (ein chemisches Element) übersetzt werden. Eine herkömmliche MT-Engine ist eventuell gar nicht in der Lage, die Intention der Aussage richtig zu interpretieren, was zu einer fehlerhaften Übersetzung führen kann.

Die Lösung für dieses Problem besteht darin, kundenspezifische MT-Systeme mit domänenspezifischen zweisprachigen Texten zu trainieren, die Fachterminologie enthalten.

Dennoch können genaue Übersetzungen nicht garantiert werden, wenn die Maschinen mit Fachtexten trainiert werden, die Terminologie jedoch nicht einheitlich verwendet wird.

Welche Lösungen sind auf dem Markt?

Die aktuelle Forschung in diesem Bereich empfiehlt, sprachliche Informationen durch Annotationsmethoden in NMT-Systeme einzubringen.

Die Umsetzung der manuellen oder halbautomatischen Annotation hängt von den verfügbaren Ressourcen (z. B. Glossare) und den Einschränkungen (z. B. Zeit, Kosten und Verfügbarkeit von fachlichen Prüfern) ab.

Welche Lösung bietet Lionbridge?

Smart MT™ von Lionbridge ermöglicht die Anwendung von linguistischen Regeln auf den Ausgangs- und den Zieltext sowie die Durchsetzung von Terminologie auf der Grundlage von „Do Not Translate“- (DNT) und Glossarlisten, die einem bestimmten Profil hinzugefügt wurden.

Wir unterstützen unsere Kunden bei der Erstellung und Pflege von Glossaren, die regelmäßig überarbeitet werden, um neue, relevante Begriffe aufzunehmen und veraltete Terminologie auszumustern. Einmal in Smart MT erstellte Glossare können dann für alle MT-Engines verwendet werden, wodurch Sie Zeit und Geld sparen.

Wie lassen sich Glossare am besten für MT-Projekte nutzen?

Die Verwendung von Glossaren für MT-Projekte ist nicht so einfach, wie es vielleicht aussieht. Bei unsachgemäßer Verwendung können Glossare sogar die Gesamtqualität der maschinellen Übersetzung beeinträchtigen. Der beste Weg, die Terminologie in der maschinellen Übersetzung zu verfolgen, ist das maschinelle Training.

Die Kombination aus trainierten MT-Engines, der Anpassung von Glossaren und der Festlegung von Regeln für die Vor- und Nachbearbeitung stellt sicher, dass die Ausgabe die richtige Terminologie enthält und stilistisch der Dokumentation des Kunden entspricht.

Punkte und dreidimensionale Würfel überlagern einen dunklen Hintergrund

Welche Funktionen zur Terminologieverwaltung sollte eine maschinelle Übersetzungslösung bieten?

Wenn Sie die Funktionen zur Terminologieverwaltung bei einer maschinellen Übersetzungslösung bewerten, sollten Sie darauf achten, dass folgende Funktionen enthalten sind:

  • Verwaltung von Glossaren
  • Verwaltung von DNT-Listen
  • Verwaltung von vorgeschlagenen und genehmigten Übersetzungen
  • Massen-Upload von Begriffen und Sätzen durch den Import von Glossaren und Translation Memory (TM)
  • Erstellen von bereichs- oder produktspezifischen MT-Engine-Profilen und Automatisieren der Weiterleitung von Inhalten zwischen diesen Engines

Zusammen sorgen diese Funktionen für eine qualitativ hochwertigere Übersetzungsleistung.

Wie funktioniert die Smart MT-Lösung von Lionbridge?

Smart MT arbeitet über einen Konnektor mit verschiedenen MT-Systemen von Drittanbietern zusammen. Betrachten Sie es als eine Schnitt- und Verbindungsstelle, die Folgendes ermöglicht:

  • Verbindung mit führenden externen MT-Anbietern wie Microsoft, Google, Amazon, DeepL und Yandex
  • Verwaltung von Terminologie – Glossar- oder DNT-Begriffe können im laufenden Betrieb hinzugefügt und aktualisiert werden, um die Terminologie zu erhalten und sicherzustellen, dass sie in der Ausgabe genau so erscheint wie vorgesehen.
  • Anwendung von linguistischen Regeln, sodass Benutzer den Ausgangstext oder die MT-Ausgabe ändern können, um bekannte Probleme zu beheben und die Qualität der Übersetzung zu verbessern

Lionbridge verfügt außerdem über weitere Automatisierungen, mit denen Inkonsistenzen zwischen der Terminologie in Kundenglossaren und der Verwendung dieser Terminologie im Trainingskorpus und in der MT-Ausgabe erkannt werden können. Diese Automatisierungen helfen dabei, die Fälle zu identifizieren, in denen das Korpus oder später die MT-Ausgaben nicht der genehmigten Terminologie entsprechen, und korrigieren diese.

Wenn wir feststellen, dass die maschinelle Übersetzung nicht die erforderliche Terminologie enthält, schlagen wir die Verwendung eines Glossars mit DNT-Begriffen, Produktnamen und spezifischer Schlüsselterminologie für Domänen oder Marken vor.

Welche zusätzlichen Tipps gibt es für die Erstellung und Verwendung von Glossaren?

Um das gewünschte Ergebnis der maschinellen Übersetzung zu gewährleisten, empfehlen wir, bei der Erstellung von Glossaren die folgenden Richtlinien zu beachten:

  • Nehmen Sie nur solche Begriffe in Ihre Glossare auf, die systematisch in allen Fällen verwendet werden können, in denen der Ausgangsbegriff vorkommt. Das ist häufig bei Fachterminologie, vom Kunden genehmigtem Vokabular und technischen Begriffen der Fall.
  • Verwenden Sie nur eine Übersetzungszeile in Ihrem Glossar, wenn es für einen Ausgangsbegriff mehrere Übersetzungen gibt.
  • Verwenden Sie hauptsächlich Substantivphrasen. Dies funktioniert am besten bei Mehrwortbegriffen, branchenspezifischen Begriffen oder kundenspezifischen Produktnamen.
  • Vermeiden Sie die Verwendung allgemeiner oder gebräuchlicher Begriffe, da das Vorhandensein vieler terminologischer Einträge in einem einzigen Satz die Qualität der Übersetzung beeinträchtigen kann.

Nehmen Sie Kontakt mit uns auf

Wenn Sie mehr darüber erfahren möchten, wie Lionbridge Sie bei der Verwaltung Ihrer Terminologie unterstützen und das Beste aus der maschinellen Übersetzung herausholen kann, kontaktieren Sie uns noch heute.

linkedin sharing button

Yolanda Martin und Janette Mandell
VERFASSER
Yolanda Martin und Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization