Neuronale Maschinelle Übersetzung
Neuronale Maschinelle Übersetzung (NMT) von Rechtstexten kurz erklärt

Wozu dient LexMachina?

Schnelles Übersetzen von E-Mails oder Briefen

Schnelles Übersetzen von E-Mails oder Briefen

Übersetzung eines Klageschriftentwurfes zur Genehmigung durch Ihren Kunden

Übersetzung eines Klageschriftentwurfes zur Genehmigung durch Ihren Kunden

Einen Gerichtsentscheid verstehen

Einen Gerichtsentscheid verstehen

Übersetzen von AGBs oder von einem Vertrag

Übersetzen von AGBs oder von einem Vertrag

Übersetzen von Unterlagen für eine Behörde

Übersetzen von Unterlagen für eine Behörde

Maschinelle Übersetzung ist die optimale Lösung, wenn die Zeit drängt.

Die vorzuziehende Art der Nutzung von LexMachina hängt vom Zweck der Übersetzung ab.

Ist ein allgemeines Verständnis des Dokuments ausreichend oder wird die Übersetzung rechtlich verbindlich sein? Akzeptiert das Schiedsgericht rein maschinell übersetzte Beilagen oder verlangt das Gericht zusätzlich eine Beglaubigung für jede Übersetzung? Ist eine leichte Revision ausreichend oder ist eine vollständige Revision erforderlich? Oder verlangt die Komplexität des Projekts den Einsatz einer spezialisierten juristischen Übersetzungsagentur?

Zögern Sie nicht, uns hinsichtlich der bestmöglichen Nutzung unserer Dienste um Rat zu fragen.

Wann empfiehlt sich eine menschliche Revision?
Im Folgenden finden Sie eine Liste der Grenzen der rein maschinellen Übersetzung, deren Ursachen, sowie deren Lösungsansätze.

Terminologische Fehler: Erzeugung eines unerwünschten Neologismus

Wenn der Maschine Begriffe, die in den Trainingsdaten fehlen (oder nur spärlich enthalten sind), zur Übersetzung vorgelegt werden, übersetzt…

Erklärung:

Wenn der Maschine Begriffe, die in den Trainingsdaten fehlen (oder nur spärlich enthalten sind), zur Übersetzung vorgelegt werden, übersetzt die Maschine mit den statistisch wahrscheinlichsten Wortteilen in einem gegebenen Kontext. Zum Beispiel: „Chuchichäschtli“ wird dann übersetzt als „chewing chess sludge“, weil das Wort „Chuchichäschtli“ nicht in den Rechtstexten enthalten war, die für das Training der Übersetzungsmaschine verwendet wurden.

Die Erzeugung von Neologismen ist ebenfalls darauf zurückzuführen, dass die Maschine einen bestimmten Begriff nicht als einen nicht übersetzbaren Eigennamen erkennt. Hier erfahren Sie mehr über diese Problematik.

Lösungen:

Unabhängig davon, ob es sich um einen nicht übersetzbaren Eigennamen oder einen Begriff mit einer kontextabhängigen Bedeutung handelt, können wir jegliche der Maschine unbekannte Terminologie manuell den Trainingsdaten hinzufügen, so dass sie bei folgenden Trainings erkannt wird. In der Zwischenzeit können wir sie der Terminologieliste hinzufügen. Helfen Sie uns bei der Lösung dieser Probleme, indem Sie Ihre Vorschläge über die Schaltfläche „Feedback“ im Übersetzungs-Tool unterbreiten, oder senden Sie uns Ihre Vorschläge per E-Mail.

LexMachina-Nutzer werden sehr bald eigene persönliche Glossare erstellen und dadurch direkt ihre NMT-Ergebnisse verbessern können. Abonnieren Sie unseren Newsletter, um Informationen zu unserem Tool für die Terminologie-Integration zu erhalten.

Terminologische Fehler: Unpassender Begriff im gegebenen Kontext und mangelnde Einheitlichkeit

Je nach Kontext kann ein „associé“ ein „Partner“, ein „Gesellschafter“ oder „Anteilseigner” sein. Obwohl im Rahmen der NMT der Kontext bis zu…

Erklärung:

Je nach Kontext kann ein „associé“ ein „Partner“, ein „Mitglied“, ein „Anteilseigner” etc. sein. Obwohl im Rahmen der NMT der Kontext bis zu einem gewissen Grad berücksichtigt wird, werden Übersetzungen in der Regel Satz für Satz vorgenommen, was bedeutet, dass die Maschine den Kontext nur aus dem Satz selbst und nicht aus dem ganzen Dokument (auf Dokumentebene) ableiten kann. Daher wählt sie den Begriff, der am wahrscheinlichsten in einem bestimmten Satzzusammenhang vorkommt, basierend auf den Statistiken zur Häufigkeit und dem gemeinsamen Vorkommen, die sie gesammelt hat. Dies kann manchmal zu Inkonsistenzen innerhalb desselben Dokuments führen.

Lösungen:

Unsere spezialisierten Sub-Engines versuchen, dieses Problem zu lösen: je spezialisierter der Motor, desto höher die Qualität der Übersetzungen. Wir entwickeln ständig weitere Sub-Engines, um dem Bedarf von Schweizer Rechts-, Steuer-, Versicherungs- und Finanzexperten gerecht zu werden. Darüber hinaus wird unser Tool zur Terminologie-Integration es jedem Nutzer ermöglichen, sein eigenes Glossar zu erstellen und seine NMT-Ergebnisse direkt zu beeinflussen.

Abonnieren Sie unseren Newsletter, um über die Einführung unserer neuesten Sub-Engines sowie unseres Tools zur Terminologie-Integration informiert zu werden.

Kunden, die sich für unsere vollständige Übersetzer-Toolbox entschieden haben, können leicht die Sätze herausfiltern, die den betreffenden Begriff enthalten, die Einheitlichkeit der Übersetzung prüfen und Korrekturen vornehmen, indem sie unerwünschte Begriffe „suchen und ersetzen“. Für weitere Informationen hierzu fordern Sie unser Benutzerhandbuch an.

Terminologische Fehler: Eigenname, der nicht hätte übersetzt werden dürfen

Je nach grammatikalischem Kontext der Ziel- oder Ausgangssprache sind Übersetzungsmaschinen nicht immer in der Lage, Worte zu…

Erklärung:

Je nach grammatikalischem Kontext der Ziel- oder Ausgangssprache sind Übersetzungsmaschinen nicht immer in der Lage, Worte zu identifizieren, die nicht übersetzt werden dürfen (Vor- und Nachnamen, Firmennamen, Städtenamen, Marken etc.). Siehe „Erzeugung eines unerwünschten Neologismus“ und „Unpassender Begriff im gegebenen Kontext“ für weitere Informationen hierzu.

Lösungen:

Lassen Sie uns wissen, wenn sie auf dieses Problem stossen: Klicken Sie auf die Schaltfläche „Feedback“ im Übersetzungs-Tool oder senden Sie uns Ihre Vorschläge per E-Mail. Wir werden den Begriff zu unserer Liste nicht zu übersetzender Begriffe hinzufügen. Die Maschine wird den Begriff dann stets in seiner Originalform beibehalten.

Grammatikalische Fehler: Falsche Übersetzung eines Pronomens, Verwendung des falschen Geschlechts, Uneinheitlichkeit in Aufzählungslisten etc.

Vorläufig verarbeiten neuronale Übersetzungsmaschinen (neural machine translations, NMT) Texte in der Regel Satz für Satz. Ohne die Integration geeigneter Werkzeuge zur…

Erklärung:

Vorläufig verarbeiten neuronale Übersetzungsmaschinen (neural machine translations, NMT) Texte in der Regel Satz für Satz. Ohne die Integration geeigneter Werkzeuge zur Koreferenzauflösung ignoriert der Algorithmus daher den Inhalt des vorhergehenden Satzes und übersetzt z.B. Pronomen, ohne deren Referent zu kennen („Der Salat ist frisch. Er ist sehr gesund.“ wird daher übersetzt als „The lettuce is fresh. He’s very healthy.“). Dieses Problem kann auch bei Aufzählungslisten auftauchen, da jeder Aufzählungspunkt separat übersetzt wird.

Diese Schwierigkeit tritt weniger häufig auf, wenn der zu übersetzende Text ein gängiges Dokument ist (z.B. die Statuten einer AG) oder für ein bestimmtes Feld typisch ist (z.B. Steuerrecht), weil ähnliche Sätze der Maschine vertraut sein werden und die Variabilität weniger ausgeprägt sein wird.

Lösungen:

Die Technologie zur Lösung dieses Problems existiert eigentlich bereits. Das hauptsächliche Problem besteht darin, dass die derzeit verwendete professionelle Software (Computer Assisted Translation oder CAT-Tools) nicht mit einem NMT-System kompatibel ist, das auf Paragraf- oder Dokumentebene übersetzt. Dies wird sich sicherlich in den nächsten Jahren ändern und LexMachina-Nutzer können davon ausgehen, dass sie zu den Ersten gehören werden, die von diesem technologischen Fortschritt profitieren werden.
Derweil gibt es mehrere Lösungen für das oben beschriebene Problem, darunter (i) die Vermeidung von Aufzählungen und Mehrdeutigkeiten im Ausgangstext und (ii) die Verwendung unserer spezialisierten Sub-Engines.

Abonnieren Sie unseren Newsletter, um über die Einführung unserer nächsten Sub-Engines informiert zu werden.

Falsche Bedeutung: Fehlinterpretation eines Satzes

Neuronale Übersetzungsmaschinen (neural machine translations, NMT) sind nicht immer im Stande, die Bedeutung des Ausgangstextes korrekt wiederzugeben. Solche…

Erklärung:

Neuronale Übersetzungsmaschinen (neural machine translations, NMT) sind nicht immer im Stande, die Bedeutung des Ausgangstextes korrekt wiederzugeben. Solche Fehler beruhen oft auf komplexen oder mehrdeutigen Syntaxstrukturen im Ausgangstext sowie auf besonders langen Sätzen. Die sonstigen Fälle werden als „Mysterien des Deep Learning“ bezeichnet: Wenn ein Adjektiv oder ein anderer Modifikator im Ausgangssatz hinzugefügt wird, kann sich die Übersetzung erheblich verändern, manchmal aus nicht bekannten Gründen. Dieses Problem wird in der akademischen Welt und in anderen Forschungseinrichtungen intensiv erforscht.

Abonnieren Sie unseren Newsletter, wenn Sie über die neuesten Entdeckungen auf diesem Gebiet informiert werden möchten.

Lösungen:

Häufig genügt es, den Ausgangssatz leicht abzuändern, um den Übersetzungsfehler zu entfernen. Auch wird empfohlen, den Ausgangstext so einfach wie möglich zu halten: der ideale Satz sollte nicht länger als 128 Zeichen und frei von Mehrdeutigkeiten sein.

Diese Art von Fehlern macht auch deutlich, dass trotz der beträchtlichen Fortschritte auf dem Gebiet der NMT in den letzten Jahren (auch im Bereich der juristischen Übersetzung) die Überprüfung des Ergebnisses durch eine Anwältin oder Sprachjuristen nach wie vor empfehlenswert ist, wenn eine Übersetzung rechtsverbindlich oder in Gerichtsverfahren relevant ist. In solchen Fällen schlagen wir vor, unsere vollständigen Revisionsdienste in Anspruch zu nehmen.

Formatierungsfehler: Fettdruck oder Kursivschrift am falschen Ort

Die neuronale Übersetzungsmaschine (neural machine translations, NMT) spürt die Textformatierung (fett, kursiv, unterstrichen usw.) im Ausgangstext auf und wendet sie…

Erklärung:

Die neuronale Übersetzungsmaschine (neural machine translations, NMT) spürt die Textformatierung (fett, kursiv, unterstrichen usw.) im Ausgangstext auf und wendet sie auf Begriffe im Zieltext an. Da die Maschine jedoch nicht Wort für Wort sondern vielmehr Satz für Satz übersetzt, kann die Formatierung mitunter auf den falschen Begriff angewendet werden.

Lösungen:

Gegenwärtig gibt es keine konkrete Lösung, um zu verhindern, dass Übersetzungsmaschinen derartige Fehler machen. Solche Fehler können jedoch sehr einfach und schnell korrigiert werden, insbesondere im Rahmen einer leichten Revision durch eine Fachübersetzerin.

Segmentierungsfehler: Nicht erkannte Abkürzungen und falsche Satzsegmentierung

Damit die neuronale Übersetzungsmaschine (neural machine translations, NMT) funktionieren kann, muss der zu übersetzende Text korrekt in Sätze unterteilt (d.h. „segmentiert“) werden, bevor er dem…

Erklärung:

Damit die die neuronale Übersetzungsmaschine (neural machine translations, NMT) funktionieren kann, muss der zu übersetzende Text korrekt in Sätze unterteilt (d.h. „segmentiert“) werden, bevor er dem Übersetzungsalgorithmus vorgelegt wird.

Wenn Sätze während der Vorbearbeitung falsch segmentiert werden, wird die Übersetzung schlecht oder sogar unverständlich. Wenn zum Beispiel der Satz „En vertu de l’art. 13, le créancier dispose d’un délai de 30 jours pour exercer ses droits.” aufgrund des für die Abkürzung des Wortes „article“ verwendeten Punkts nach „art.“ abgeschnitten wird, wird die Maschine zunächst „En vertu de l’art.“ als „In der Kunst“ übersetzen und danach, ohne Rücksicht auf den ersten Satz, „13, le créancier dispose d’un délai de 30 jours pour exercer ses droits.“, was zu einem unbrauchbaren Ergebnis führen wird.