de

Neuronale maschinelle Übersetzung: Learning by Doing

NMT ist eine hochmoderne Technologie, die sich stetig weiterentwickelt. Mit zunehmender Verbesserung der Algorithmen hinter den Tools wird sie noch schneller und genauer werden.

Die neuronale maschinelle Übersetzung (NMT) hat im vergangenen Jahrzehnt die Sprachdienstleistungsbranche regelrecht revolutioniert. NMT ermöglicht die rasche Übersetzung grosser Textmengen zum Bruchteil der Kosten eines menschlichen Übersetzers. Für viele Unternehmen mit schmalen Budgets und knappen Deadlines ist NMT deshalb zur bevorzugten Übersetzungsmethode geworden.

Doch NMT hat auch Grenzen. Wenn Kontext, Stil, Terminologie und Konsistenz stimmen müssen, ist eine Maschine weit weniger zuverlässig als ein Mensch. Das bedeutet, dass NMT sich eigentlich nur für den informellen Inhouse-Gebrauch eignet. Nicht zu vergessen: Gratis Online-Tools bieten einem Unternehmen kaum Datenschutz. Deshalb ist es empfehlenswert, auch maschinelle Übersetzungen von einem akkreditierten Sprachdienstleister ausführen zu lassen.

Es tönt wie etwas aus einem Science-Fiction-Roman, hat sich aber mittlerweile längst im Angebot vieler Sprachdienstleister etabliert: Neuronale maschinelle Übersetzung oder kurz NMT ist die jüngste Innovation in einer Branche, die in den letzten beiden Jahrzehnten zahlreiche grosse Fortschritte gemacht hat. Erstmals tauchte der Begriff um 2013 in akademischen Artikeln auf. Seitdem hatten Entwickler von maschineller Übersetzungssoftware mehr als acht Jahre Zeit, NMT weiterzuentwickeln und zu verfeinern. Heute ist es ein leistungsstarkes Tool – und eine Geheimwaffe für alle diejenigen, die rasch Übersetzungen brauchen.

Was genau ist aber eigentlich neuronale maschinelle Übersetzung? Und wie unterscheidet sie sich von anderen Arten der maschinellen Übersetzung?

Der Unterschied ist recht einfach: Frühere Generationen von maschineller Übersetzung stützten sich beim Übertragen eines Textes in eine andere Sprache auf statistische Wahrscheinlichkeiten – daher auch der volle Name «statistische maschinelle Übersetzung» oder SMT. Nehmen wir einmal das Beispiel «To be, or not to be, that is the question». Wenn ein Experte den Satz in sieben von zehn Fällen als «Sein oder Nichtsein, das ist hier die Frage» übersetzt hat, würde ein SMT-Tool diesen Satz als beste Lösung in jedem Kontext verstehen. So heisst es in Artificial Intelligence: A Modern Approach:

«This approach […] does not need handcrafted grammars of the source and target languages […] all it needs is data—sample translations from which a model can be learned.» (Dieser Ansatz […] ist nicht auf in langwieriger Einzelarbeit zusammengestellte Grammatiken der Ausgangs- und Zielsprachen angewiesen, […] alles, was er benötigt, sind Daten – Musterübersetzungen, aus denen ein Modell abgeleitet werden kann.)

Beeindruckt? Nun ja, SMT hat leider auch viele Nachteile: nicht zuletzt die Notwendigkeit eines riesigen Datenarchivs, auf das sie zurückgreifen kann, Schwierigkeiten, bestimmte Fehler zu erkennen und zu beheben sowie das oberflächliche «Verständnis» der Texte in der Ausgangs- und Zielsprache. Ausserdem fällt es SMT-Tools vergleichsweise schwer, in eine Sprache mit einer anderen Wortstellung zu übersetzen.

Nachahmung des menschlichen Gehirns

Im Gegensatz zu SMT verwendet NMT ein künstliches neuronales Netzwerk, um die Reihenfolge der Wörter vorherzusagen, die in einem Textblock vorkommen. SMT nutzt separate Modelle für Ausgangs- und Zielsprache. NMT dagegen besteht aus einem integrierten Modell, das Wort für Wort durch den Text geht. Dabei stützt es sich auf Methoden des Deep Learning und des repräsentativen Lernens. NMT ist eine hochmoderne Technologie, die sich stetig weiterentwickelt. Mit zunehmender Verbesserung der Algorithmen hinter den Tools wird sie noch schneller und genauer werden. Einige Leserinnen und Leser haben vielleicht bemerkt, wie sehr sich beispielsweise Google Translate (ein NMT-Tool) in den letzten Jahren verbessert hat. Das kommt nicht von ungefähr: 2015 entwickelten Forscher am Montreal Institute of Learning Algorithms neue auf künstlicher Intelligenz (KI) basierende Techniken, die Google Translate in ein Tool verwandelten, das wirklich «denkt». Seither hat es sich deutlich weiterentwickelt.

Die künstliche Intelligenz, die hinter jedem NMT-Tool steckt, ist so angelegt, dass sie wie der menschliche Verstand lernt und sich weiterentwickelt. Mit der Zeit kann sie sich so an die fliessende, unendlich geschmeidige Natur der menschlichen Sprache anpassen. Sie kann Nuancen in bestimmten Wörtern, Sätzen und Zusammenhängen aufgreifen, Mehrdeutigkeiten überwinden und nach Bedarf «Lücken füllen». Noch besser arbeitet NMT, wenn ein Translation Memory und eine Terminologiedatenbank mit dem Tool verknüpft sind: In diesem Fall kann der Algorithmus auf eine vorgegebene Terminologie zurückgreifen und den Text an den hauseigenen Stil eines Unternehmens oder an Branchenvokabular anpassen.

Die Intelligenz der Maschine hat ihre Grenzen

Trotz der enormen Fortschritte bei NMT müssen sich menschliche Übersetzer/-innen noch nicht nach anderen Arbeitsfeldern umschauen. Konkret hat NMT im Wesentlichen drei Vorteile: Geschwindigkeit, Einblick und Menge. NMT kann riesige Textmengen innerhalb kürzester Zeit und exponentiell schneller bearbeiten als ein Mensch. Das ist ideal, wenn rasch eine Übersetzung benötigt wird. Nützlich ist es auch dann, wenn ein Text kurz nach seiner Veröffentlichung schon wieder veraltet sein wird. Nehmen wir an, mehrere französische Autoren arbeiten am Entwurf einer Publikation über Startup-Kultur. Einer von ihnen will den vorläufigen Text an einen Wirtschaftsexperten in London schicken, der kein Französisch spricht. Dann könnte er den Text rasch per NMT übersetzen lassen, damit der Experte sich einen groben Überblick über den Inhalt verschaffen kann. Dieser Vorgang lässt sich mit Leichtigkeit im Handumdrehen erledigen. Deshalb ist es wahrscheinlicher, dass Texte, die sonst nicht übersetzt würden, einfach mit minimalem Zeit-, Arbeits- und Kostenaufwand mit der Software bearbeitet werden. Natürlich besteht nach Bedarf dann immer noch die Möglichkeit, die maschinelle Übersetzung von Fachübersetzern/-innen posteditieren zu lassen.

Die Nachteile von NMT können – oder sollten zumindest – nicht ignoriert werden. So fortschrittlich die Technologie sein mag, perfekt ist sie nicht. NMT nähert sich wie erwähnt in ihrer Funktionsweise dem menschlichen Verstand an. Menschen machen aber von Zeit zu Zeit Fehler. Einen Text einfach durch ein NMT-Tool laufen zu lassen und ihn dann als fertiges Endprodukt zu veröffentlichen, ist nicht empfehlenswert. Ob in puncto Stil, Semantik, Syntax, Konsistenz oder allen vier Bereichen – die Qualität kann einfach nicht garantiert werden. Und dann ist da noch das grosse Thema Datenschutz: Bei der Eingabe eines Textes in ein Online-NMT-Tool spielen Sie möglicherweise Menschen in die Hand, die keine Sekunde zögern würden, die Daten zu missbrauchen. Es ist das Risiko einfach nicht wert.

E-Discovery: Auslotung neuer rechtlicher Grenzen

Hat die COVID-19-Pandemie die Globalisierung wirklich ausgebremst, wie viele denken? Ein Artikel in der Financial Times (Abo+) behauptet, dass das genaue Gegenteil der Fall ist: «As individuals and companies move online, national borders become less relevant […] this increased digital connectivity facilitates the rapid flow of ideas, the most influential dimension of globalisation.» (In dem Masse, in dem Menschen und Unternehmen ihre Aktivitäten online verlagern, verlieren Landesgrenzen an Bedeutung […] diese zunehmende digitale Konnektivität erleichtert den raschen Fluss von Ideen – die einflussreichste Dimension der Globalisierung.)

Mit der zunehmenden Verflechtung der Wirtschaft steigt auch die Zahl der grenzüberschreitenden, verschiedene Rechtsordnungen betreffenden Rechtsfälle, an denen mehrere Akteure beteiligt sind. Dadurch wächst auch der Bedarf an der Aufbereitung unstrukturierter Daten, auch «E-Discovery» genannt. Von Bedeutung ist dies beispielsweise vor einem Gerichtsverfahren, bei dem jede Partei Beweise sammelt, indem sie Informationen im elektronischen Format einholt.

In diesem Bereich kann neuronale maschinelle Übersetzung von enormem Nutzen sein. Wenn diese Informationen einem Sprachdienstleister zur Bearbeitung zugesendet werden, können sie unabhängig vom Volumen in beliebig viele Sprachen übersetzt werden. Diese Vorgehensweise ist schnell, genau und sicher, denn die Daten werden von einem zentralen Standort aus verarbeitet – was natürlich bei Beweisen, die dem Gericht vorgelegt werden könnten, von besonderer Bedeutung ist. Die Anwendung von NMT ist wesentlich kostengünstiger, als alle Dokumente von Humanübersetzern in alle Sprachen übertragen zu lassen (zumal viele Texte am Ende vielleicht gar nicht relevant für den Fall sind). Bei Dokumenten, die für die Vorbereitung des Rechtsteams auf den Fall von wesentlicher Bedeutung sind, könnten dann menschliche Fachübersetzer/-innen hinzugezogen werden, um dem mit NMT übersetzten Text den letzten Schliff zu geben. Der Inhalt kann abschliessend von Juristen, die sich mit dem Rechtssystem des entsprechenden Landes auskennen, geprüft werden.

In wenigen Minuten vom SMI zum FTSE

Finanzprofis müssen schnell auf Entwicklungen an den Finanzmärkten reagieren können. Gemäss der FINRA, einer Selbstregulierungsorganisation der Finanzbranche, finden weltweit täglich 75 Milliarden Marktereignisse statt. Dabei wird eine riesige Menge an Informationen produziert. Der grösste Teil davon wird innert Stunden (oder sogar Minuten) irrelevant, und die meisten Finanzprofis haben nicht die Zeit, sich tiefer damit zu befassen. Wenn sie sich allerdings mit den Informationen befassen müssen, wollen sie diese in ihrer Muttersprache haben – und zwar sofort.

Hier kommt NMT wieder ins Spiel. Nehmen wir einmal an, eine Bank verfügt über ein Tool, das täglich Dutzende Berichte über börsennotierte Unternehmen veröffentlicht. Die Mehrzahl davon wandert ins Archiv, ohne dass sie jemand auch nur anschaut. Doch ab und zu interessiert sich ein Kundenberater oder ein Kunde für einige dieser Berichte (in Französisch, Deutsch oder Italienisch). Ein NMT-Tool könnte ihnen diese Berichte ohne Verzögerung zur Verfügung stellen – und zwar in der von ihnen bevorzugten Sprache.

Wie Sie von der NMT-Lösung eines professionellen Anbieters profitieren können

Ein klares Fazit: Für grosse Datenvolumen, die rasch und ausschliesslich zum internen Gebrauch übersetzt werden müssen, ist neuronale maschinelle Übersetzung die Innovation, auf welche die Welt gewartet hat. Wenn ein zertifizierter Sprachdienstleister damit beauftragt wird, ist der Prozess schnell, kostengünstig und sicher. Darüber hinaus kann er allen Projekten und Branchen umfassendere und fundiertere inhaltliche Einblicke bieten. Denken Sie aber daran: Das Endprodukt wird kein perfekter, geschliffener Text sein, der an ein grosses Publikum verbreitet werden kann – dafür müssen menschliche Post-Editor/-innen ins Boot geholt werden.

Zum Glück bietet SwissGlobal ihren Kunden sowohl neuronale maschinelle Übersetzung als auch Post-Editing an. Das Gebiet ist vergleichsweise neu, dennoch nehmen wir es ernst: Ab Mai 2021 werden wir nach ISO 18587 – dem internationalen Standard für Post-Editing – zertifiziert sein. Alle Anbieter von maschineller Übersetzung, mit denen wir zusammenarbeiten, werden sorgfältig überprüft. So stellen wir sicher, dass auch sie die höchsten Standards einhalten. Bei allen NMT-Projekten erarbeiten wir gemeinsam mit unserem Kunden ein massgeschneidertes Translation Memory, das auf unternehmens- und branchenspezifischer Terminologie beruht. Dadurch bietet jeder maschinell übersetzte Text die richtige Balance in puncto Ton, Qualität und Konsistenz der Sprache.

Ob Recht, Finanzen, Wirtschaft oder Industrie: Neuronale maschinelle Übersetzung könnte Ihre alltägliche Arbeit beschleunigen und bereichern. Kontaktieren Sie uns: Wir demonstrieren Ihnen gerne, was unsere NMT-Tools können – und informieren Sie bei Bedarf auch über unsere anderen Sprachdienstleistungen.

  • künstliche Intelligenz
  • maschinelle Übersetzung