Maschinelle Übersetzung: So profitieren Sie von künstlicher Intelligenz beim Übersetzen
Maschinelle Übersetzungen (MÜ), insbesondere Neural Machine Translation (NMT), sollen in Zukunft gute, schnelle und kosteneffiziente Sprachlösungen ermöglichen. Doch der Weg dorthin ist steinig, denn der zeitliche und der finanzielle Aufwand sind nicht zu unterschätzen.
Umso wertvoller ist die Unterstützung durch erfahrene Fachleute mit dem nötigen technischen und linguistischen Know-how. Denn sie wissen, welche Mittel und Massnahmen nötig sind, um die gesetzten Ziele zu erreichen.
Worum geht es bei der neuronalen maschinellen Übersetzung?
Im nationalen und internationalen Geschäftsleben, gerade im Bereich der Beschaffung, ist die mehrsprachige Kommunikation ein Muss. Die Anpassung an die Sprache vor Ort kann sich, wie eine Studie aus den USA aufzeigt, wachstumssteigernd auswirken: So konnte eBay zum Beispiel dank eigener NMT-Lösung das Exportvolumen aus Grossbritannien um 17,5 % steigern.
Damit die neuronale maschinelle Übersetzung gelingt, sind Regeln und Algorithmen zu definieren und auf die binäre Sprache der Maschine zu übertragen. Diese stellen auf verschiedenen Ebenen Zusammenhänge zwischen zweisprachigen Texten her.
Neuronale Übersetzungsmaschinen berechnen riesige Datenmengen in Millisekunden. Das funktioniert nur dank grosser Rechenleistung und dem sogenannten DeepLearning, einer Methode zur Optimierung künstlicher neuronaler Netze. Mit DeepLearning können Unternehmen den Übersetzungsaufwand reduzieren, den Prozess beschleunigen und die Kosten mittelfristig senken. Um diesen Weg zu bestreiten, braucht es einen strategischen Entscheid, bei dem es um Geld, Ressourcen und um die Frage geht, wie ein Unternehmen in Zukunft am Markt auftreten will.
Künstliche Intelligenz (Artificial Intelligence, AI)
Mittels künstlicher Intelligenz können Maschinen Arbeiten und Aufgaben ausführen, die menschenähnliches Denkvermögen erfordern. Durch diese Technologie können Computer beispielsweise grosse Mengen an Daten analysieren und basierend darauf Prognosen oder Empfehlungen abgeben.
Maschinelles Lernen (Machine Learning, ML)
In diesem Teilgebiet der künstlichen Intelligenz geht es um selbstlernende Algorithmen. Anhand bestehender Daten erkennen diese Muster und können so eigenständig «Entscheidungen» treffen.
Deep Learning
Deep Learning ist wiederum ein Teilgebiet des maschinellen Lernens (ML). Basierend auf neuronalen Netzen, ähnlich dem menschlichen Gehirn, lernen Computer ohne menschliche Hilfe. Anhand grosser Datenmengen bringen sich Maschinen selbstständig das Lernen und Denken bei.
Grundsatzfragen müssen geklärt werden
Will man in ein professionelles maschinelles Übersetzungssystem investieren? Welches Kosten-Nutzen-Ziel soll in welchem Zeitrahmen realisiert werden? Welche Zielgruppen will man ansprechen, in welchen Sprachen, welche Qualitätskriterien gilt es zu erfüllen, welche Vorgaben wie Terminologie, Corporate Wording und Referenztexte sind vorhanden? Welche technischen Anforderungen gibt es? Welche Sicherheitsvorgaben müssen berücksichtigt werden? Denkt man über eine interne Lösung nach oder über eine Anbindung mit Schnittstelle zu einem externen Anbieter?
Dann folgt das Training
Die Maschine wird mit Paralleltexten, also mit Ausgangstexten und den entsprechenden Übersetzungen, sowie branchen- und unternehmensspezifischer Terminologie gefüttert. Es wird getestet, der Output analysiert und korrigiert. Sind die Fachbegriffe korrekt übersetzt worden? Wo soll verbessert werden? Die Korrekturen werden eingelesen, die Maschine trainiert. Dann erfolgt eine erneute Prüfung, wieder wird korrigiert, analysiert, bewertet und eingelesen. Dieser Trainingsvorgang wiederholt sich, bis der gewünschte Grad an Präzision erreicht und man mit der Qualität der maschinellen Übersetzung zufrieden ist.
Und wieso soll ein Unternehmen in eine eigene Lösung investieren?
Die öffentlich zugänglichen maschinellen Übersetzungsmaschinen aus der Cloud, wie Google Translate oder DeepL, erfreuen sich wachsender Akzeptanz. Sie kosten nichts und können je nach Verwendungszweck ein ansprechendes Resultat liefern. Mit eigenen Sprachkenntnissen angereichert, kann der Output einer Maschine gut verstanden werden und genügt oft für eine einfache, niederschwellige Kommunikation. Aber wie schaut es aus, wenn Inhalte vertraulich sind? Welche Gefahr besteht bei sensiblen Informationen, die nicht veröffentlicht werden dürfen?
Datenschutz und Vertraulichkeit?
Cloud-Anbieter bieten ihre Dienste nicht aus purem Altruismus „kostenlos“ an. Es ist wichtig zu wissen, dass nichts umsonst ist (TINSTAAFL). Der Preis für den Gebrauch einer frei zugänglichen Übersetzungsmaschine aus der Cloud sind die in den Inhalten befindlichen Daten. Alle Inhalte und Rechte gehen mit einem Schlag in den Besitz des Anbieters des jeweiligen maschinellen Übersetzungstools über. Gemäss den Nutzungsbedingungen von Google z. B. dürfen Google und alle, mit denen Google zusammenarbeitet, die Daten und Inhalte für ihre eigenen Zwecke weltweit verwenden, hosten, speichern, vervielfältigen, verändern, kommunizieren, veröffentlichen, öffentlich aufführen, öffentlich anzeigen, verteilen und abgeleitete Werke daraus erstellen (einschliesslich solcher, die aus Übersetzungen, Anpassungen oder anderen Änderungen resultieren.
Wenn ein Unternehmen also mit vertraulichen Daten (z. B. mit personenbezogenen Daten, börsenrelevanten Informationen oder Patenten) zu tun hat, muss es sich zwangsläufig und aus Datenschutzgründen Gedanken zur Datenhandhabung machen. In einem solchen Fall sind Sicherheit und Vertraulichkeit die wichtigsten Treiber für eine Investition in eine eigene Lösung oder für eine sichere Anbindung an einen externen Anbieter.
Haben Sie Fragen rund um das Thema? Nehmen Sie Kontakt mit uns auf.
Unsere Publikationen zum Thema [PDF-Downloads]
Nützliches rund um das Thema NMT
- Interessante News & Beiträge rund um Neural Machine Translation (NMT) auf slator.com
- Forschungsberichte rund um Machine Learning
- Forschungsprojekt „Erweiterter Kontext in Neuronaler Maschineller Übersetzung“ der Universität Zürich
- OpenNMT – Open Source Initiative from MIT