de

Vielen Dank!

Wir haben Ihre Anfrage erhalten und melden uns so bald wie möglich bei Ihnen.

Vergessene Sprachen: Wiederbelebung dank KI

Gemäss der Website Ethnologue werden heute weltweit 7’151 Sprachen gesprochen. Über den gesamten Verlauf der Menschheitsgeschichte hin gesehen dürften es allerdings total mindestens 31’000 sein. Von einigen dieser Sprachen gibt es noch Spuren – Wörterbücher, Literatur oder andere Aufzeichnungen –, aber von vielen ist die Bedeutung nicht mehr bekannt. Immer wenn eine Sprache verschwindet, geht auch ein Stück menschliches Kulturgut verloren. Aber wie genau kann KI dabei helfen, diese lange verlorenen Sprachen wiederherzustellen?

Um eine ausgestorbene Sprache zu verstehen, ist es zunächst nötig, ihre Schrift zu entziffern. Der Zweck jeder Schrift ist es, die Laute einer Sprache festzuhalten. Identifiziert man also diese Laute und vergleicht sie mit denjenigen anderer Sprachen, dann sieht man, ob es verwandte Wörter (d. h. mit gemeinsamem Ursprung) gibt. Dieser Vergleich zwischen vielen verschiedenen Sprachen würde für Menschen ewig dauern. Hier kommt KI zum Zug.

Das Potenzial des maschinellen Lernens

Jiaming Luo und Regina Barzilay vom Massachusetts Institute of Technology (MIT) und Yuan Cao von Googles KI-Labor in Mountain View, Kalifornien, haben ein maschinelles Lernsystem entwickelt, das über das Potenzial verfügt, ausgestorbene Sprachen zu entziffern. Das System basiert auf dem Prinzip, dass jede Sprache bestimmte Wortmuster hat. Durch die Identifizierung dieser Muster bei einer unbekannten Sprache und ihre Anwendung auf eine bekannte Sprache wird es möglich, die Bedeutung eines Textes zutage zu fördern.

Das Team hat sein System unter der Verwendung der Linearschrift B getestet. Diese Schrift stammt aus dem 14. Jahrhundert v. Chr. und ist eine frühe Version von Altgriechisch und von Ugaritisch, das wiederum eine frühe Form des Hebräischen darstellt. Das System konnte 67,3 % verwandte Wörter zwischen Altgriechisch und der Linearschrift B identifizieren. Das ist eine bemerkenswerte Leistung und ein ganz neues Level für die maschinelle Übersetzung.

Alle Sprachen auf einmal

Der wichtigste Vorteil von KI beim maschinellen Übersetzen ist, dass das System die Ursprungssprache, von der eine Sprache abstammt, nicht kennen muss. Sowohl die Linearschrift B als auch Ugaritisch konnten von Linguisten entziffert werden, weil diese wussten, welche Sprache die Schriftzeichen darstellten. Ein maschinelles Lernsystem hingegen kann in jeder bekannten Sprache nach verwandten Wörtern suchen und braucht dafür nur einen Bruchteil der Zeit, die eine einzelne Person oder gar ein Team benötigen würde. Die Technik, jede mögliche Kombination auszuprobieren, ist ein bekannter, wenn auch ziemlich brachialer Ansatz – auf diese Weise knacken Computer Passwörter.

Da ein maschinelles Lernsystem den Text, den es übersetzt, nicht «versteht», wird immer ein Humanübersetzer das Ergebnis überprüfen und sicherstellen müssen, dass die Übersetzung korrekt ist und auch natürlich klingt. Bei der maschinellen Übersetzung ist das bereits gewährleistet. Aber das Potenzial dieser neuen Methode ist bahnbrechend. Und es bringt uns möglicherweise einen wichtigen Schritt näher an die Entzifferung ikonischer Artefakte wie der Linear-A-Tafeln, des Diskos von Phaistos oder des Voynich-Manuskripts, die alle in Sprachen geschrieben sind, die bisher noch kein Übersetzer entziffern konnte.

Schritt halten mit der Zukunft

Übersetzer arbeiten seit Jahrzehnten mit Hilfe von Computertechnologie – und SwissGlobal liegt dieses Thema seit jeher am Herzen. Von CAT-Tools bis hin zu Datensicherheitslösungen via maschinelle Übersetzung: Technologie gehört zu den Kernelementen unseres Angebots. Wir verfolgen die Veränderungen und Entwicklungen im Bereich maschinelles Übersetzen mit grossem Interesse, während die Technologie dahinter immer ausgefeilter wird. Deshalb freuen wir uns, unseren Kunden in Zukunft noch bessere maschinelle Übersetzungen anbieten zu können.