de

Language Data Management in der Lokalisierung: Was ist das und warum ist es nötig?

Die Lokalisierungsbranche verarbeitet täglich riesige Datenmengen. Für führende Lokalisierungsanbieter ist das eine wertvolle neue Chance, um sich im Bereich AI an die Spitze zu setzen. Als Researcher in der Sprachdienstleistungsbranche ist Konstantin Dranch an vorderster Front, wenn es darum geht, diese Gelegenheit in ein konkretes Konzept umzuwandeln, und zwar in Form einer neuen Rolle, genannt Language Data Manager. In den unendlichen Weiten von Translation Memorys, Terminologiedatenbanken, Aufzeichnungen verdolmetschter Meetings, untertitelten Videos und mehrsprachigen Dokumenten gibt es eine Nische für eine Tätigkeit und Tools, um die aus der Lokalisierung gewonnen Daten zu verwalten. Aber wie würde das in der Praxis aussehen? Konstantin klärt auf.

Mit der Schaffung der Rolle des Language Data Mangers (LDM) erfolgt der erste Schritt zur aktiven Nutzung der Datenressourcen, die die Lokalisierungsteams erzeugen. In welcher Form bzw. inwieweit existiert diese Rolle heute bereits?

Im Moment üben Spezialisten für bestimmte Tools in internen Sprachteams die Funktion des LDM aus; das heisst Nutzer von WorldServer, Trados, XTM, Memsoure, memoQ usw. Grundsätzlich übernehmen alle, die mit File Engineering zu tun haben, diese Aufgaben. Manchmal führen auch Experten für maschinelles Übersetzen diese Aufgaben aus, wobei sie sich natürlich auch der Daten annehmen. Wenn sie Machertypen sind, versuchen sie Unternehmenssilos für Sprachen zu finden, um die Innovation kontinuierlich voranzutreiben.

Zweisprachige Texte gibt es nicht nur in Form von Translation Memorys, sondern sehr häufig auch in nicht angepassten, nativen Dateiformaten wie zum Beispiel PDF, Word oder XML. Sobald man sich auf die Suche nach Daten macht, die einem nicht «gehören» – sprich, die nicht vom Übersetzerteam erzeugt wurden –, begibt man sich auf LDM-Terrain.

Im Gegensatz zu Sprachenteams kommen IT-Abteilungen im selben Unternehmen einfacher zu ihrem Ziel: Sie stellen spezialisierte Dateningenieure ein und extrahieren, speichern und analysieren alles, was sie finden können, und arbeiten die Daten neu auf.

Wer wird in Zukunft die Rolle des LDM übernehmen? Welche Fähigkeiten sind dazu notwendig und welche Probleme gilt es in 5 Jahren zu lösen?

Wie in den meisten Jobs gibt es zwei Seiten: die technische Kompetenz und die emotionale Intelligenz.

Bei den technischen Aspekten dieser Art von Arbeit geht es vor allem um Natural Language Processing (NLP). Wie werden grosse Datenmengen aligniert? Wie sieht die Struktur der Metadaten aus? Welche Skripte eignen sich, um die Qualität der Daten in der Pipeline sicherzustellen? Und das sind nur einige der zentralen Fragen.

Bei den menschlichen Aspekten hingegen steht die Überzeugungskraft im Vordergrund. Es geht darum, andere Abteilungen dazu zu bringen, Daten zu teilen oder ihre Workflows bzw. ihre Art der Datenverarbeitung zu verändern. Wichtig ist auch, die Bedürfnisse innerhalb der Organisation zu erkennen und ihnen entsprechend gerecht zu werden. Datenmanagement ist ein wichtiger Treiber für Diversität und Inklusion in einer Organisation, und die Resultate der Arbeit des LDM werden dazu beitragen, diese Ziele zu erreichen.

Language Data Management kann – wenn es richtig gemacht wird – einen grossen Mehrwert zu den Services beitragen, die ein Sprachdienstleister seinen Kunden anbietet. Doch was bedeutet «richtig gemacht» für dich? Welche wesentlichen Faktoren gilt es zu berücksichtigen, wenn die Rolle des Language Data Managers oder sogar eine entsprechende Abteilung auf die Beine gestellt wird? 

Zum jetzigen Zeitpunkt ist diese Rolle noch nicht sehr weit entwickelt. Deshalb ist sie auch in vielen Bereichen noch flexibel. Zwei mögliche Ansätze wären:

  1. Ein Manager des Lokalisierungsteams findet eine Jobnische für ein Teammitglied, das sich beruflich weiterentwickeln will. Idealerweise wäre das jemand, der sich für die digitale Welt interessiert und überlegt, einen Schritt von der Sprachabteilung hin zur IT-Abteilung zu machen. Auf diese Weise könnte die Person sich mit Datenmanagement befassen, diesen Bereich in seine Arbeit miteinbeziehen und gleichzeitig noch für die Sprachabteilung arbeiten.
  2. Es könnte eine LDM-Rolle ins Leben gerufen werden, um mehr Spielraum für IT-Projekte und mehr Mitbestimmung in der Organisation zu schaffen. Dies macht insbesondere in Organisationen Sinn, die neue Führungskräfte im Bereich Digitalisierung fördern wollen.

Unabhängig vom jeweiligen Ansatz ist vor allem wichtig, wirkungsvolle Ziele zu setzen. Wenn ein LDM nur etwa 5 % zur Lokalisierungsarbeit beiträgt, ist die Wirkung eher schwach. Wenn aber ein LDM Wege für Digitalisierungsprojekte ebnet, die mit User-generiertem Content arbeiten, Dialoge erzeugen und für Compliance und Wachstum stehen, dann ist die Wirkungskraft sehr gross.

Ein wichtiger Aspekt von LDM ist, dass die Daten innerhalb des gesetzlichen Rahmens verwendet werden. Welche Schritte sind nötig, um sicherzustellen, dass die Daten stets sicher und gesetzeskonform verarbeitet werden?

Die Datenquellen müssen zurückverfolgt und deren rechtliche Informationen auf dem Weg stets aufrechterhalten werden. Stellen Sie sich vor, Sie haben vertrauliche Daten mit einem Cloud-basierten Tool übersetzt und die Informationen unterliegen einer unterschriebenen Vertraulichkeitserklärung. In einem realistischen Szenario ist es sehr wahrscheinlich, dass niemand innerhalb der Organisation von der Existenz eines Translation Memory weiss, das vertrauliche Informationen enthält. Auch wenn also das Originaldokument vom Laufwerk gelöscht wird, «überlebt» die Übersetzung sozusagen. Sie bleibt also im Translation Memory, und wenn jemand eines Tages die Daten braucht und die Datei aus der Datenbank herunterlädt, entsteht so ein Risiko und eine gesetzliche Haftung für die gesamte Organisation. Solange es keine Blockchaintechnologie zur Rückverfolgung der Daten für den gesamten Lebenszyklus gibt, bleibt der Umgang damit schwierig.

Im Moment ist viel Bewegung im Thema LDM – was sind deine Prognosen dazu? Wohin geht es und wie wird die Zukunft aussehen?

  1. LDM wird sich zu einer etablierten Rolle in den Unternehmen entwickeln, ähnlich wie das auch schon in den Bereichen Diversität und Inklusion der Fall war.
  2. Zudem wird es eine Reihe von Tools für LDM geben. So zum Beispiel mehr und bessere Parser, um Daten aus Onlinequellen zu holen. Das Internet ist eine grossartige Quelle für Trainingsdatensätze und Hostingplattformen für das Datenmanagement.
  3. Communitys und Datenbanken wie Hugging Face, ELG, ELDA und ELREC werden immer grösser und professioneller.
  4. Auch Datenmarktplätze wachsen kontinuierlich. Wenn LDMs in der Lage sind, Daten zu kaufen, werden auch entsprechende Möglichkeiten geschaffen.
  5. LDM wird den Fokus auf Compliance-Regeln und Tools verstärken.