Warum die Erstellung guter Untertitel kein Zuckerschlecken ist
Untertitel sind für uns beinahe alltäglich geworden: Sie begleiten uns auf den verschiedenen Social-Media-Plattformen in informativen oder unterhaltsamen Videos und Reels. Jede/-r kann mit der passenden App automatisierte Untertitel erstellen. Da drängt sich die Frage auf, warum man überhaupt noch auf einen professionellen Untertitelungsservice zurückgreifen soll.
Die Erstellung von Untertiteln erfordert mehr als nur die automatische Umwandlung von Sprache in Text. Besonders bei professionellen Anwendungen in der Film- und Fernsehproduktion oder auch bei Online-Inhalten von Unternehmen, wie beispielsweise Imagevideos oder ein Interview mit dem CEO, spielt die manuelle Nachbearbeitung eine entscheidende Rolle. Doch auch von Gesetzes wegen sind Untertitel heutzutage nicht mehr immer nur freiwillig: So fordert das Schweizer Behindertengleichstellungsgesetz nicht nur, dass beispielsweise Schweizer Bahnhöfe barrierefreie Einstiegsmöglichkeiten bieten, sondern es hält auch immer mehr im öffentlichen Raum agierende Unternehmen dazu an, ihre Videos und Filme in einer für Menschen mit Hörbehinderung geeigneten Form aufzubereiten.
Die Qualität des unbearbeiteten Outputs von KI-basierten Tools ist für solche Fälle nicht ausreichend, denn sie können insbesondere mit Akzent gesprochene Passagen, Eigennamen und schnell Gesprochenes oder mit Hintergrundgeräuschen «verschmutzte» Aufnahmen nicht immer einwandfrei und über jeden Zweifel erhaben in den korrekten Text umwandeln. Hier müssen Profis eingreifen, die die technischen wie auch sprachlichen Anforderungen und Vorgaben an Untertitel kennen und auch umsetzen können.
Sprachliche Vorgaben? Okay, natürlich müssen die Untertitel fehlerfrei sein, oder?
Natürlich. Aber sprachliche Vorgaben für Untertitel gehen weit über die Rechtschreibung und korrekte Grammatik hinaus. Texte – ob gesprochen oder geschrieben – bestehen immer aus zusammenhängenden Sinneseinheiten. Deutsch hat hier die Eigenschaft, dass die meisten Sätze – vereinfacht ausgedrückt – mit einem Subjekt beginnen, dann kommt das Verb, das die Handlung beschreibt und zum Schluss das Objekt, das die Handlung erfährt. Wenn wir nun diese Sinneseinheiten in den Untertiteln ungünstig zerstückeln oder gar auseinanderreissen, hat unser Gehirn sehr viel mehr Mühe, die Infos aus den Untertiteln aufzunehmen, als wenn diese wohlgeformt und in guten Paketen strukturiert sind. Nachfolgend zwei Beispiele hierzu:
Beispiel 1 | Beispiel 2 |
Texte – ob gesprochen oder geschrieben – bestehen immer aus zusammenhängenden Sinneseinheiten. Deutsch hat hier die Eigenschaft, dass die meisten Sätze mit einem Subjekt beginnen, dann kommt das Verb, das die Handlung beschreibt und zum Schluss das Objekt, das die Handlung erfährt. Wenn wir nun diese Sinneseinheiten in den Untertiteln ungünstig zerstückeln oder gar auseinanderreissen, hat unser Gehirn sehr viel mehr Mühe, die Infos aus den Untertiteln aufzunehmen, als wenn diese wohlgeformt und in guten Paketen strukturiert sind. | Texte – ob gesprochen oder geschrieben – bestehen immer aus zusammenhängenden Sinneseinheiten. Deutsch hat hier die Eigenschaft, dass die meisten Sätze mit einem Subjekt beginnen, dann kommt das Verb, das die Handlung beschreibt und zum Schluss das Objekt, das die Handlung erfährt. Wenn wir nun diese Sinneseinheiten in den Untertiteln ungünstig zerstückeln oder gar auseinanderreissen, hat unser Gehirn sehr viel mehr Mühe, die Infos aus den Untertiteln aufzunehmen, als wenn diese wohlgeformt und in guten Paketen strukturiert sind. |
Haben Sie die beiden Beispiele durchgelesen und einen Unterschied festgestellt? Beim zweiten wurde unter anderem darauf geachtet, dass
- Artikel und Substantiv nicht getrennt werden;
- die Zeilen nicht auf eine Konjunktion enden;
- Substantive nicht von ihren Adjektiven getrennt werden;
- die zweite Zeile eines Untertitelblocks nach Möglichkeit länger ist als die erste Zeile (Pyramidenform); und
- die Zeilen eine bestimmte Zeichenzahl nicht überschreiten.
Das sind nur einige der sprachlichen Eigenschaften, die Untertitel üblicherweise befolgen sollten, damit sie für unser Gehirn möglichst einfach verarbeitbar sind.
Und was bitte schön sind technische Vorgaben für Untertitel?
Zwei solcher Vorgaben haben wir oben gerade schon gesehen: Untertitel sollten beispielsweise nicht zu lang sein und – je nach Kundenvorgaben – eine Zeichenzahl von ca. 40 bis 43 Zeichen inklusive Leerzeichen nicht überschreiten. Diese verteilen sich idealerweise nicht über mehr als zwei Zeilen. Bei zu langen Untertiteln haben wir sonst keine Chance, alles rechtzeitig zu lesen. Oder der Text, den wir lesen, stimmt schon nicht mehr mit dem Bild überein, denn das Video läuft schliesslich weiter und wartet nicht, bis wir mit dem Lesen durch sind.
Gerade zu diesem Punkt gibt es auch eine wichtige technische Vorgabe, die sich «Sprechgeschwindigkeit» nennt. Dabei wird gemessen, wie viele Zeichen in einer Sekunde gelesen werden müssen. Man rechnet also die Anzahl Zeichen des Untertitels geteilt durch die Einblendungszeit des Untertitels. Das ist wiederum verknüpft damit, wie lange ein Untertitel minimal und maximal eingeblendet werden darf. Und diese Komponente wiederum wird davon beeinflusst, ob es im Video Szenenwechsel gibt, also z. B. zuerst ein Sprecher und dann eine weitere Sprecherin gezeigt wird.
Ganz schön viele Dinge, die da beachtet werden müssen, nicht?
Bei einigen der diversen Anforderungen an Untertitel unterstützen uns passende Tools. Sie können mithilfe von künstlicher Intelligenz ein automatisiertes maschinelles Transkript erstellen und es in zweizeilige Einheiten mit einer maximalen Zeichenzahllänge unterteilen. Das ist aber meist eine rein mathematische Unterteilung, ungeachtet dessen, ob die Sinneseinheiten zerstückelt werden oder nicht. Danach beginnt die eigentliche Arbeit, bei der – ähnlich wie bei einem Post-Editing nach der maschinellen Vorübersetzung – das Rohtranskript durch einen Untertitelungsprofi überarbeitet und in eine geeignete, vom Gehirn möglichst einfach aufnehmbare Form gebracht wird.
Es steckt also sehr viel Arbeit in guten Untertiteln. Und – seien wir ehrlich – bestimmt haben wir alle schon Filme mit schlechten Untertiteln gesehen. Das ist nämlich immer dann der Fall, wenn wir stocken oder innehalten, weil wir uns zu stark auf das Geschriebene konzentrieren müssen. Auch hier haben wir eine Parallele zu Übersetzungen, denn eine solche soll gar nicht als Übersetzung erkannt werden. Genau gleich sollten wir ein Video oder einen Film mit Untertiteln mit möglichst wenig Aufwand schauen und uns auf den übermittelten Inhalt des Videos konzentrieren können, ohne Untertitel zweimal lesen zu müssen, bis wir sie verstehen.
Noch nicht überzeugt? Dann testen Sie am besten den Untertitelungsservice von SwissGlobal. Wir zeigen Ihnen gerne den Unterschied zwischen einer unbearbeiteten und einer überarbeiteten KI-Transkription. Nehmen Sie dazu gerne Kontakt auf mit unserem Projektmanagement.
-
Kommunikation
Sprachdienstleistung
Technologie
translation