Was ist maschinelle Übersetzung?
Methoden und Zukunft der automatischen Übersetzung
Obwohl schon seit mehreren Jahrzehnten an Formen der maschinellen Übersetzung geforscht und gearbeitet wird, ist dieses Thema aufgrund von neuen Technologien seit einigen Jahren wieder mehr in den Fokus von Sprachwissenschaftlern und Computerlinguisten, Übersetzern und Dolmetschern, aber auch fachfremden Personen gerückt. Im Folgenden soll die „maschinelle Übersetzung“ (abgekürzt MÜ) oder auch „automatische Übersetzung“ näher beleuchtet und für mögliche Nutzer anschaulich dargestellt werden.
Was ist maschinelle Übersetzung?
Der Begriff maschinelle Übersetzung bezeichnet die rein automatische Übersetzung eines Ausgangstexts in einen anderssprachigen Zieltext mit Hilfe eines Computerprogramms, bei der jegliche menschliche Mitwirkung nahezu überflüssig wird. Dies ist auch einer der wesentlichen Knackpunkte in der Diskussion um dieses Thema. Die Frage ist, ob eine von einer Maschine bzw. programmierten Software erstellte Übersetzung je so genau sein kann wie die eines Menschen, der nicht nur aufgrund von Algorithmen arbeitet, sondern zusätzlich ein gewisses Weltwissen und unbestimmte äußere Faktoren mit in seine Arbeit einbeziehen kann.
Wie funktioniert maschinelle Übersetzung?
Im Wesentlichen gibt es fünf Formen bzw. Methoden der maschinellen Übersetzung, wobei heutzutage aber auch häufig Hybridsysteme, also eine Mischung aus zwei oder mehr der im folgenden dargestellten Methoden Anwendung finden.
1. Regelbasierte MÜ
Dieser Form der maschinellen Übersetzung liegen zahlreiche linguistische Regeln, Informationen zu Morphologie, Syntax und Semantik sowie (Fach-)Wörterbücher zugrunde. Ein Quelltext wird mit Hilfe dieser Regeln und Wörterbücher analysiert und, in der Regel Wort für Wort, auf Basis der Regeln der Zielsprache in diese übertragen.
2. Beispielbasierte MÜ
Bei dieser Art der maschinellen Übersetzung wird ein Ausgangstext anhand von gespeicherten Wort-, Segment-, bzw. Satzdatenbanken in die entsprechende Zielsprache transferiert. Hier wird also mit einer Art Übersetzungsspeicher gearbeitet, welcher bestimmte gängige Wortkombinationen, Sätze oder Redewendungen enthält. Ein Quelltext wird dann durch Berechnungen des Systems auf Ähnlichkeiten geprüft und so entsteht ein neuer Text in Zielsprache.
3. Statistische MÜ
Auch im Falle dieser maschinellen Übersetzungsmethode wird mit Datenbanken gearbeitet, die ausgangs- und zielsprachliche Einheiten speichern. Es werden parallele Texte, von Menschen übersetzt, analysiert, Wörter und Zusammenhänge zwischen den Sprachen extrahiert und Zieltexte werden dann aufgrund statistischer Wahrscheinlichkeiten erstellt. Unter Umständen ist es bei dieser Methode sogar möglich, Regeln zu finden, die die Sprachwissenschaft noch nicht kennt.
4. Neuronale MÜ
Was ist das und wie funktioniert sie?
Diese Form der maschinellen Übersetzung basiert ebenfalls auf der Analyse von zweisprachigen Texten, genau wie die statistische MÜ. Die Architektur eines künstlichen neuronalen Netzes ist von dem biologischen neuronalen Netz des Gehirns inspiriert. Ein solches System wird mit enormen Datenmengen trainiert, wobei Zusammenhänge zwischen Ausgangs- und Zieltext erfasst werden. Im Idealfall „lernen“ diese Systeme dazu, können sich so verbessern und eine eigene Intelligenz entwickeln, daher spricht man auch von adaptiver maschineller Übersetzung. Durch die stetig wachsende, enorme Leistungsfähigkeit von modernen Rechnern ist diese Form der MÜ heute tatsächlich eine der präzisesten, welche beste Ergebnisse liefert und andere Formen, wie die statistische MÜ, verdrängt.
5. MÜ mit menschlicher Hilfe
In diesem Fall wird eine Übersetzung zwar auch rein maschinell erstellt, eine gewisse Vorarbeit durch den Benutzer ist hier allerdings erforderlich. Kommen mehrdeutige oder schwer zu übersetzende Konstruktionen im Ausgangstext vor, so müssen diese vom Benutzer selbst übersetzt oder aber ganz vermieden werden. Der Benutzer könnte z.B. aus langen Sätzen mehrere kurze machen oder während der Übersetzung die in seinem Fall korrekte Bedeutung eines Wortes auswählen.
Kurze Übersicht
Art der maschinellen Übersetzung | Funktionsweise der maschinellen Übersetzung |
Regelbasierte MÜ | - Basiert auf linguistischen Regeln, Informationen zu Morphologie, Syntax und Semantik sowie (Fach-) Wörterbüchern - In der Regel wörtliche Übertragung in Zieltext |
Beispielbasierte MÜ | - Transfer von Ausgangs- in Zieltext anhand von gespeicherten Wort-, Segment-, bzw. Satzdatenbanken (Übersetzungsspeicher) - Quelltext wird automatisch auf Ähnlichkeiten geprüft und in Zieltext übertragen |
Statistische MÜ | - Arbeitet ebenfalls mit Datenbanken, die ausgangs- und zielsprachliche Einheiten (bereits von Menschen übersetzt) speichern - Analyse paralleler Texte, Erkennung von Zusammenhängen und Erstellung von Zieltexten aufgrund statistischer Wahrscheinlichkeiten |
Neuronale MÜ | Basiert, gleich der statistischen MÜ, auf der Analyse von zweisprachigen Texten und der Erkennung von Zusammenhängen - Die Architektur eines künstlichen neuronalen Netzes ist von dem biologischen neuronalen Netz des Gehirns inspiriert - Systeme dieser Art können „dazu lernen“, sind sehr präzise und verdrängen andere Arten der MÜ |
MÜ mit menschlicher Hilfe | - Verlangt Vorarbeit des Benutzers vor maschineller Übersetzung - Mehrdeutige oder schwer zu übersetzende Konstruktionen im Ausgangstext müssen selbst übersetzt, geändert oder vermieden werden |
Welchen Nutzen, bzw. welche Vor- und Nachteile bringt der Einsatz von MÜ?
Besonders aus Sicht des Kunden sind die Vorteile einer maschinell erstellten Übersetzung gegenüber einer Übersetzung, die von Menschen angefertigt wurde, recht offensichtlich. Vor allem ist eine maschinelle Übersetzung günstiger bis hin zu kostenlos, wenn man öffentlich zugängliche Tools wie bspw. den Google Translator bemüht. Damit zusammen hängt auch der Faktor Zeit; eine von Menschen angefertigte Übersetzung dauert natürlich weitaus länger, bei maschineller Übersetzung kann in kürzerer Zeit eine viel größere Menge Text in eine andere Sprache übertragen werden. Umfangreiche Texte können in kurzer Zeit nur von mehreren menschlichen Übersetzern übersetzt werden, was wiederum höhere Kosten verursachen würde.
Dennoch bleibt das Thema der maschinellen Übersetzung ein strittiges und viel diskutiertes, bringt es doch auch einige Nachteile im Vergleich zu einer klassischen, menschgemachten Übersetzung mit sich. Wer schon einmal etwas komplexere Texte beispielsweise durch den Google Übersetzer gejagt hat, der weiß, dass die gelieferten Ergebnisse oftmals eine seltsame Satzstruktur aufweisen und sich nicht flüssig lesen lassen. Das liegt daran, dass dieses Programm nicht idiomatisch übersetzen kann. Ebenso können Stilmittel wie Humor, Ironie oder auch Metaphern vom Computer nicht erkannt werden; die Bedeutung von Wörtern kann in verschiedenen Kontexten variieren - wird dies nicht berücksichtigt, kann es schlussendlich zu falschen Übersetzungen kommen, welche durch eine menschliche Betrachtung wahrscheinlich vermeidbar gewesen wären. Dies trifft insbesondere auf regel- und beispielbasierte, sowie statistische maschinelle Übersetzungen zu. Die nahezu grenzenlose Vielfalt von Sprache, ihre Komplexität und die häufige Mehrdeutigkeit ist von diesen Systemen in der Regel nicht zu erfassen.
Daraus ergibt sich nun aber auch aus Sicht eines menschlichen Übersetzers ein gewisser Nutzen der maschinellen Übersetzung, wenn man die Kombination Mensch-Maschine in Betracht zieht. Durch das stetige und schnelle Wachstum des Internets, Globalisierung und Rationalisierung steigt der weltweite Bedarf an qualitativ hochwertigen Übersetzungen rasant an. Dieser ist durch „normale“ Übersetzer kaum zu decken. Macht sich ein Humanübersetzer nun also die Schnelligkeit maschineller Übersetzung zunutze und ergänzt deren nicht ganz mängelfreie Ergebnisse durch ein von ihm durchgeführtes Post-Editing, so kann er seine Arbeit mit modernen Mitteln optimieren und an aktuelle Gegebenheiten und den derzeitigen Arbeitsmarkt anpassen.
Anwendungsbereiche: Wann und wofür wird maschinelle Übersetzung eingesetzt?
Wie bereits im vorangegangenen Punkt erwähnt, lohnt sich eine maschinell erstellte Übersetzung zum Beispiel immer dann, wenn das Ergebnis innerhalb kürzester Zeit benötigt wird und der zu übersetzende Text dabei sehr umfangreich ist. Dazu sollten die Textinhalte nicht zu fachspezifisch sein und keine besondere Terminologie enthalten.
Dies sind die häufigsten Anwendungsbereiche für MÜ:
- Internationale Kommunikation mittels E-Mails oder Geschäftskorrespondenz wird durch MÜ deutlich schneller abgewickelt.
- Bereits vorhandene Dokumente können schnell für ausländische Niederlassungen oder Geschäftspartner in deren eigenen Sprache verfügbar gemacht werden.
- Übersetzung von technischen Texten, z.B. Dokumentationen, Handbücher, Betriebsanleitungen etc. Vor allem bei weitgehend standardisierten Texten ist MÜ sehr effizient (v.a. durch den Einsatz von Satzarchiven).
- Übersetzung von Webseiten zum Verständnis des Inhalts (Leseverstehen).
- Übersetzung von Webseiten, um diese mehrsprachig im Internet zur Verfügung zu stellen.
- Einsatz von MÜ in Online-Chats, Echtzeit-Auktionen
Literarische Übersetzung von Romanen und Gedichten sind weniger gut für eine maschinelle Übersetzung geeignet.
Welche Anbieter für maschinelle Übersetzung gibt es?
Hier ist zunächst anzumerken, dass es zwei Formen von Systemen gibt, generische und individualisierbare.
In die generischen Systeme fließen große Datenmengen aus verschiedensten Fachbereichen ein, weshalb diverse Übersetzungen mit so einem System sehr gut realisierbar sind. Der Nachteil hierbei ist allerdings, dass die Terminologie somit eher oberflächlich und nicht sehr fachspezifisch ist und sich daher nicht oder nur eingeschränkt für Übersetzungen in einem konkreten, spezialisierten Bereich eignet.
Anbieter solcher Services sind beispielsweise online Tools wie DeepL, Google Translate, Babel Fish, Microsoft Translator oder auch Amazon Translate.
Im Gegensatz dazu gibt es auch individualisierbare Systeme, die z.B. von SYSTRAN, SmartMATE, KantanMT und Omniscien angeboten werden.
Diese arbeiten von vornherein mit kundenspezifischen Daten und deren konkreter Terminologie, um diese direkt in Übersetzungen miteinfließen zu lassen. Die Folge sind qualitativ etwas hochwertigere Übersetzungen, die weniger Nachbearbeitung benötigen. Voraussetzung für ein solches Vorgehen ist allerdings eine gewissenhafte Pflege von Translation Memorys und Terminologiedatenbanken.
Auch die großen Anbieter von CAT-Systemen wie SDL Trados Studio oder Across bieten mittlerweile Erweiterungen ihrer Systeme zur maschinellen Übersetzung an.
Welche Probleme und Schwierigkeiten gibt es aktuell mit maschineller Übersetzung?
Menschliche Sprache ist nicht nur ein Mittel des reinen Informationsaustausches. Wie schon unter dem Punkt „Vor- und Nachteile von MÜ“ angesprochen, sind viele Systeme – eine Ausnahme mag hier die neuronale maschinelle Übersetzung darstellen – (noch) nicht in der Lage, zum Beispiel Ironie zu erkennen und diese mit geeigneten Mitteln bzw. einem passenden Vokabular wieder zu geben. Meist orientieren sich diese Programme nur an der oberflächlichen Struktur einer Sprache und lassen die Tiefenstruktur dabei außer Acht. Mehrdeutige Wörter oder Sätze mit mehrdeutigen grammatischen Strukturen sowie der Bezug von Pronomen und andere grammatische Probleme können eine Übersetzungssoftware vor große Probleme stellen.
Zur Veranschaulichung kann der folgende Satz und seine möglichen Übersetzungen (deutsch – englisch) dienen:
„Er schrieb einen Brief an die Bank“.
Für eine Maschine ist es nun schwierig zu erkennen, ob es sich bei der Bank in diesem Fall um das Geldinstitut „bank“ oder das Sitzmöbel „bench“ handelt, was für einen Menschen wiederum auf den ersten Blick ersichtlich sein wird und von ihm in eine Übersetzung eingebracht werden kann.
Hier sei noch einmal auf das sogenannte Weltwissen verwiesen, über das der Mensch im Allgemeinen verfügt und was ihm das (richtige) Verstehen von Texten ermöglicht.
Geschichte der maschinellen Übersetzung
Wie zu Anfang bereits kurz angerissen, ist maschinelle Übersetzung kein Thema des 21., digitalen Jahrhunderts. Hier, wie auch in diversen anderen Bereichen, hat ein gewisses militärisches Interesse die Forschung und Entwicklung maschineller Übersetzungssysteme vorangetrieben. So war eines der ersten Übersetzungsprogramme eines für das US-Amerikanische Militär, welches, wenn auch in sehr schlechter Qualität, Russisch-Englische Übersetzungen vornehmen konnte und Dolmetscher und Übersetzer erst einmal überflüssig machte. Als Folge der durch den sogenannten ALPAC-Bericht aus dem Jahr 1966 gemachten Einstufung maschineller Übersetzungen als grundsätzlich unrealisierbar wurde fast 20 Jahre kaum mehr zu diesem Thema geforscht. In den 80er Jahren nahmen Konzerne wie die Siemens AG oder auch Institute an deutschen Universitäten die Forschung dann wieder auf, es wurden verschiedene Systeme entwickelt. Auch in Japan wurde ein Projekt zur maschinellen Übersetzung vom Englischen ins Japanische ins Leben gerufen, welches Japan zunächst an die Spitze der weltweiten Forschung zu maschineller Übersetzung beförderte. Auch in den 1990er Jahren wurde in Deutschland weiter geforscht und ab den 2000er Jahren wurden dann immer mehr statistische Verfahren zur maschinellen Übersetzung genutzt, zum Beispiel von Google (2006). Seither ist dieses Feld an diversen deutschen Universitäten und Forschungsinstituten präsent, unter anderem am Karlsruhe Institute of Technology (KIT), wo auch zum Thema gelehrt wird. Der Bedarf an maschinellen Übersetzungen stieg (und steigt noch immer) stetig weiter und seit dem Jahr 2016, ab dem zunehmend künstliche neuronale Netze für die MÜ genutzt werden, sind diese auch in immer besser werdender Qualität für Nutzer dieser neuronalen MÜ zugänglich.
Wie sieht die Zukunft von maschineller Übersetzung aus?
Die Zukunft der maschinellen Übersetzung ist noch immer unklar. Von einer breiten Masse wird die Leistungsfähigkeit von maschineller Übersetzung als noch nicht ausreichend wahrgenommen. Hier fehlt es auch noch an einem hinreichenden wissenschaftlichen Verständnis der menschlichen Sprache überhaupt, was der Entwicklung von „perfekten“ maschinellen Übersetzungstools natürlich vorausgehen sollte.
Fazit
Auf dem Gebiet der maschinellen Übersetzung gibt es seit mehreren Jahrzehnten immer wieder neue Forschungsansätze, die zuletzt durch die Möglichkeiten von künstlicher Intelligenz (KI) erhebliche qualitative Sprünge gemacht haben. Die Ergebnisse, die heute mit MÜ erzielt werden können, reichen bei einigen, wenn auch eher oberflächlichen bzw. fachlich nicht all zu spezifischen Texten, an die eines menschlichen Übersetzers heran.
Dennoch besteht, und das auch zu Recht, weiterhin ein gewisser Zweifel daran, ob rein maschinell erstellte Übersetzungen genau genug sind bzw. jemals sein können.
Sicher ist, dass die Forschung in diesem Bereich noch lange nicht am Ende ist, die Qualität von MÜ weiterhin zunehmen wird und sich Übersetzer diesen Umständen werden anpassen müssen, um weiterhin in diesem Feld tätig sein zu können.