Von Philip Bethge
Um etwa das Beispiel "wir treffen uns im Schloss" zu deuten, fahndet das Programm in seiner Datenbank nach Texten, in denen "treffen" und "Schloss" nah beieinanderstehen. Dann durchforstet es die Übersetzungen dieser Texte und findet dort häufig das Wort "castle". Daher gibt die Maschine "we meet in the castle" und nicht "we meet in the lock" aus.
Och hat dieses statistische Verfahren für Google inzwischen perfektioniert. Schon während seiner Promotion spezialisierte sich der Franke auf Spracherkennung. Danach ging er an die University of Southern California. Bald interessierte sich das Pentagon für seine Arbeit. Nach 9/11 wollten die US-Geheimdienstler arabische Zeitungen, Chatrooms und Websites verschärft kontrollieren.
Doch 2004 lockte Google den Sprachbezwinger nach Mountain View. Dort kommt Och seither die gewaltige Rechenleistung des Internetimperiums zugute. Zahlen mag Och nicht nennen. Für viele Sprachpaare lagern jedoch Billionen Einträge in den Google-Datenbanken. Wichtige Ressourcen für das Wortarchiv sind etwa die in zahlreiche Sprachen übersetzte Bibel, Transkripte der Vereinten Nationen oder die 23-sprachigen EU-Dokumente.
Solcherlei "Paralleltexte" sind so etwas wie der Stein von Rosette des Digitalzeitalters: Das antike Vorbild trägt dieselbe Inschrift in Griechisch, Demotisch und in Hieroglyphen. 1822 lüftete der Ägyptologe Jean-Francois Champollion mit ihrer Hilfe das Geheimnis der Hieroglyphen.
Genauso macht es nun Ochs Software. Die Stärken des Systems: Ein und derselbe Programmcode funktioniert für alle Sprachen. Es muss nur genug übersetzter Text vorliegen.
Sawaf kritisiert zudem, dass Ochs System nur online funktioniert.
Ein Buchstabenfresser als Universaldolmetscher? Viele Linguisten halten derlei Rechenschiebertricks für Tinnef. "Die statistische Übersetzung stößt schnell an ihre Grenzen", sagt etwa der Sprachwissenschaftler Martin Kay von der Stanford University, "der Ansatz ignoriert die komplexe Struktur von Sprache." Bei der im Deutschen üblichen Stellung von Vollverb und Hilfsverb etwa versage die Technik. Auch an der Unterscheidung von Subjekt und Objekt habe sie zu knapsen.
"Für wirklich gute Ergebnisse müssen wir tiefer in die Sprache eintauchen", sagt auch Hassan Sawaf, Chefentwickler der US-Software-Schmiede Apptek. Die Firma geht einen Mittelweg. Neben statistischen Algorithmen nutzt Sawaf auch klassische Grammatikregeln: "Das verbessert den Satzbau und die Verständlichkeit erheblich."
Sawaf kritisiert zudem, dass Ochs System nur online funktioniert: "Wer offline arbeitet, kann 'Google Translate' vergessen." Auch Waibel ist skeptisch. "Stellen Sie sich vor, Sie sind im Ausland, wollen sich mit einem Verkäufer unterhalten und müssen erst mal ein Netz suchen und dann auch noch hohe Roaming-Gebühren bezahlen - praktikabel ist das nicht."
Tatsächlich stellt die Netzabhängigkeit eine der größten Schwächen der Google-Übersetzungsmaschine dar. Doch die Kalifornier weichen nicht von ihrem Kurs ab. Schon entwickeln sie eine spezielle Programmversion mit integrierter Spracherkennung für das hauseigene Handy-Betriebssystem "Android". Und bald soll es auch möglich sein, Texte auf Fotos blitzschnell übersetzen zu lassen. So könnte der ortsunkundige Reisende künftig in China das Schild mit der Aufschrift ablichten - und wüsste umgehend, dass er sich auf dem Weg nach Peking befindet.
"Wer kein Englisch spricht, kann nur einen Bruchteil des Internets nutzen"
Eine weitere Gelddruckmaschine für den Internetgiganten scheint also heranzureifen. Doch Och winkt ab. Wie viele Google-Mitarbeiter wähnt er sich lieber auf einem Feldzug für Freiheit und Gleichheit im Netz. "Wer kein Englisch spricht, kann nur einen Bruchteil des Internets nutzen", sagt er. Es gelte, die Vielfalt allen zugänglich zu machen.
Ein Indiz für die hehren Absichten des Programmierers gibt es immerhin. Och und sein Team haben eine Spezialsoftware entwickelt, mit deren Hilfe Dolmetscher auf eigene Faust Übersetzungen in das System einspeisen können - und zwar auch für äußerst exotische Idiome wie die Bantusprache Xhosa, die Sprache der in Japan lebenden Ainu oder die Inuit-Sprache Inuktitut. Auf diese Weise wollen die Software-Entwickler auch jenen Zungen Gehör verschaffen, die bereits in Vergessenheit zu geraten drohen. Der neuseeländische Computeringenieur Te Taka Keegan von der University of Waikato testete das Programm bereits für die Sprache der Maori. Sechs Monate verbrachte Keegan kürzlich bei Google, um auszuloten, ob das digitale Sprachenmirakel aus Mountain View das Idiom der neuseeländischen Ureinwohner vor dem Verschwinden bewahren könnte. Seine Erfahrungen sind durchweg positiv.
"Die Zahl und Qualität der Maori-Übersetzungen wächst mit Hilfe dieses Werkzeugs ständig", berichtet Keegan. Ein digitales Archiv entstehe, das der Sprache erheblichen Auftrieb verleihe.
"Unsere Kinder wachsen in eine digitale Welt hinein", sagt Keegan. "Nur wenn wir es schaffen, Maori zum Teil dieser Welt zu machen, wird die Sprache überleben."
Auf anderen Social Networks posten:
Hierbei handelt es sich im Gegensatz zu früheren viel schlechteren Ergebnissen aber nur noch um Ausdrucksschwächen. Der Inhalt wird voll erkennbar. Ich habe die Übersetzungsfunktion schon bei mehreren längeren Texten probiert [...] mehr...
Sicherlich ist "Google Translate" hilfreich, aber die Übersetzung des Artikel 1 der Allgemeinen Erklärung der Menschenrechte ist nur deswegen perfekt, weil sie in Googles Datenbank ist, also gar nicht übersetzt zu werden [...] mehr...
Danke für Ihren Beitrag, mit dem Sie es so auf den Punkt bringen, besser als ich es kann. Um es den Programmierern zu verdeutlichen, hier ein aktuelles Beispiel aus der Praxis. Ich beiße mir bereits seit 30 Minuten die Zähne [...] mehr...
Das hat wohl damit zu tun, dass Google Translate (laut http://www.linguatools.de/blog/?p=102) immer über den Zwischenschritt Englisch übersetzt. Wenn Sie z.B. Deutsch->Spanisch auswählen, dann übersetzt Google intern erst [...] mehr...
Aber auch die Linguistik entwickelt sich weiter, sodass die CL immer weiter Konzepte übernehmen und umsetzen kann. Noch können besonders pragmatische Phänomene(im Sinne der Pragmatik) nicht adäquat übersetzt werden, aber in [...] mehr...
HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:
| alles aus der Rubrik Netzwelt | Twitter | RSS |
| alles aus der Rubrik Web | RSS |
| alles zum Thema Google | RSS |
© DER SPIEGEL 17/2010
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH