ThemaGoogleRSS

Alle Artikel und Hintergründe

AUS DEM SPIEGEL
Ausgabe 17/2010
  • Drucken
  • Senden
  • Feedback
26.04.2010
 

Internet

Googeln in fremden Zungen

Von Philip Bethge

Informatiker Och: Ein Affront für jeden LinguistenZur Großansicht
Clay McLachlan / Aurora

Informatiker Och: Ein Affront für jeden Linguisten

2. Teil: Och hat dieses statistische Verfahren für Google inzwischen perfektioniert

Um etwa das Beispiel "wir treffen uns im Schloss" zu deuten, fahndet das Programm in seiner Datenbank nach Texten, in denen "treffen" und "Schloss" nah beieinanderstehen. Dann durchforstet es die Übersetzungen dieser Texte und findet dort häufig das Wort "castle". Daher gibt die Maschine "we meet in the castle" und nicht "we meet in the lock" aus.

Och hat dieses statistische Verfahren für Google inzwischen perfektioniert. Schon während seiner Promotion spezialisierte sich der Franke auf Spracherkennung. Danach ging er an die University of Southern California. Bald interessierte sich das Pentagon für seine Arbeit. Nach 9/11 wollten die US-Geheimdienstler arabische Zeitungen, Chatrooms und Websites verschärft kontrollieren.

Doch 2004 lockte Google den Sprachbezwinger nach Mountain View. Dort kommt Och seither die gewaltige Rechenleistung des Internetimperiums zugute. Zahlen mag Och nicht nennen. Für viele Sprachpaare lagern jedoch Billionen Einträge in den Google-Datenbanken. Wichtige Ressourcen für das Wortarchiv sind etwa die in zahlreiche Sprachen übersetzte Bibel, Transkripte der Vereinten Nationen oder die 23-sprachigen EU-Dokumente.

Solcherlei "Paralleltexte" sind so etwas wie der Stein von Rosette des Digitalzeitalters: Das antike Vorbild trägt dieselbe Inschrift in Griechisch, Demotisch und in Hieroglyphen. 1822 lüftete der Ägyptologe Jean-Francois Champollion mit ihrer Hilfe das Geheimnis der Hieroglyphen.

Genauso macht es nun Ochs Software. Die Stärken des Systems: Ein und derselbe Programmcode funktioniert für alle Sprachen. Es muss nur genug übersetzter Text vorliegen.

Sawaf kritisiert zudem, dass Ochs System nur online funktioniert.

Ein Buchstabenfresser als Universaldolmetscher? Viele Linguisten halten derlei Rechenschiebertricks für Tinnef. "Die statistische Übersetzung stößt schnell an ihre Grenzen", sagt etwa der Sprachwissenschaftler Martin Kay von der Stanford University, "der Ansatz ignoriert die komplexe Struktur von Sprache." Bei der im Deutschen üblichen Stellung von Vollverb und Hilfsverb etwa versage die Technik. Auch an der Unterscheidung von Subjekt und Objekt habe sie zu knapsen.

"Für wirklich gute Ergebnisse müssen wir tiefer in die Sprache eintauchen", sagt auch Hassan Sawaf, Chefentwickler der US-Software-Schmiede Apptek. Die Firma geht einen Mittelweg. Neben statistischen Algorithmen nutzt Sawaf auch klassische Grammatikregeln: "Das verbessert den Satzbau und die Verständlichkeit erheblich."

Sawaf kritisiert zudem, dass Ochs System nur online funktioniert: "Wer offline arbeitet, kann 'Google Translate' vergessen." Auch Waibel ist skeptisch. "Stellen Sie sich vor, Sie sind im Ausland, wollen sich mit einem Verkäufer unterhalten und müssen erst mal ein Netz suchen und dann auch noch hohe Roaming-Gebühren bezahlen - praktikabel ist das nicht."

Tatsächlich stellt die Netzabhängigkeit eine der größten Schwächen der Google-Übersetzungsmaschine dar. Doch die Kalifornier weichen nicht von ihrem Kurs ab. Schon entwickeln sie eine spezielle Programmversion mit integrierter Spracherkennung für das hauseigene Handy-Betriebssystem "Android". Und bald soll es auch möglich sein, Texte auf Fotos blitzschnell übersetzen zu lassen. So könnte der ortsunkundige Reisende künftig in China das Schild mit der Aufschrift ablichten - und wüsste umgehend, dass er sich auf dem Weg nach Peking befindet.

"Wer kein Englisch spricht, kann nur einen Bruchteil des Internets nutzen"

Eine weitere Gelddruckmaschine für den Internetgiganten scheint also heranzureifen. Doch Och winkt ab. Wie viele Google-Mitarbeiter wähnt er sich lieber auf einem Feldzug für Freiheit und Gleichheit im Netz. "Wer kein Englisch spricht, kann nur einen Bruchteil des Internets nutzen", sagt er. Es gelte, die Vielfalt allen zugänglich zu machen.

Ein Indiz für die hehren Absichten des Programmierers gibt es immerhin. Och und sein Team haben eine Spezialsoftware entwickelt, mit deren Hilfe Dolmetscher auf eigene Faust Übersetzungen in das System einspeisen können - und zwar auch für äußerst exotische Idiome wie die Bantusprache Xhosa, die Sprache der in Japan lebenden Ainu oder die Inuit-Sprache Inuktitut. Auf diese Weise wollen die Software-Entwickler auch jenen Zungen Gehör verschaffen, die bereits in Vergessenheit zu geraten drohen. Der neuseeländische Computeringenieur Te Taka Keegan von der University of Waikato testete das Programm bereits für die Sprache der Maori. Sechs Monate verbrachte Keegan kürzlich bei Google, um auszuloten, ob das digitale Sprachenmirakel aus Mountain View das Idiom der neuseeländischen Ureinwohner vor dem Verschwinden bewahren könnte. Seine Erfahrungen sind durchweg positiv.

"Die Zahl und Qualität der Maori-Übersetzungen wächst mit Hilfe dieses Werkzeugs ständig", berichtet Keegan. Ein digitales Archiv entstehe, das der Sprache erheblichen Auftrieb verleihe.

"Unsere Kinder wachsen in eine digitale Welt hinein", sagt Keegan. "Nur wenn wir es schaffen, Maori zum Teil dieser Welt zu machen, wird die Sprache überleben."

Diesen Artikel...

Aus Datenschutzgründen wird Ihre IP-Adresse nur dann gespeichert, wenn Sie angemeldeter und eingeloggter Facebook-Nutzer sind. Wenn Sie mehr zum Thema Datenschutz wissen wollen, klicken Sie auf das i.

Auf anderen Social Networks posten:

  • studiVZ meinVZ schülerVZ
  • deli.cio.us
  • Xing
  • Digg
  • Google Bookmarks
  • reddit
  • Windows Live

Forum

insgesamt 93 Beiträge zum Forum...
Die neuesten Beiträge:
10.05.2010 von Eiermann: .

Hierbei handelt es sich im Gegensatz zu früheren viel schlechteren Ergebnissen aber nur noch um Ausdrucksschwächen. Der Inhalt wird voll erkennbar. Ich habe die Übersetzungsfunktion schon bei mehreren längeren Texten probiert [...] mehr...

09.05.2010 von wviebahn: "Google Translate" übersetzt sich selbst schlecht

Sicherlich ist "Google Translate" hilfreich, aber die Übersetzung des Artikel 1 der Allgemeinen Erklärung der Menschenrechte ist nur deswegen perfekt, weil sie in Googles Datenbank ist, also gar nicht übersetzt zu werden [...] mehr...

02.05.2010 von Claudia_D: .

Danke für Ihren Beitrag, mit dem Sie es so auf den Punkt bringen, besser als ich es kann. Um es den Programmierern zu verdeutlichen, hier ein aktuelles Beispiel aus der Praxis. Ich beiße mir bereits seit 30 Minuten die Zähne [...] mehr...

01.05.2010 von peko06: Google Translate verwendet Englisch als Interlingua

Das hat wohl damit zu tun, dass Google Translate (laut http://www.linguatools.de/blog/?p=102) immer über den Zwischenschritt Englisch übersetzt. Wenn Sie z.B. Deutsch->Spanisch auswählen, dann übersetzt Google intern erst [...] mehr...

30.04.2010 von Th1drek: Und was jetzt?

Aber auch die Linguistik entwickelt sich weiter, sodass die CL immer weiter Konzepte übernehmen und umsetzen kann. Noch können besonders pragmatische Phänomene(im Sinne der Pragmatik) nicht adäquat übersetzt werden, aber in [...] mehr...

Und Ihre Meinung? Diskutieren Sie mit! zum Forum...

News verfolgen

HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:

alles aus der Rubrik Netzwelt
alles aus der Rubrik Web
alles zum Thema Google

© DER SPIEGEL 17/2010
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH



Aus dem aktuellen SPIEGEL

Sie lesen einen Text aus dem
SPIEGEL 17/2010 - entdecken Sie
weitere Top-Themen aus dem Heft:

  • - Europa: Sprengt die Griechenland-Hilfe die Währungsunion?
  • - Kirche: Die zu Ende gegangene Regentschaft des Bischofs Mixa zeigt, wie die katholische Kirche Menschen einschüchtert
  • - Automobilindustrie: Wie viel Staatshilfe braucht die Entwicklung moderner Elektrofahrzeuge?
  • - Luftfahrt: Die Aschewolke-Hysterie - warum das tagelange Flugverbot übertrieben war







TOP



TOP