Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Technikärgernis Rechtschreibprüfung: Barock Obama und die Stinker-Raketen

Von

Internat statt Internet, Nato statt Nano, Cupertino statt Kooperation: Das kommt raus, wenn Software Texte verbessert. Die Korrekturkomik findet man sogar in offiziellen Dokumenten der EU und Nato. Experten sagen, die Programme könnten einfach nicht perfekt sein - aber lustig!

Auf Seite 15 von 43 wird das Nato-Forschungspapier zur "Interoperabilität innerhalb der Allianz und mit Koalitionspartnern" richtig lustig: Da schreibt der Autor, man könne die technische Vernetzung der Nato mit anderen Organisationen verbessern - zum Beispiel mit der "Organisation for Security and Cupertino in Europe" (PDF-Dokument).

Die Organisation für Sicherheit und Cupertino?

Cupertino?

Der Ort in Kalifornien, in dem Apple seinen Firmensitz hat?

Gemeint ist die OSZE, die Organisation für Sicherheit und Zusammenarbeit in Europa. Und geschrieben hat der Autor im englischen Original ganz sicher zuerst auch "cooperation". Woraus die Rechtschreibprüfung dann Cupertino machte.

Der Nato-Autor ist 1999 Opfer des Cupertino-Effekts geworden. Eine ältere Version von Microsofts Textverarbeitungsprogramm, offenbar Word 97, hat in manchen Fällen in englischen Texten als Ersatz für die Eingabe co-operation (wohl in dieser Schreibweise) die Stadt Cupertino vorgeschlagen. Der US-Linguist Benjamin Zimmer hat diese verblüffenden Fehler eingehender erforscht. Er zitiert den Beitrag einer EU-Übersetzerin, die den Fehler im Jahr 2000 "Cupertino-Effekt" taufte. Zimmer urteilt heute: "Trotz aller Fortschritte der Softwareentwickler können die Korrekturprogramme nie perfekt sein." Er glaubt, dass Fehler wie der Cupertino-Effekt "in der einen oder anderen Form immer wieder auftauchen werden". Aber Zimmer weist darauf hin: "Das sind nur Empfehlungen. Letztendlich ist es die Aufgabe des Menschen, aufmerksam genug zu sein, um die falschen von den richtigen Korrekturvorschlägen zu unterscheiden."

Das ist offenbar nicht immer der Fall. Auf den Web-Seiten des EU-Parlaments, der Nato und der Uno findet man heute noch Hunderte offizieller englischsprachiger Pressemitteilungen, Erklärungen und Dokumente, in denen an merkwürdigen Stellen "Cupertino" steht. Zum Beispiel: "In dem deutsch-italienischen Kampfverband erwies sich die Cupertino mit unseren italienischen Kameraden als sehr fruchtbar."

Im Redaktionsalltag liefert die Rechtschreibprüfung von Microsoft Word 2002 und Mac Word 2008 kuriose Korrekturvorschläge. Einige Beispiele:

  • Stinker-Rakete statt Stinger-Rakete
  • Barock Obama statt Barack Obama
  • Pädophilie statt Pädophile
  • Nato-Maßstab statt Nano-Maßstab

Warum schlägt Word so etwas vor? André Kramer, Redakteur beim Fachmagazin "c't", der eine Magisterarbeit (PDF-Dokument) über Rechtschreibkorrektursysteme geschrieben hat, erklärt diese merkwürdigen Korrekturvorschläge mit dem Umfang des Lexikons der Korrektursoftware: "Es dauert oft eine Weile, bis Begriffe wie Hedgefonds, Punkrock, Gigabit und al-Qaida Eingang ins Lexikon finden. Bei solchen unbekannten Begriffen schlägt die Software den am wahrscheinlichsten gemeinten Begriff aus dem Lexikon vor."

Welcher Begriff am wahrscheinlichsten gemeint sein könnte, errechnet eine Rechtschreibprüfung in einem mehrstufigen Verfahren. Software-Experte Kramer erklärt das Prinzip so: "Da wird einbezogen, wie häufig einzelne Tippfehler auftreten. Das kann, muss aber nicht zwangsläufig etwas mit der Nähe der einzelnen Tasten zu tun haben."

Welcher Korrekturvorschlag als erster genannt und bei einer Autokorrektur auch eingesetzt wird, berechnet die Software anhand der Wahrscheinlichkeit, dass die als möglicher Ersatz ausgemachten Worte überhaupt gemeint sein können. Diese Worthäufigkeiten berechnen die Entwickler von Korrektursystemen, indem sie Programme große Textmengen auswerten lassen.

Trotz dieses Aufwands geht dann doch so mancher Korrekturvorschlag daneben - und dann steht da "Stinker-Rakete".

Dramatisch findet das Korrektur-Kenner Kramer nicht: "Die Qualität einer Rechtschreibprüfung würde ich daran nicht messen. Einen Begriff wie die Stinger-Rakete muss ein allgemeines Lexikon nicht unbedingt kennen."

Microsoft Word kennt 1995 das Internet nicht

Peinlicher ist das bei Begriffen wie Internet. In seiner Magisterarbeit zu Rechtschreibkorrektursystemen von 2004 schreibt Kramer, dass Microsofts Textverarbeitung Word 95 im Jahr 1995 das Internet noch nicht kannte. Als Korrekturvorschlag gab diese Word-Version "Internat" aus.

Dabei stand das Wort Internet schon Jahre zuvor in deutschen Medien - zum Beispiel 1992 im SPIEGEL ("So brachte etwa der 'Internet-Wurm' eines amerikanischen Hackers weltweit rund 6000 Computer zum Erliegen"), dann wieder 1993 ("im weltumspannenden Wissenschaftsnetz 'Internet'")..

Dass das Internet 1995 nicht im Lexikon der Word-Rechtschreibkorrektur auftauchte, ist peinlicher als das Fehlen von Stinger-Raketen. Eine gute Rechtschreibkorrektur erkennt man allerdings nicht einfach an der Größe des Lexikons. Kramer: "Der Umfang ist kein Maßstab für die Güte der Korrektur. Der sehr gute Duden-Korrektor zum Beispiel arbeitet mit Wortstämmen und leitet davon verschiedene Formen ab, jeder im Lexikon eingetragene Wortstamm entspricht weit mehr tatsächlich erkannten Wörtern."

Allumfassend kann kein Lexikon sein

Manche Lücken im Lexikon einer Rechtschreibprüfung kann man den Entwicklern durchaus vorhalten (Internet), andere eher nicht (Barock Obama). Denn allumfassend und somit perfekt kann kein Lexikon sein.

Da gilt heute noch, was André Kramer in seiner Magisterarbeit ( PDF-Dokument) 2004 schrieb: "Diese Grenzen resultieren schließlich auch nicht nur im Unvermögen der Programmierer oder der fehlenden visionären Kraft der Systementwickler. Die unendlichen Ausdrucksmöglichkeiten, die die Sprache bietet, die Bildung neuer Nominationseinheiten oder die fließenden Wortgrenzen, können nur zu einem bestimmten Grad vollständig abgebildet werden."

Mit Groß-, Getrenntschreibung und Komposita hat auch aktuelle Software Probleme - Mac Word 2008 erkennt zum Beispiel den Begriff Kompositaerkennung nicht, obwohl er aus zwei erkannten Worten (Komposita und Erkennung) zusammengesetzt ist.

Auch Eigennamen sind immer noch ein Problem. Dass Korrektursoftware zum Beispiel aus dem Familienamen Hillenbrand einen Höllenbrand macht, ist beim derzeitigen Stand der Technik kaum zu vermeiden.

Die Seeschwamm-Verteidigung

Diese Probleme garantieren so manchen aberwitzigen Fehler.

Der kalifornische Anwalt Arthur Dudley zum Beispiel ist unter US-Juristen berühmt für ein Dokument, das er vor drei Jahren an ein Gericht in San Francisco schickte. Versehentlich ließ er seine Textverarbeitung den Fachbegriff sua sponte (steht für aus eigenem Antrieb) übersetzen. Heraus kam: sea sponge - ein Seeschwamm. Fünf mal tauchte der Schwamm in dem Schreiben auf, über das US-Juristen heute noch lachen. Bemerkt hat den Fehler damals Dudleys Mandant.

Die "New York Times" musste vor einigen Jahren diesen der Autokorrektur geschuldeten Fehler korrigieren: Die Software hatte den Football-Spieler DeMeco Ryans in einem Artikel durchgängig umgetauft - in Demerol, ein Betäubungsmittel.

Rechtschreibprüf-Programme sind eben immer noch nur eine gute Hilfe zum Aufspüren von Vertippern und Schludrigkeiten. Als Korrektor-Ersatz ist die Software überschätzt. Bei weitem unterschätzt dürfte allerdings das Unterhaltungspotential der Rechtschreibprüfung sein. Die "sea sponge defense" bringt es inzwischen schon auf zwei Google-Trefferseiten.

Diesen Artikel...

© SPIEGEL ONLINE 2009
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH



Fotostrecke
Korrekturkomik: So falsch liegen die Tipp-Programme
Welches Technikärgernis nervt Sie? Schreiben Sie uns!
SPIEGEL ONLINE
Versteckte Einschaltknöpfe, verwirrende Anleitungen, verrückte Automaten - in der Reihe "Fehlfunktion" stellen wir in Technikärgernisse vor, die Millionen nerven. Schicken Sie uns Ihre Anregungen mit einer kurzen Begründung. Am besten per E-Mail.


Anzeige
  • Christian Stöcker:
    Spielmacher

    Gespräche mit Pionieren der Gamesbranche.

    Mit Dan Houser ("Grand Theft Auto"), Ken Levine ("Bioshock"), Sid Meier ("Civilization"), Hideo Kojima ("Metal Gear Solid") u.v.a.

    SPIEGEL E-Book; 2,69 Euro.

  • Bei Amazon kaufen.
Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: