Zur Ausgabe
Artikel 42 / 69
Vorheriger Artikel
Nächster Artikel

ÜBERSETZUNGS-MASCHINEN Die Wortfabrik

aus DER SPIEGEL 2/1958

Als einer der führenden Kernphysiker Amerikas, der Professor Donald Hughes vom Brookhaven-Labor, kürzlich von einer Vortragsreise aus der Sowjet-Union zurückkehrte, konnte er den Amerikanern eine neue Erklärung für die überraschenden Fortschritte der Sowjets in den wissenschaftlich-technologischen Disziplinen präsentieren. Der Professor, eine Weltautorität auf dem Gebiet der Neutronenphysik, war nach dem Besuch von sechs Laboratorien in Moskau und einem Forschungsinstitut in Leningrad zu dem Schluß gekommen, daß die sowjetischen Wissenschaftler sich die Forschungsergebnisse der übrigen Welt in einem schier unglaublichen Umfang zu Nutze machen.

Hughes berichtete, daß die Sowjets beispielsweise jedes Heft der bedeutendsten physikalischen Zeitschrift der Welt, der amerikanischen »Physical Review«, in zehn- bis fünfzehntausend Exemplaren nachdrucken. Diese grünen, vierzehntäglich in Großformat erscheinenden Hefte sind jeweils mehrere hundert Seiten stark und enthalten in sehr konzentrierter Form - die Verfasser von Artikeln müssen zu den Druckkosten erhebliche Beträge zuschießen - die neuesten Forschungsergebnisse amerikanischer Physiker. Daß die Sowjets allein diese Zeitschrift, von der zum Beispiel in Westdeutschland schätzungsweise ganze 150 Exemplare gehalten werden, sofort in großem Umfang auf Russisch nachdrucken, verblüffte die amerikanischen Wissenschaftler, die sich im Vertrauen auf ihren Vorsprung um sowjetische Forschungsergebnisse kaum zu kümmern pflegten.

Welche Konsequenzen aber die Achtlosigkeit der amerikanischen Forscher gegenüber den Veröffentlichungen aus der Sowjet-Union haben kann, war schon vor Beginn der Sputnik-Ära in einem exemplarischen Fall bekannt geworden: Ein amerikanischer Elektrokonzern hatte mehrere hunderttausend Dollar in die Herstellung neuer elektrischer Schaltkreise investiert, ehe seine Ingenieure zufällig entdeckten, daß die Lösung der damit verbundenen kniffligen Probleme bereits Jahre zuvor in einer Abhandlung der Sowjetischen Akademie der Wissenschaften aufgezeigt worden war.

Während die Übersetzung der Sowjetliteratur in den Vereinigten Staaten noch immer durch chronischen Geldmangel so stark behindert ist, daß nur ein sehr kleiner Teil der wissenschaftlichen Abhandlungen übertragen wird, haben die Russen die wissenschaftliche Sprachmauer unter großem Aufwand schon vor mehreren Jahren durchstoßen.

In dem »All-Unions-Institut für wissenschaftliche und technische Information«, das 1953 in Moskau eingerichtet wurde, arbeiten 1800 Angestellte, beraten von 13 000 Wissenschaftlern und Technikern, an der Übersetzung ausländischer Fachliteratur. In dreizehn Zeitschriften veröffentlichen sie jährlich etwa 400 000 Kurzfassungen der wissenschaftlichen Abhandlungen, die in zehntausend Journalen erscheinen. Schon 1954 verfertigten die sowjetischen Übersetzer Kurzfassungen von 1416 wissenschaftlichen Zeitschriften aus den USA, 844 aus Großbritannien, 491 aus Frankreich sowie beispielsweise 27 aus Portugal und drei aus Madagaskar. In Moskau wurde dem amerikanischen Physiker Hughes prahlerisch versichert, er könne auf Wunsch sofort eine vollständige Übersetzung von jeder beliebigen wissenschaftlichen Arbeit erhalten, die irgendwo in der Welt erscheine.

Diese Aufforderung war allerdings nur für eine außergewöhnliche Demonstration gedacht. Denn obwohl Expreßdienste des Moskauer Instituts Kurzfassungen von sehr wichtigen ausländischen Aufsätzen schon zwei oder drei Wochen nach Eintreffen des Artikels ausliefern, arbeitet die riesige Übersetzungsmaschinerie im Durchschnitt erheblich langsamer.

Der Direktor dieses Unternehmens, der Mathematiker Dr. Panow, war deshalb schon frühzeitig darauf bedacht, seine Wortfabrik zu automatisieren. Zu diesem Zweck installierte er in seinem Institut ein großes Elektronengehirn, die BESM. Bei der Inbetriebnahme der Maschine kam ihm die international übliche stereotype Ausdrucksweise der Wissenschaftler zustatten.

Dr. Panow wußte, daß in mathematischen Abhandlungen der Raum zwischen den Formeln oft mit Floskeln wie »so erhält man« oder »daraus folgt« ausgefüllt ist. Diese genormte sprachliche Einfalt mußte es ermöglichen, die Automatisierung von Übersetzungen beträchtlich zu vereinfachen.

In einer Abhandlung über automatische Übersetzungen erläuterte der sowjetische Mathematiker: »Ein wissenschaftlich-technischer Text weist eine Reihe von Besonderheiten auf:

- »Es werden weniger Wörter verwendet.

Man schätzt den Umfang des Wörterbuches zur Übersetzung eines wissenschaftlich-technischen Textes aus irgendeinem Gebiet auf etwa 1000 Wörter allgemeinen Charakters und weitere 1000 Fachausdrücke aus dem betreffenden Gebiet.

- »Die Konstruktion eines Satzes ist in der Regel bei einem wissenschaftlich technischen Text einfacher als bei anderen Texten. In einem russischen wissenschaftlichen Text kommen zum Beispiel viele Verbformen praktisch nicht vor, etwa die Befehlsform, die erste und zweite Person Einzahl und Mehrzahl von Gegenwart und Zukunft.

- »Die Anzahl der Übersetzungsmöglichkeiten eines mehrdeutigen Wortes ist bei einem wissenschaftlich-technischen Text sehr begrenzt. Die Wortreihenfolge im Satz wird strenger eingehalten als in der Umgangssprache oder in der künstlerischen Prosa.«

Dr. Panow resümierte: »Es ist klar, daß es unter diesen Voraussetzungen einfacher ist, Regeln zu formulieren, die einer automatischen Übersetzung zugrunde gelegt werden können.«

Wie schwierig es aber dennoch ist, das wissenschaftliche Kauderwelsch einer Sprache in das einer anderen zu übertragen, hatte schon vor einem Jahrzehnt der erste Konstrukteur von Übersetzungsmaschinen, der englische Mathematiker Andrew Booth, erkannt. Booth war bei seinen Arbeiten davon ausgegangen, daß ein elektronischer Rechenautomat zwar nicht eine sinngemäße, aber immerhin eine Wort für-Wort-Übersetzung anfertigen könnte, wenn ein entsprechendes Wörterbuch in das Gedächtnis der Maschine eingeschrieben werde.

Dieses Problem war mit Hilfe eines Codes, der Buchstaben in Zahlen verschlüsselt, leicht zu lösen: Jedes Wort entspricht einer Zahlengruppe im Zahlenspeicher, dem Gedächtnis der Maschine. Wenn eine Übersetzung angefertigt werden soll, überträgt eine Hilfskraft, die des Russischen nicht kundig zu sein braucht, den russischen Text Buchstabe für Buchstabe, Wort für Wort in die Zahlensprache des Maschinen-Codes.

Die Zahlenfolge wird in die Maschine gefüttert, die dann die zugeführten Zahlengruppen mit den in ihrem Gedächtnis eingeschriebenen Zahlengruppen vergleicht: Sie subtrahiert jede Zahlengruppe des russischen Textes von einer jeden Zahlengruppe ihres Wortschatzes, bis das Ergebnis Null ist, die Zahlen sich also einander entsprechen. In diesem Augenblick tippt die Schreibmaschine des Elektronengehirns selbsttätig das englische Wort, das dieser Zahlengruppe entspricht. Auf diese Weise hatten die Wissenschaftler das Auffinden eines Wortes im »Wörterbuch« ihres Roboters auf eine simple Subtraktionsaufgabe zurückgeführt.

Aber Booth war sich darüber im klaren, daß selbst solche Wort-für-Wort -Übersetzungen schwierige Probleme bergen:

- Viele Wörter sind mehrdeutig. Die Forscher müssen der Maschine außer dem Wörterbuch zusätzliche Instruktionen zuführen, damit das Elektronengehirn durch Analyse der vorhergehenden und nachfolgenden Wörter selbst ausrechnen kann, welche Bedeutung des Wortes in Frage kommt.

- Das Wörterbuch der Maschine würde zu sehr anschwellen, wenn es alle abgeleiteten Formen der Haupt- und Zeitwörter enthielte. Die Maschine muß deshalb mit Rechenvorschriften ausgestattet werden, mit denen sie die einzelnen Wörter analysieren kann.

Nach diesem Programm des Mathematikers Booth führten amerikanische Wissenschaftler und Ingenieure in einer Schauvorstellung in New York automatische Übersetzungen aus. Die Elektronengehirnfirma »International Business Machines« (IBM) hatte wegen der zugkräftigen Werbewirkung einer solchen Magiertat den Forschern ihre Rechenmaschine »IBM 701« als Dolmetscher zur Verfügung gestellt. In den New-Yorker Geschäftsräumen der Firma sahen die eingeladenen Zeitungskorrespondenten, wie eine des Russischen unkundige Schreibkraft einige russische Sätze in lateinischer Transskription auf Lochkarten tippte und sie auf diese Weise in die Sprache der Maschine übertrug.

Neun Sekunden nachdem die Lochkarten in den Eingabeschlitz der Maschine eingefüttert worden waren, druckte die automatische Schreibmaschine des Roboters den Satz in englischer Übersetzung aus: »International understanding constitutes an important factor in decision of political questions*.«

Weitere Sätze, die der Elektronendolmetscher aus dem Russischen in passables Englisch übertrug, lauteten auf deutsch etwa: »Die Güte der Kohle hängt von ihrer Verbrennungswärme ab« - »Stärke wird durch mechanische Methoden aus Kartoffeln gewonnen« - »Dynamit wird durch einen chemischen Prozeß aus Nitroglyzerin gewonnen unter Beimischung nichtexplosiver Verbindungen.«

Diese Kunststückchen der IBM-Maschine waren jedoch keineswegs so wunderbar, wie sie den unkundigen Zuschauern erschienen. Die Forscher hatten nämlich für die Zwecke der Schauvorführung die 250 russischen Wörter, die den bescheidenen Sprachschatz der Maschine ausmachten, so ausgewählt, daß jedes Wort im Englischen nur eine, höchstens aber zwei Bedeutungen hatte. Für die Übersetzung hatten sie zudem besonders einfache russische Sätze konstruiert; die Sätze enthielten beispielsweise nur Wörter, die in dem begrenzten Sprachschatz der Maschine enthalten waren. Da der Roboter nur sechs äußerst primitive syntaktische Regeln beherrschte, hatten die Übersetzungsmaschinisten die Sätze so zurechtgestutzt, daß diese Regeln gerade ausreichten, ihre russischen Kernsprüche in ein annehmbares Englisch zu übertragen.

Als bekannt wurde, daß die IBM-Leute ihren elektronischen Roboter so wohlpräpariert in seine öffentliche Prüfung geschickt hatten, äußerten sich die Wissenschaftler recht skeptisch über den Wert des Versuches. Der Direktor der sowjetischen Wortfabrik, der Mathematiker Panow, resümierte: »Man kam ... übereinstimmend zu dem Urteil, daß der Versuch mehr Reklamezwecken als wissenschaftlichen Zielen diente.«

Um seine eigene Übersetzungsmaschine solchen Einwänden nicht auszusetzen, hat Maschinendolmetscher Panow ein sehr viel schwierigeres Projekt begonnen. Er und seine Mitarbeiter schrieben in das Gedächtnis der russischen Übersetzungsmaschine BESM nicht nur ein englisch russisches Wörterbuch mit 952 englischen und 1073 russischen Vokabeln ein. Sie gaben der Maschine auch außerordentlich verwickelte und vielfältige Instruktionen zur Analyse des englischen und zur Synthese des russischen Textes.

Bei der Analyse des englischen Textes ermittelt die Maschine - soweit es erforderlich ist - siebzehn verschiedene Eigenschaften und Funktionen eines jeden Wortes. So stellt sie beispielsweise bei einem Hauptwort an Hand ihres Wörterbuches und aus dem Zusammenhang des Satzes fest, ob es in der Einzahl oder der Mehrzahl erscheint, ob es männlich oder weiblich ist, in welchem Fall es vorkommt, ob es Satzgegenstand ist oder nicht und so weiter.

Damit die Maschine jede dieser Fragen automatisch entscheiden konnte, mußten die russischen Wissenschaftler ein System von komplizierten Vorschriften ersinnen, in die Maschinensprache übersetzen und ein für allemal als »Rechenprogramm« in die Maschine einführen.

Daß diese neue Methode automatischer Übersetzungen im engen Bereich der sprachlich einfältigen wissenschaftlich technischen Texte tatsächlich funktioniert, demonstrierte Dr. Panow vor einiger Zeit mit seinem Elektronenroboter BESM: Die Maschine übersetzte in Sekunden ganze Abschnitte des englischen Buches über »Die numerische Lösung von Differentialgleichungen« in ein für russische Mathematiker verständliches Russisch.

* Die internationale Verständigung ist ein wichtiger Faktor für die Entscheidung politischer Fragen.

Amerikanisches Elektronengehirn »IBM 701": Vokabeln für wissenschaftliche Übersetzungen

Mehr lesen über
Zur Ausgabe
Artikel 42 / 69
Vorheriger Artikel
Nächster Artikel
Die Wiedergabe wurde unterbrochen.