01.10.2003

LESEZEICHENEin Massiv wird zur Scheibe

Der größte deutsche Sprach-Speicher wird bald durchkämmbar sein wie nie: Eine elektronische Version des Grimmschen Wörterbuches steht kurz vor der Vollendung.
Ganz ruhig ging es zu an den beiden Berliner Schreibtischen. "Nur das Kritzen der Feder war zu hören", allenfalls "manchmal ein leises Hüsteln" von Jacob Grimm. "Die Brauen hoben oder senkten sich" während des Arbeitens auch bei Wilhelm, dem jüngeren der Brüder, wie dessen Sohn Herman bemerkte. Beraten mussten beide sich kaum. "Zuweilen blickten sie in die leere Luft. Manchmal standen sie auf, nahmen ein Buch heraus ... und blätterten darin." Mehr nicht.
Das Ziel war ja auch klar. In der Klause der beiden unzertrennlichen Forscher lief in den Jahrzehnten um 1850 der Rohstoff für ein Projekt zusammen, das bis heute einzigartig geblieben ist: eine Übersicht des deutschen Wortschatzes, umfassend und historisch transparent wie nie zuvor, mit Belegen, die von den Grimms selbst und mehr als 80 Helfern auf etwa 600 000 "kleinen Duodezblättchen", also Karteizetteln, gesammelt worden waren.
Nicht 4 Jahre freilich, wie der optimistische Wilhelm anfangs vermutet hatte, dauerte die Arbeit, auch nicht 15, wie später
geschätzt, sondern weit über 100. Erst im Januar 1961 war das gigantische, seither unerreichte Werk endlich bis zum 32. Band und dem finalen "Zypressenzweig" komplett, ein Quellenverzeichnis folgte gar noch 1971. 67 744 eng bedruckte Textspalten hatten die Grimms und ihre vielen Nachfolger gefüllt; in der Originalversion wiegen die 3000 Euro teuren Bände satte 84 Kilo - kaum etwas für enge Studierstuben und kärgliche Gelehrtengehälter. Selbst eine Taschenbuchausgabe des Monumentalwerks, seit 1984 erhältlich, schlägt mit 499 Euro ins Kontor.
"Wir möchten deutlich darunter bleiben", sagt Kurt Gärtner, seit kurzem pensionierter Altgermanist an der Universität Trier. Es wäre nur im Sinne der Grimms, wenn die elektronische Version des Wörter-Massivs nicht wieder nur für große Bibliotheken und ein paar Spezialisten zugänglich würde: Träumten sie doch nationalromantisch davon, dass ihr "Deutsches Wörterbuch" als Sprachschatz "zum Hausbedarf" zählen werde, aus dem im Familienkreis "mit Verlangen, oft mit Andacht" vorgelesen werden sollte.
Weniger Andachtsstimmung als emsiger Betrieb herrscht momentan in einigen Räumen des "Kompetenzzentrums für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften", einem nüchternen Bau auf dem idyllisch am Berghang gelegenen Campus der Trierer Universität. Im Frühjahr soll der elektronische Grimm fertig sein; für Thomas Burch, den technischen Leiter, läuft alles nach Plan. Bald, sagt er lächelnd, kann jeder, der Lust hat, am heimischen PC sein "Deutsches Wörterbuch" durchstöbern - raffinierter und schneller, als die Brüder es je hätten träumen können.
Einen Vorgeschmack gibt es schon: Unter der Internet-Adresse www.DWB.unitrier.de/index.html lässt sich der gesamte Textbestand des Werks aufblättern. "Bachenspeck" oder "nachgültig", "verfumfeien" oder gar "Yoga" - die Daten sind zur Stelle. Wie in der späteren CD-Rom-Version hängt ganz links eine Alphabetleiste, aus der man in die Liste der 331 056 Wörter gelangt. Ein weiterer Klick und der Volltext des Wort-Artikels erscheint in der Mitte des Bildschirms; ein Zusatzfenster rechts hilft bei längeren Eintragungen, sich im Aufbau zurechtzufinden.
Natürlich wird die CD-Rom erheblich mehr bearbeiten können: verschachtelte und spezielle Anfragen, auch allein nach Lyrikbeispielen, nach Quellenautoren - bei denen an Platz zwei nach Goethe nicht Schiller, sondern der frühe Wörtersammler Kaspar Stieler steht - oder grammatikalischen Sonderfällen; Kopiermöglichkeiten, Lesezeichen und obendrein eine möglichst getreue Nachbildung der ursprünglichen Buchseiten sind im Paket inbegriffen.
Um die 300 Millionen gedruckten Zeichen zu solcher Hochleistung zu trimmen, hat das junge Team um Kurt Gärtner, der in seiner Zunft einer der wenigen konsequenten Elektronikpioniere ist, seit fünf Jahren ein gigantisches Puzzle in mehreren, klar abgegrenzten Schritten durchgespielt: Erst mussten seine Mitarbeiter die Daten kontrollieren und abgleichen, um sie dann in eine abfragbare Form zu übertragen; parallel dazu entstand die übersichtliche Programmoberfläche.
Eingelesen wurde der Text nicht mit Scannern, sondern per Tastatur - in China. Gleich zweimal tippten des Deutschen nicht kundige, aber schriftzeichenbewusste Hilfskräfte in Nanjing die etwa 35 000 Seiten ab, so dass ein automatischer Abgleich beider Versionen schon die meisten Fehler bereinigte. Exotische Zeichen mussten dennoch von Hand in Trier nachgetragen werden, nicht nur Hebräisches oder Astrologiekürzel: Das Wort "Zickzack" etwa illustriert eine kleine Sägezahnlinie.
Nach dieser Ausputzarbeit ist freilich erst eine Rohfassung erreicht. "Woher soll die Maschine wissen, dass ,H. Sachs'' derselbe Autor ist wie ,Hans Sachs'' oder bloß ,Sachs''?", erklärt Hans-Werner Bartz, der sich über der Arbeit am Grimmschen Datengebirge zu einem wahren Jäger der Sonderfälle entwickelt hat. Sogar für die scheinbar narrensichere Gliederung der Artikel in Teil I, Abschnitt 1, Fall a) und so weiter ließen sich die Wörterbuchredakteure im Laufe der Jahrzehnte Dutzende verschiedener Reihenfolgen einfallen, die nun möglichst rasch, also programmgestützt, vereinheitlicht werden müssen - ganz zu schweigen von der nicht weniger trickreichen Unterscheidung zwischen Trenn-, Binde- und anderen Strichen.
Das Ergebnis dieser langwierigen Mühen formt eine Übersetzungsroutine dann blitzschnell in den so genannten SGML-Code um, eine mit Markierungen durchsetzte Darstellung ähnlich der von Web-Seiten, und prüft das Output auch gleich nach losen Sinn-Enden durch. Hier wird erkennbar, warum die Trierer das lexikalische Rohmaterial nicht nach eigenem Standard, sondern nach den Regeln der weltweit wissenschaftlich anerkannten "Text Encoding Initiative" aufarbeiten: Sowohl zur Prüfung wie zur automatischen Abfrage der bereinigten Daten können sie vorhandene Werkzeuge einsetzen.
Die elegante Darstellung im Bildschirmfenster etwa, aber auch das Zerpflücken der Artikel in rasch zu verarbeitende Datenbankbestände ist Sache von CoST (Copenhagen SGML Tool), einer Skriptsprache, für die im Grimm-Team Vera Hildenbrandt zuständig ist. Jeder Bildschirmklick, auch im Internet, setzt sozusagen unter der Motorhaube des Systems einen Mechanismus in Gang, der den gewünschten Abschnitt hervorholt, lesbar macht und, wenn nötig, aufgliedert.
Gerade diese Übersichtsfunktion ermöglicht nun, wovon Jacob Grimm schon 1854 in der Vorrede zum ersten Band des Werks träumte, dass man sich "nach Bienenweise" einfach mal "in die Kräuter und Blumen" der bunten Muttersprachwiese "niederlassen" kann - ganz zu schweigen von den Recherchen, zu denen das gewaltige Sprachmaterial findige Forscher anregen dürfte. Meist kommen sie dabei sogar ein gutes Stück über den Kenntnisstand des Wörterbuchs hinaus.
Doch das ist kein Wunder bei einem Opus, dessen erste, noch recht schmale Bände von zwei Menschen allein verfasst wurden - Wilhelm Grimm übernahm den Buchstaben D, Jacob bewältigte den Rest von A bis zum Wort "Frucht" -, während spätere Bearbeiter immer ausuferndere Artikel lieferten. Für "Amtmännin" etwa notierte Jacob Grimm schlicht, dass man seine Mutter in der hessischen Heimat einst so genannt habe, während der längste Artikel, das Wort "stehen", horrende 328 beispielgespickte Spalten umfasst.
Als der Weisheit letzten Schluss sehen Gärtners Leute ihr Werk ohnehin nicht. Umso mehr belegt der digitale Grimm, wie gute Planung mit Augenmaß die drohende Verewigung mancher großer Nachschlagewerkprojekte überwinden könnte. Bislang sind die Briten mit ihrem legendären, Grimm vielfach überflügelnden "Oxford English Dictionary", das schon in zweiter Auflage auf CD verfügbar ist und laufend ergänzt wird, weit voraus. Aber vielleicht bekommt durch die neue CD-Rom auch die zweite "Grimm"-Auflage, seit Jahrzehnten in Arbeit, neuen Schub.
Die Trierer jedenfalls haben längst andere Riesenwerke aufgespürt, die sie wie den Grimm "retrodigitalisieren" möchten. Wohl das spannendste Projekt für viele, denen historisches Wissen am Herzen liegt, ist der "Krünitz". Diese "Oekonomische Enzyklopädie oder allgemeines System der Staats- Stadt- Haus- und Landwirthschaft" ist mit ihren 242 Bänden, die von 1773 bis 1858 erschienen, eine ungeheure, gewöhnlich aber nur mühsam verfügbare Fundgrube der Fachkenntnis. Zudem findet kaum noch ein Historiker Zeit, sich durch die oft ellenlangen Artikel zu kämpfen. Da kommt eine Volltextaufbereitung à la Grimm gerade recht.
Getreu seiner Offenheitsmaxime hat das "Kompetenzzentrum" schon die ersten Proben ins Netz gestellt; unter www. kruenitz.uni-trier.de sind sie zu besichtigen. Und Kurt Gärtners freundlich-gewitztes Lächeln signalisiert: Auch das wird nicht die letzte Tat der fleißigen Digitalisierer gewesen sein. JOHANNES SALTZWEDEL
* Thomas Burch, Hans-Werner Bartz, Vera Hildenbrandt, Kurt Gärtner.
Von Johannes Saltzwedel

SPIEGEL SPECIAL 3/2003
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGEL-Verlag Rudolf Augstein GmbH & Co. KG.

Dieser Artikel ist ausschließlich für den privaten Gebrauch bestimmt. Sie dürfen diesen Artikel jedoch gerne verlinken.
Unter http://www.spiegelgruppe-nachdrucke.de können Sie einzelne Artikel für Nachdruck bzw. digitale Publikation lizenzieren.


SPIEGEL SPECIAL 3/2003
Titelbild
Abo-Angebote

Sichern Sie sich weitere SPIEGEL-Titel im Abo zum Vorteilspreis!

Jetzt Abo sichern
Ältere SPIEGEL-Ausgaben

Kostenloses Archiv:
Stöbern Sie im kompletten SPIEGEL-Archiv seit
1947 – bis auf die vergangenen zwölf Monate kostenlos für Sie.

Wollen Sie ältere SPIEGEL-Ausgaben bestellen?
Hier erhalten Sie Ausgaben, die älter als drei Jahre sind.

Video 01:03

Orcas rammen Anglerboot "Kommt der etwa zurück?"

  • Video "Entlaufen: Zebra galoppiert durch Dresden" Video 00:35
    Entlaufen: Zebra galoppiert durch Dresden
  • Video "Verhaltensforschung: Kann ein Quiz die Straße säubern?" Video 21:57
    Verhaltensforschung: Kann ein Quiz die Straße säubern?
  • Video "Gesunkene norwegische Fregatte: Taucher bereiten Bergung vor" Video 01:07
    Gesunkene norwegische Fregatte: Taucher bereiten Bergung vor
  • Video "Hauptsache billig: Was wirklich in der Supermarkt-Wurst steckt" Video 07:07
    Hauptsache billig: Was wirklich in der Supermarkt-Wurst steckt
  • Video "Verblüffendes Video: So bedrohlich bellt ein Alligator" Video 00:58
    Verblüffendes Video: So bedrohlich bellt ein Alligator
  • Video "Ein Jahr ÖVP/FPÖ-Regierung: Die Grenzen des Sagbaren wurden verschoben" Video 04:00
    Ein Jahr ÖVP/FPÖ-Regierung: "Die Grenzen des Sagbaren wurden verschoben"
  • Video "Neulich in Finnland: Der übers Wasser läuft" Video 00:25
    Neulich in Finnland: Der übers Wasser läuft
  • Video "Unterwegs mit einem Jäger: Darum ist Wild das bessere Fleisch" Video 07:25
    Unterwegs mit einem Jäger: Darum ist Wild das bessere Fleisch
  • Video "Weihnachtsbraten: Kann ich selber eine Gans schlachten?" Video 08:30
    Weihnachtsbraten: "Kann ich selber eine Gans schlachten?"
  • Video "Gorilla-Forscherin in Afrika: Immer schön Abstand halten!" Video 44:28
    Gorilla-Forscherin in Afrika: Immer schön Abstand halten!
  • Video "Schülerrede auf dem UN-Klimagipfel: Wie eine 15-Jährige mit Politikern abrechnet" Video 02:28
    Schülerrede auf dem UN-Klimagipfel: Wie eine 15-Jährige mit Politikern abrechnet
  • Video "Angriffe auf Frauen in Nürnberg: Tatverdächtiger hat zahlreiche Vorstrafen" Video 01:26
    Angriffe auf Frauen in Nürnberg: Tatverdächtiger hat zahlreiche Vorstrafen
  • Video "Bester Deutscher Big-Wave-Surfer: Sebastian Steudtner reitet Riesenwellen" Video 01:17
    Bester Deutscher Big-Wave-Surfer: Sebastian Steudtner reitet Riesenwellen
  • Video "Webvideos der Woche: Mini-Oktopus findet neues Zuhause" Video 03:06
    Webvideos der Woche: Mini-Oktopus findet neues Zuhause
  • Video "Orcas rammen Anglerboot: Kommt der etwa zurück?" Video 01:03
    Orcas rammen Anglerboot: "Kommt der etwa zurück?"