Literatur als Big Data "Gute Programmierer wollen keinen Job an der Uni"

Der Roman als Datensatz: Der Literaturwissenschaftler Franco Moretti lässt Computer lesen - und zwar Zehntausende Bücher gleichzeitig. So findet der Stanford-Professor sogar noch Überraschendes in "Hamlet".

Big Data in Buchform
Getty Images

Big Data in Buchform

Ein Interview von


SPIEGEL ONLINE: Herr Moretti, Literaturwissenschaftler analysieren meist einen Roman nach dem anderen. Wie viele sinds bei Ihnen?

Moretti: Für das aktuelle Projekt durchforsten wir 15.000 auf einmal: Wir wollen einen Gefühlsstadtplan von London erschaffen - dafür untersuchen wir, wie Emotionen in London-Romanen auftauchen, die zwischen 1700 und 1900 erschienen sind. Es gibt zig literarische Studien über Gefühle und genauso viele über Karten, doch beides verknüpft hat noch keiner. Aber Ergebnisse gibts erst im Herbst.

Zur Person
  • Angelika Leuchter/ WIKO
    Franco Moretti, geboren 1950, ist Literaturwissenschaftler. Seit 2000 lehrt er an der kalifornischen Universität Stanford und nun auch in Lausanne. Sein Forschungsschwerpunkt ist britische Literatur. Er ist einer der Vorreiter der sogenannten "Digital Humanities". Er ist der Bruder des italienischen Filmemachers Nanni Moretti.

SPIEGEL ONLINE: Auch das Warten auf die Ergebnisse zeigt: Literatur ist für Sie ein Datensatz, diese Methode nennen Sie "Distant Reading". Wie genau funktioniert das in Ihrem "Litlab" an der Universität Stanford?

Moretti: Zunächst ließen wir unser Programm nach Londoner Ortsnamen suchen, also Plätze, Gebäude, Parks, Museen und so weiter. In einem zweiten Schritt überprüften wir eine bestimmte Anzahl Worte vor und nach diesen Ortsnamen in den Texten. Wir suchen nach Stichworten, die Glück oder Traurigkeit signalisieren, füllen Excel-Tabellen damit und verknüpfen das dann mit Kartenmaterial.

SPIEGEL ONLINE: Das ist das komplette Gegenteil des klassischen Interpretationsansatzes, des "Close Reading". Hat der sich überholt?

Moretti: Nein. Den Ausdruck "Distant Reading" ließ ich vor 15 Jahren als Witz auf einer Konferenz fallen. Dahinter steckte kein Plan, es wurde nicht ernst genommen. Aber dann hatte ich einen Schlüsselmoment, als ich an meinem "Atlas des europäischen Romans" saß: Ich kapierte, dass ich lange Datenserien bräuchte, um verlässliche Landkarten zu den Erzählungen erstellen zu können.

SPIEGEL ONLINE: Und was haben Sie gemacht?

Moretti: Ich las all diese Romane, hielt Ausschau nach Ortsnamen und notierte sie in ellenlangen Listen - und zwar ganz amateurhaft mit Stift und Papier. Es war mühsam. Der Aufwand von damals lässt sich nicht mit heute vergleichen. Was jetzt alles möglich ist, war damals gar nicht vorstellbar. Allein das London-Projekt wäre schlicht nicht machbar gewesen. Der Schritt von meinem Forschungsfeld der literarischen Geografie zur Quantifizierung war dann nur logisch.

SPIEGEL ONLINE: Wollten Sie damit auch provozieren?

Moretti: Ja, ein bisschen. Mit Erfolg. Während jüngere Forscher diesen Ansatz als befreiend empfanden, klang "Distant Reading" für die älteren nach reiner Oberflächlichkeit. Weil es nicht mehr ums einzelne Detail geht, den einen Absatz, die eine Seite eines Texts, sondern um wiederholbare semantische, grammatikalische Muster in einer großen Textmasse.

SPIEGEL ONLINE: Aber wie lässt sich so die Qualität eines Romans beurteilen?

Moretti: Das weiß ich ehrlich gesagt auch oft nicht. Denn Quantität und Qualität sind nun einmal unterschiedliche Kategorien. Aber natürlich sollte eine quantitative Analyse auch qualitative Aspekte adressieren und sichtbar machen. Nehmen Sie die 7000 Romantitel, deren Länge ich untersuchte...

SPIEGEL ONLINE: ...also von gut 20 Worten pro Buch Mitte des 18. Jahrhunderts hin zu Titeln wie Jane Austens "Emma" von 1816.

Moretti: Ich dachte darüber nach, welche semantischen, rhetorischen und auch ästhetischen Folgen es hatte, dass Buchtitel zuerst so lang und dann wieder kurz waren: Anfangs waren sie wie ganze Inhaltsangaben, später konzentrierte man sich auf den Namen der Heldin, um schnell hervorzustechen, oder fügte ein Adjektiv hinzu, um Spannung zu erzeugen, wie etwa mit "Der falsche Freund".

SPIEGEL ONLINE: Sie interpretieren also doch.

Moretti: Stimmt, ich wollte beweisen, dass der Leser mit einem ganz anderen Erwartungshorizont auf extrem kurze Romantitel reagiert: Das ist eher Rezeptionstheorie als Datenarbeit. Aber viele, die mit Daten arbeiten, haben kein Interesse daran, beides zu verknüpfen. Momentan arbeiten alle mit Diagrammen, Kurven, Netzwerken, Listen. Aber oft wird dann nur eine Flut an Fakten veröffentlicht - und die Erklärung dahinter ist banal, ohne wissenschaftliche Tiefe. Ich hoffe, dass das nur ein Wachstumsproblem ist und bald kritischere Perspektiven folgen.

SPIEGEL ONLINE: Naturwissenschaftler fiebern oft einem Heureka-Moment entgegen, wenn sie auf Resultate warten. Hatten Sie schon einen?

Moretti: Sagen wir so: Ich war sehr überrascht, als sich in meiner Netzwerkanalyse von "Hamlet" herausstellte, dass Horatio nach Hamlet die wichtigste Figur des ganzen Stücks ist. Aber einen echten Heureka-Moment gaben die Daten bislang nie her. Ihre Qualität ist nicht so hoch wie erhofft: Weil der Forschungszweig noch sehr jung ist und die wenigen, die hier arbeiten, das zudem mit eher bescheidenen Mitteln tun müssen.

Anzeige

SPIEGEL ONLINE: Ihr Campus liegt direkt am Silicon Valley, fünf bis 15 Kilometer entfernt von der Apple- und Google-Zentrale in Palo Alto. Geld und technologische Expertise gäbe es da genug.

Moretti: Dass ich ausgerechnet in jener Phase meiner Karriere in Stanford landete, war reiner Zufall. Die Umgebung hat unsere Arbeit nicht einfacher gemacht: Denn gute Programmierer gehen hier zu Google oder Apple, die wollen keinen Job an der Uni. Wir haben nur Literaturwissenschaftsstudenten und einen Juniorprofessor, die programmieren können. Ich werde regelmäßig gefragt, wieso ich nicht mit diesen Firmen zusammenarbeite. Ehrlich, das wird nie passieren.

SPIEGEL ONLINE: Warum?

Moretti: Die Kultur, die diese Technologieriesen propagieren, ist sehr viktorianisch: enorm an Ergebnissen, an Produkten interessiert. Doch Universitäten haben eine Raison d'Être, weil sie Wissen produzieren, bei dem es nicht um unmittelbare Anwendbarkeit geht. Uns geht es primär ums Vergnügen, Dinge herauszufinden.

SPIEGEL ONLINE: Die Vermessung unseres Lebens ist Alltag, sogar unsere Schritte lassen wir zählen. Wie beeinflusst das Ihre Arbeit?

Moretti: Ich mag es, diese Methoden für die großen Fragen der gesamten Literaturwissenschaft zu nutzen. Aber ich hänge dazwischen: Manchmal fühle ich mich diesen aktuellen Entwicklungen sehr nahe. Andererseits merke ich, wie eben hier im Silicon Valley, dass damit eine sehr zielorientierte Kultur einhergeht - alles ist reine Zweckrationalität.

SPIEGEL ONLINE: Moment: Vor 15 Jahren waren Sie mit "Distant Reading" Avantgarde. Heute stehen die "Digital Humanities", also die computerbasierten Forschungsansätze der Geisteswissenschaften, für den aktuellsten heißen Scheiß - und Sie fühlen sich nicht verstanden?

Moretti: Ich will eine Brücke zwischen dem Neuen und dem Alten schaffen, aber keine der beiden Welten scheint daran interessiert.

SPIEGEL ONLINE: Was ist denn das Problem?

Moretti: Die Digital-Humanities-Leute rümpfen die Nase, weil ich auch über Wiktor Schklowski, Max Weber und Karl Popper reden will. Und die Kollegen aus der Close-Reading-Ecke sind der Meinung, ich verrate die Disziplin an Barbaren. Verstehen Sie mich nicht falsch, ich mag, was ich tue. Aber in gewisser Weise war ich noch nie so isoliert wie heute. Es hat etwas von einer Komödie.

Mehr zum Thema


insgesamt 3 Beiträge
Alle Kommentare öffnen
Seite 1
Newspeak 06.06.2016
1. ...
Echte Interdisziplinarität bemisst sich erfahrungsgemäß am Grad des Unverständnisses und der Ignoranz, die man von den etablierten Vertretern der beteiligten Fachgebiete entgegengebracht bekommt. Man ist dann wirklich oft isoliert, obwohl man theoretisch eine "doppelt" so große Community bedient.
kopp 06.06.2016
2. 'Gute Programmierer wollen keinen Job an der Uni'
Zur hauptsächlichen Tätigkeit als Programmierer braucht man kein Universitätsstudium.
neuronensalat 07.06.2016
3. Hier könnte IBMs Watson helfen
Der gute Mann sollte sich dringend mal mit IBM Watson beschäftigen, dann kann er sich die Excellisten sparen. Watson hat eine Lesegeschwindigkeit derzeit von 16000 DIN A4 Seiten in der Stunde...
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.