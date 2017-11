"Selbst die rechenkundigsten Wissenschaftler haben fürchterlich falsche Vorstellungen davon, wie viele Versuchspersonen man wirklich braucht, um in einer Studie von all den zufälligen Macken und Beulen zu abstrahieren, bevor man etwas für alle Amerikaner, geschweige denn für Homo sapiens an sich verallgemeinern kann." - Steven Pinker, Vorwort zu "Everybody Lies"

Ein unter Psychologen verbreiteter Witz geht in etwa so: Die meisten Erkenntnisse über die Menschheit sind in Wahrheit nur Erkenntnisse über Psychologiestudenten im Grundstudium. Tatsächlich basiert ein gewaltiger Anteil aller Studien, in denen Grundlegendes über menschliches Denken und Verhalten herausgefunden wurde, auf rein studentischen Stichproben. Und zwar deshalb, weil Studenten entweder im Rahmen des Studiums verpflichtet werden, Versuchspersonenstunden abzuleisten - oder aber mit "Biergeld" zur Teilnehme überredet werden können, wie Steven Pinker das formuliert.

Stichprobengröße: Zehn Millionen

Jetzt aber ändert sich da etwas, und es hat mal wieder mit dem Digitalen zu tun. Das Ergebnis sind Schlagzeilen wie diese hier: "Mobilfunkdaten scheinen zu bestätigen, dass Politik Thanksgiving ruiniert." Zu lesen war das im "Boston Globe" und der "Washington Post".

Experimentelle sozialpsychologische Studien haben manchmal 20, mal 60 und mal 100 Versuchspersonen. Die Studie, aus der diese Schlagzeile wurde, basiert auf einer etwas größeren Stichprobe: Sie umfasst 10 Millionen US-Bürger. Und keiner davon weiß, dass er überhaupt teilgenommen hat.

Die Wirtschaftswissenschaftler Keith Chen und Ryne Rhola zogen ihre Schlüsse aus einer Kombination von Datenquellen. Zum einen benutzten sie Informationen über das Wahlverhalten in bestimmten Bezirken - mehr Stimmen für Donald Trump oder mehr für Hillary Clinton? Entscheidend aber war etwas Anderes: Daten aus zehn Millionen Mobiltelefonen. Die kauften sie einfach ein, bei einem Unternehmen namens Safegraph, das eine Tracking-Technik in diversen Smartphone-Apps untergebracht hat. Die sorgt dafür, dass Safegraph immer weiß, wer wann wo war.

"Wir bekommen Informationen von vertrauenswürdigen Daten-Partnern wie etwa Entwicklern von mobilen Anwendungen", so erklärt Safegraph das in seiner Privacy Policy. Wer also bei der App-Installation die Privatsphäre-Erklärung einfach wegklickt, hat womöglich schon eingewilligt, Teil einer solchen Stichprobe zu werden. Im Vergleich zu Kartenanbietern wie Google oder Apple ist Safegraph in Sachen Ortskenntnis aber immer noch ein kleines Licht. Interessant übrigens: Zu den Beratern von Safegraph gehört ein gewisser Karl-Theodor zu Guttenberg.

Solche Handy-Ortsdaten sind zunächst nicht personalisiert, aber die Studie zeigt anschaulich, dass das auch gar nicht nötig ist: Chen und Rhola bestimmten die Wohnorte ihrer 10 Millionen unfreiwilligen Versuchsteilnehmer einfach, indem sie nachsahen, wo die Telefone nachts in der Regel waren. So einfach werden aus "anonymisierten" Informationen Adressdaten.

Familienkiller Wahlkampf?

Dann ermittelten die Forscher, ob der jeweilige Wohnort in einem eher republikanischen oder eher demokratischen Wahlbezirk lag. Die dort Lebenden wurden dann schlicht als "Republikaner" oder "Demokraten" klassifiziert, was natürlich eine grobe Vereinfachung ist. Anschließend sahen die Autoren nach, wo der jeweilige Smartphone-Besitzer zu Thanksgiving hinfuhr und wie lange er dort blieb. Und siehe da: "Republikaner", die in "demokratischen" Gegenden zu Gast waren, blieben dort 20 bis 30 Minuten kürzer und umgekehrt. Außerdem habe die Zahl der Verwandtenbesuche über Parteigrenzen hinweg von 2015 bis 2016 abgenommen.

"Familien mit nicht zusammenpassendem Wahlverhalten" hätten auf diese Weise USA-weit insgesamt "62 Millionen Personenstunden Thanksgiving-Zeit" eingebüßt, so die Folgerung. Die Angst vor dem politischen Krach habe wohl dafür gesorgt.

Ob diese Schlussfolgerungen haltbar und methodisch wirklich abgesichert sind, ob alle intervenierenden Variablen kontrolliert wurden, kann und will ich nicht beurteilen. Die Studie ist bislang nur als Arbeitspapier erschienen, hat also keinen Peer-Review-Prozess durchlaufen. Aber darum geht es hier auch gar nicht. Es geht um die neue Art von Wissenschaft, die sich in solchen Arbeiten manifestiert: Was Chen und Rhola getan haben, könnte man "Big Data in Aktion" nennen.

Freud bestätigt mit Datenbergen?

Im Beispiel geht es um Abermillionen Datensätze über den Aufenthaltsort von Menschen, aber vergleichbare, womöglich noch wertvollere Informationsberge gibt es längst zu Hauf. "Ich bin mittlerweile überzeugt, dass Google-Suchen der wichtigste Datensatz über die menschliche Psyche sind, der je zusammengetragen wurde", schreibt zum Beispiel Seth Stephens-Davidowitz in seinem Buch "Everybody lies". Er sollte wissen, wovon er spricht, hat nämlich früher als Datenanalyst für Google gearbeitet, verfügt aber auch einen Doktortitel in Wirtschaftswissenschaften aus Harvard.

In seinem auf Deutsch noch nicht erschienenen Buch führt Stephens-Davidowitz vor, was man aus den Datenspuren, die wir alle unwissentlich hinterlassen, so alles ablesen kann. Zum Beispiel, dass eine erstaunliche Menge von sowohl Männern als auch Frauen sich offenbar für Sex unter Verwandten interessieren - was man daran erkennen kann, dass sie in Pornoportalen nach Videos mit Inzest-Thematik suchen.

Die Pornodaten, glaubt Stephens-Davidowitz, würden eines Tages dazu beitragen, dass "das finale Urteil über die menschliche Sexualität einige Schlüsselthemen umfassen wird, die schon Freud betont hat". Ödipus, entlarvt per Browser-History? Zu Suchfenstern, glaubt Stephens-Davidowitz, sind wir ehrlicher als zu unseren engsten Freunden.

Google-Suchen, Pornoseiten, Ortsdaten, Facebook-Posts, Instagram-Fotos und so weiter: Die Datenexplosion der vergangenen Jahre trägt dazu bei, dass wir uns, forschungstechnisch betrachtet, gerade in Ameisen verwandeln. Es muss nur jemand mit einer ausreichend großen Lupe kommen.

Der Physiker und Mathematiker Stephen Wolfram, der schon mit 15 Jahren Artikel über Teilchenphysik publizierte, geht sogar noch weiter. Er glaubt, dass die Datenberge eine bemerkenswerte Wahrheit enthüllen: "Menschen sind gewissermaßen vorhersagbarer als die Quantenmechanik von Elementarteilchen."

So weit und so kalt wird der Blick der neuen Big-Data-Sozialwissenschaft sein - solange wir Ameisen mitmachen.