Von Veronika Hackenbroch
Jetzt beginnt der Computer des Kernspingeräts zu rechnen: Für jedes Voxel einzeln ermittelt er, ob sich die BOLD-Signalstärken in der Ruhephase und der Phase des Aufgabenlösens signifikant voneinander unterscheiden. Wenn ja, wird dieses Voxel eingefärbt. Anschließend wird das Muster der eingefärbten Voxel auf ein Standardgehirn projiziert: Es entsteht ein buntes Hirnscan-Bild.
Allerdings lauern in dieser rechnerischen Mammutaufgabe etliche mögliche Fehlerquellen. Vor allem muss der Untersucher selbst festlegen, was er unter "signifikant" versteht. Je großzügiger er die Einstellung wählt, desto mehr Aktivität wird das Gerät zeigen. "Bunte Flecken kann das fMRT, wenn der Untersucher es will, immer zeigen", sagt deshalb Timo Krings, Neuroradiologe von der University of Toronto. "Die Frage ist nur, ab wann die Aussagekraft dieser Flecken gleich null ist."
Wie beim Lautstärkeregler eines Radios kann ein Forscher bei der Auswertung der Versuchsdaten die Signifikanzgrenzen nach oben oder unten regeln und so bunte Flecken entstehen und wieder verschwinden lassen, bis er sich schließlich für die Grenze entscheidet, die er für die beste hält: ein hoch subjektiver Vorgang und, wie Bennett es nennt, ein "prinzipienloser Prozess".
Warum Frauen nicht einparken können
Die fertigen Hirnscans sind von einem naturalistischen Abbild der Wirklichkeit so weit entfernt wie das berühmte Warhol-Porträt von der wahren Marilyn Monroe. Wie viel die hochartifiziellen, subjektiv gestalteten Rechenkonstrukte am Ende noch mit der untersuchten Fragestellung zu tun haben, wird von vielen Forschern offenbar deutlich überschätzt.
"Voodoo-Korrelationen in der sozialen Neurowissenschaft": Unter diesem provokanten Titel reichte der MIT-Wissenschaftler Edward Vul vor wenigen Jahren einen Artikel ein, in dem er fMRT-Arbeiten seiner Kollegen genauer analysiert hatte. Selbst hochrangige Wissenschaftler, so Vuls Befund, hatten nicht nur den Zusammenhang zwischen Wirklichkeit und Hirnscan viel zu hoch angegeben, sondern ihn auch völlig falsch berechnet.
Zu den zahlreichen Fallstricken der Statistik kommt noch die Unberechenbarkeit äußerer Einflüsse hinzu. Der Neuroradiologe Krings etwa konnte zeigen, wie ein scheinbar faszinierendes Ergebnis als Trugschluss entlarvt werden kann, wenn man es genauer untersucht.
Mit Hilfe der funktionellen Kernspintomografie hatte seine Arbeitsgruppe das räumliche Vorstellungsvermögen von Männern und Frauen verglichen. Frauen, so zeigte sich schnell, brauchen für die gleiche Aufgabe einen viel größeren Teil ihres Gehirns als Männer - vermutlich, so die naheliegende Deutung, um ihre Schwächen auf diesem Gebiet auszugleichen: Der Beweis, warum Frauen nicht einparken können, schien (wieder einmal) erbracht.
"Die Deutung von fMRT-Ergebnissen lässt viel Spielraum"
Dann jedoch wiederholte Krings seinen Versuch mit Frauen in verschiedenen Phasen ihres Menstruationszyklus. Nun stellte er fest: Die größten Unterschiede zu Männern bestanden zur Zeit des Eisprungs, wenn das Hormon Östrogen Spitzenwerte erreicht. In den Östrogen-Niedrigphasen hingegen war kein Unterschied zwischen den Geschlechtern mehr feststellbar.
Lässt Östrogen also das räumliche Vorstellungsvermögen verkümmern? Mitnichten, meint Krings. Für den beobachteten Effekt gebe es eine viel einfachere Erklärung: "Östrogen erhöht die Gehirndurchblutung und beeinflusst deshalb das BOLD-Signal. Man muss mit voreiligen Schlüssen wirklich sehr vorsichtig sein."
Auch Kaffee trinken am Morgen vor der Untersuchung, Treppen steigen, Fernsehen gucken, ja sogar schon die Aufregung angesichts der lautstark hämmernden Riesenröhre können die Daten maßgeblich verzerren. Die Zuverlässigkeit, mit der fMRT-Ergebnisse reproduziert werden können, ist entsprechend niedrig. Bennett gibt sie in einer umfangreichen Untersuchung mit 33 bis 66 Prozent an.
Welchen Wert, fragt man sich, kann da noch ein fMRT-Lügendetektor haben? Welchen Wert hat eine psychiatrische Diagnose per funktionellen Kernspin oder eine Medikamentenstudie, bei der die Wirkung eines Arzneimittels mit Hilfe von Hirnscan-Veränderungen nachgewiesen werden soll?
Die Methode müsse nicht geächtet, sondern verbessert werden
Je komplizierter die Fragestellung eines Experiments, desto fragwürdiger ist oft die Interpretation des Ergebnisses. Mitunter bekommt man den Eindruck, um die bunten Flecken im Hirnscan herum werde schlicht mit viel Phantasie eine passende Geschichte gestrickt. "Bewiesen: Liebe wirkt wie Kokain", dichtete beispielsweise die Berliner "B.Z.". Die "Welt" schrieb: "Forscher beweisen: Nach 20 Jahren haben manche Paare Gefühle wie am ersten Tag." "Sex findet bei Frauen zwischen den Ohren statt" und "Naturszenen sind Balsam fürs Gehirn" lauteten weitere Schlagzeilen.
"Wenn eine Geschichte zu einfach klingt, um wahr zu sein", warnt fMRT-Experte Poldrack, "dann ist die Geschichte oft auch nicht wahr."
Und selbst wenn ein Befund einer kritischen Hinterfragung standhält, bleibt noch die große Frage, was eigentlich die Ursache und was die Wirkung ist: Was beweist es schon, wenn das Gehirn jüngerer Probanden bei klassischer Musik weniger Aktivität zeigt als das älterer Hörer? Langweilt sie Mozart, weil ihr Hirn dafür weniger empfänglich ist, oder bleibt ihr Hirn stumm, weil sie Mozart langweilig finden? "Die Deutung von fMRT-Ergebnissen lässt viel Spielraum", sagt Krings, "vor allem bei komplexen Aufgaben oder Emotionen."
Krings und die anderen Kritiker wollen die Methode keineswegs ächten, sondern dringen nur darauf, sie zu verbessern. Auch Bennett schiebt weiterhin Probanden in den Tomografen - wenngleich bis auf weiteres nur noch menschliche. Den Lachs haben er und seine Kollegen nach dem Experiment aufgegessen, mit einer schmackhaften Zitronen-Knoblauch-Sauce.
Auf anderen Social Networks posten:
HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:
| alles aus der Rubrik Wissenschaft | Twitter | RSS |
| alles aus der Rubrik Medizin | RSS |
| alles zum Thema Hirnforschung | RSS |
© DER SPIEGEL 18/2011
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH