Wissenschaftliche Studien Verschollen im Daten-Nirvana

Wenn Forscher eine Studie publizieren, bleiben die Primärdaten bei ihnen. Doch diese Art der Archivierung scheint langfristig kaum zu funktionieren. Denn schon wenige Jahre später lassen sich viele Datensätze nicht mehr auftreiben.

Flüchtige Belege: Forschungsdaten wie dieser genetische Code sollen eigentlich über mindestens zehn Jahre aufbewahrt werden (Archivbild)
DPA

Flüchtige Belege: Forschungsdaten wie dieser genetische Code sollen eigentlich über mindestens zehn Jahre aufbewahrt werden (Archivbild)


Hinter wissenschaftlichen Studien stecken zumeist Unmengen von Messdaten und statistischen Auswertungen. Wie die Resultate zustande gekommen sind, bleibt nur nachvollziehbar, wenn auch die Primärdaten aufbewahrt werden. Kanadische Forscher haben nun nach den Rohdaten von mehr als 500 bereits veröffentlichten Studien aus dem Bereich Ökologie gefahndet - in vielen Fällen ohne Ergebnis.

Je länger die Publikation einer Studie zurücklag, desto häufiger war es deren Autoren nicht mehr möglich, die Primärdaten aufzutreiben. Pro Jahr stieg die Wahrscheinlichkeit dafür um durchschnittlich 17 Prozent. Das berichten die Wissenschaftler um Timothy Vines von der University of British Columbia in der aktuellen Ausgabe der Fachzeitschrift "Current Biology".

Einbezogen hatten die Forscher 516 Studien, die zwischen 1991 und 2011 veröffentlicht worden waren. Bei den ältesten von ihnen waren die Rohdaten in vier von fünf Fällen nicht mehr zugänglich - entweder weil die Adressen der Autoren veraltet oder die Daten verschollen waren. "Niemand erwartet, dass man von einer 50 Jahre alten Studie noch die Daten bekommen kann", kommentiert Timothy Vines das Ergebnis. "Aber dass nach 20 Jahren beinahe alle Datensätze verschwunden sind, war schon überraschend."

Auf dem Dachboden der Eltern

Damit sich die wissenschaftlichen Arbeiten überhaupt miteinander vergleichen ließen, wurden nur solche Studien einbezogen, in denen Längenmessungen von Pflanzen oder Tieren mit einer bestimmten statistischen Methode ausgewertet wurden. Zunächst versuchten die Kanadier, die Autoren dieser Studien zu erreichen. Schon das misslang in der Mehrzahl der Fälle, weil die angegebenen E-Mail-Adressen nicht mehr funktionierten oder die Anfragen nicht beantwortet wurden.

In immerhin 158 Fällen bekamen die kanadischen Forscher Informationen darüber, ob die Rohdaten der jeweiligen Studie noch vorhanden waren. Insgesamt 37 Primärdatensätze wurden dabei als vermisst gemeldet - ihr Anteil war umso größer, je weiter die Veröffentlichung zurücklag. So fehlten die Rohdaten bei zwei von drei untersuchten Studien, die im Jahr 1991 publiziert wurden. Bei zehn Jahre später veröffentlichten Arbeiten lag die Quote bei nur einem Drittel.

Starker Zusammenhang: Je älter eine Studie war, desto kleiner ist die Wahrscheinlichkeit, dass die Primärdaten noch immer greifbar sind
Current Biology / Elsevier-Verla

Starker Zusammenhang: Je älter eine Studie war, desto kleiner ist die Wahrscheinlichkeit, dass die Primärdaten noch immer greifbar sind

Die Gründe für das Verschwinden wissenschaftlicher Rohdaten sind vielfältig - das zeigen die Rückmeldungen der angeschriebenen Autoren. Manche waren sicher, dass ihre Daten nicht mehr aufgespürt werden können - etwa weil sie auf einem Computer gespeichert waren, der gestohlen wurde. Andere vermuteten die Rohdaten an einem schwer zugänglichen Ort wie dem Dachboden ihrer Eltern.

Die Autoren der nun veröffentlichten Analyse fordern, öffentliche Archive für wissenschaftliche Primärdaten einzurichten. "Der Verlust von Datensätzen ist eine Verschwendung von Forschungsgeldern und schränkt die wissenschaftliche Arbeit ein", sagt Timothy Vines. Gerade weil viele Daten einzigartig und nicht reproduzierbar seien, sollten sie nicht allein in den Händen der Studienautoren bleiben.

che



Forum - Diskutieren Sie über diesen Artikel
insgesamt 24 Beiträge
Alle Kommentare öffnen
Seite 1
Mac_Beth 23.12.2013
1. Keine Macht dem Titel!
Eine Studie darüber, was mit älteren Studiendaten geschieht. Über die Ernsthaftigkeit bin ich mir zwar im klaren, trotzdem ist es auf der anderen Seite auch ziemlich lustig.
rosic09 23.12.2013
2. Reproduzierbarkeit
Wissenschaftliche Daten haben vor allen dann wert wenn sie reproduzierbar sind, Daten die dies nicht sind, haben keinen wissenschaftlichen Wert und sind nicht brauchbar.
st.esser 23.12.2013
3. Obsolezens von Datenträgern
Zitat von sysopDPAWenn Forscher eine Studie publizieren, bleiben die Primärdaten bei ihnen. Doch diese Art der Archivierung scheint langfristig kaum zu funktionieren. Denn schon wenige Jahre später lassen sich viele Datensätze nicht mehr auftreiben. http://www.spiegel.de/wissenschaft/mensch/wissenschaftliche-studien-verschollen-im-daten-nirvana-a-940633.html
Eine Archivierung von Daten würde auch erfordern, dass sie regelmäßig auf dem Stand der Technik entsprechende Datenträger umkopiert werden. Der technologische Fortschritt führt dazu, dass heute um mehrere Größenordnungen höhere Datenmengen verarbeitet und gespeichert werden können, als noch vor 10 oder 20 Jahren. Das bedeutet auch, dass die Datenträger, auf die man alte Rohdatenbstände sichern kann, nicht mehr viel kosten. Anfang der 90er-Jahre wurden aufwändige Experimente (zum Beispiel Kern-Spektroskopie zur Prüfung von Modellen der Struktur von Atomkernen) auf 9-Spur-Magnetbänder (zu je 140MByte) aufgezeichnet, die dann über Monate hinweg verarbeitet wurden, nachdem sie in einer ein- bis zweiwöchigen Messung erzeugt worden waren. Ein großes Experiment benötigte 100 bis 200 solche Bänder, oder 15 bis 50 GByte, die mehrere Kubikmeter Lagerraum beanspruchten. Die Messung selbst kostete einige 10.000 bis 100.000 DM, daher machte es Sinn, mehreren Wissenschaftlern die Auswertung in Hinblick auf andere Effekte zu ermöglichen, um möglichst viel Erkenntnis daraus zu ziehen. Mitte der 90er-Jahre wurde dann auch Helical-Scan-Medien geschrieben, die dann etwa 4 GByte in der Größe einer Kompact-Cassette unterbrachten. Hiermit ließen sich dann auch noch Datenmengen von 500 GByte handhaben (wieder mit vielen Monaten um alle Medien zum Auswerten einzulesen). Heute passen die 50 GByte leicht auf einen USB-Stick, die 500 GByte auf eine Notebook-Festplatte. Und diese Medien kann man in Stunden einmal komplett auslesen. Nur kann man weder die 9-Spur-Bänder noch die Exabyte-Kassetten heute noch auslesen, um sie auf ein modernes Medium zu kopieren. Es gibt praktisch keine funktionsfähigen Lesegeräte mehr! Und zu der Zeit, als es noch möglich gewesen wäre, die Daten zu lesen, da hätte es so viel Zeit beansprucht, dass niemand den Aufwand hätte verantworten wollen. Und so wird eine riesige Menge an Informationen verloren gehen, weil wir ihren Wert zur Zeit noch nicht einschätzen können und weil heute auch die Wissenschaft nachweisen muss, dass wirtschaftlich gehandelt wird. Ich glaube, dass viele von den damals mit dem Computer verarbeiteten Daten nicht wegen Diebstählen von Computern verloren gegangen sind, sonder weil sie auf heute nicht mehr unterstützen Medien gespeichert wurden. Ob es nun Disketten oder bestimmte Magnetband-Formate waren ...
noalk 23.12.2013
4. Doch von Wert
Zitat von rosic09Wissenschaftliche Daten haben vor allen dann wert wenn sie reproduzierbar sind, Daten die dies nicht sind, haben keinen wissenschaftlichen Wert und sind nicht brauchbar.
Daten, die nicht reproduzierbar sind, könnten immer noch für eine Publikation im Journal of Irreproducible Results taugen.
KPunkt 23.12.2013
5.
---Zitat--- Es gibt praktisch keine funktionsfähigen Lesegeräte mehr! Und zu der Zeit, als es noch möglich gewesen wäre, die Daten zu lesen, da hätte es so viel Zeit beansprucht, dass niemand den Aufwand hätte verantworten wollen. Und so wird eine riesige Menge an Informationen verloren gehen, weil wir ihren Wert zur Zeit noch nicht einschätzen können ---Zitatende--- Na und? Die Technik ist bekannt, die ist nicht verloren gegangen. Und wenn es dringend erforderlich sein sollte, Daten von einem 9-Spur Band einzulesen, dann wird halt eines gebaut. Und wenn die Bänder beschädigt sein sollten? Haben Sie schon einmal nachgelesen, was professionelle Datenretter noch alles aus Disketten, CD's Festplatten, Streamerbändern rausholen?
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2013
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.