Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Studie zur Web-Haltbarkeit: Das Netz vergisst schnell

Von

Das Internet vergisst nie? Von wegen. Das Web ist ein extrem flüchtiges Medium - binnen zweieinhalb Jahren ist ein Viertel der wichtigen Online-Quellen zum Arabischen Frühling, dem Schweinegrippe-Ausbruch und Michael Jacksons Tod wieder verschwunden.

Fehlermeldungen: Die schönsten 404er-Seiten im Web Fotos

Wenn Historiker in 30 Jahren versuchen sollten, die Reaktion auf den Arabischen Frühling im Web zu analysieren, werden sie vor einem Problem stehen: Viele Quellen im Web dürften verschwunden sein. Das Internet vergisst eben doch, und zwar erstaunlich schnell. Einer Studie der US-Informatiker Hany M. SalahEldeen und Michael L. Nelson von der Old Dominion University zufolge ist heute bereits ein Viertel der 2009 in ausgewählten Tweets verlinkten Quellen zum Aufstand in Ägypten nicht mehr abrufbar.

Die Wissenschaftler haben mehr als 11.000 Links in Tweets zu sechs Großereignissen der Jahre 2009 bis 2012 untersucht. Ihr Ergebnis: Mitte 2012 war gut ein Viertel der 2009 in den ausgewählten Tweets verlinkten Quellen ist nicht mehr abrufbar. Immerhin sieben Prozent der im März 2012 auf Twitter empfohlenen und verlinkten Quellen war nicht mehr erreichbar. Es geht dabei um Videos bei YouTube, Fotos bei Twitpic und Yfrog, Artikel in US-Medien und Blog-Einträge auf Wordpress.com - allesamt zeitgeschichtliche Dokumente, zum Teil wohl auch Primärquellen, wie zum Beispiel Videos aus Ägypten.

Web-Archive erhalten weniger als die Hälfte

Die Forscher werden ihre Studie am 25. September bei der Archivierungs-Fachtagung "Theory and Practice of Digital Libraries" vorstellen, ihr Paper wurde von drei Mitgliedern des Auswahlkomitees geprüft und angenommen.

Die wesentliche Erkenntnis der Untersuchung: Je länger die Ereignisse zurückliegen, desto weniger der in Tweets verlinkten Quellen sind noch abrufbar. Auch Web-Archive wie das Internet Archive erhalten nur eine Minderheit der empfohlenen Quellen. Die Forscher haben beim von der US-Kongressbibliothek finanzierten Online-Dienst Memento geprüft, ob in einem der dort erfassten Web-Archive Kopien der Inhalte liegen.

Bei den Ereignissen aus dem Jahr 2009 waren nur um die 40 Prozent der damals auf Twitter empfohlenen Quellen bei einem der Online-Archive in Kopie hinterlegt. Zwischen 17 und 25 Prozent der untersuchten Webseiten waren weder am ursprünglichen Speicherort noch in einem der Online-Archive erhalten - Hunderte von Videos, Fotos und Artikeln zu den Protesten in Iran, Michael Jacksons Tod und dem Schweinegrippe-Ausbruch sind wohl unwiederbringlich verloren.

Anteil verlorener und archivierter Online-Quellen (2009-2012)
Ereignis Stichprobe (Tweets) höchste Tweet-
anzahl
Anteil verschwun-
dener Websites (%)
Anteil archivierter Webseites (%) Anteil verschwun-
dener und nicht- archivierter Webseiten (%)
Proteste in Iran * 3429 15.06.2009 25,86 38,51 17,76
Michael Jacksons Tod 2293 25.06.2009 33,45 34,2 25,85
Schweine-
grippe-Ausbruch
5517 11.09.2009 23,95 42,12 17,99
Friedens-
nobelpreis für Obama
1118 03.10.2009 24,86 47,87 15,95
Proteste in Ägypten ** 7319 11.02.2011 10,48 20,18 7,67
Bürgerkrieg in Syrien *** 1955 25.03.2012 7,04 5,35 7,04
* Stichproben anhand von Tags in mehrstufigen Verfahren aus einem 476 Million Tweets im Stanford Large Network Dataset, die im Zeitraum vom 1.6. bis 31.12.2009 veröffentlicht worden sind / ** Auswahl aus Storify, IAmJan25.com und aus dem Buch "Tweets From Tahrir", Zeitraum 20.1.2011 - 1.3.2011 / *** Stichprobe aus dem März 2012, anhand von Tags mit der Twitter-Suchfunktion ausgewählt / Quelle: Losing My Revolution
Die Forscher leiten aus ihren Ergebnissen diese Feststellung ab: Ein Jahr nach Erstveröffentlichung sind elf Prozent der Online-Quellen nicht mehr am ursprünglichen Speicherort und auch nicht in Web-Archiven abrufbar, danach steigt der Anteil der verschwundenen Seiten um 0,02 Prozentpunkte pro Tag.

Die Studie zeigt, wie flüchtig Online-Quellen sind. Erstaunlich ist, dass Quellen verschwinden, die von Nutzern als ausreichend wertvoll für öffentliche Empfehlungen erachtet wurden. Bislang war lediglich bekannt, dass Online-Archive der Alltagskultur verschwinden. So ist zum Beispiel der Großteil der einst öffentlich zugänglichen Friendster-Profile für immer verloren, weil der neue Besitzer 2011 die Daten löschte. Friendster war 2002 als eines der ersten Social Networks überhaupt gestartet. So hat zum Beispiel Archive.org, ein gemeinnütziges, privates Archiv-Projekt des Informatikers Brewster Kahle, 272 Terabyte Daten von Apple-Servern gerettet, als Mitte 2012 die Webauftritte Hunderttausender Kunden und damit zwölf Jahre Online-Alltagsgeschichte gelöscht wurden.

Deutschland speichert nicht

Während Bibliotheken heute Magazine, Zeitungen und auch E-Paper-Ausgaben archivieren, gibt es nach wie vor keine Langzeitarchivierung des World Wide Web. Die Wirtschaft hat in Deutschland 2008 erfolgreich gegen die Pflicht für Unternehmen lobbyiert, Online-Inhalte bei der Deutschen Nationalbibliothek abzuliefern.

Die Deutsche Nationalbibliothek hat zwar einen entsprechenden "erweiterten Sammelauftrag". Auf der Website der DNB heißt es allerdings auch heute noch: "Derzeit werden Webseiten aller Art, z.B. statische und dynamische HTML-Seiten, Weblogs oder Foren, noch nicht gesammelt." Die Nationalbibliothek erarbeite derzeit "die organisatorischen und technischen Grundlagen" zum "automatisierten Einsammeln von Websites". Die langsamen Fortschritte bei der Online-Archivierung überraschen nicht - deutsche Bibliotheken haben nicht einmal genug Geld, um ihre Papierarchive vor Säurefraß zu schützen, von Digitalisierung ganz zu schweigen.

Der Autor auf Facebook

Diesen Artikel...
Forum - Diskutieren Sie über diesen Artikel
insgesamt 22 Beiträge
Alle Kommentare öffnen
    Seite 1    
1. Die Historiker ...
noalk 22.09.2012
... werden es verkraften (müssen). Wird deswegen die Welt untergehen? Vor 20 Jahren hätte es das, was jetzt aus dem WWW verschwunden ist, erst gar nicht gegeben. Für die armen Historiker wird es eine Erleichterung darstellen, denn sie müssen in 30 Jahren nicht zig Millionen vermeintliche Quellen durchstöbern, um das Geschehene aufzuarbeiten. Man stelle sich vor, wenn es zu Zeiten der Wirkung des Größten Arschlochs Aller Zeiten das WWW gegeben hätte! Die Historiker hätten jetzt kaum was zum Forschen. Dafür wäre 500 (?)Millionen Menschen wahrscheinlich unsägliches Leid erspart geblieben.
2. Puh
Europa! 22.09.2012
Zitat von sysopDas Internet vergisst nie? Von wegen. Das Web ist ein extrem flüchtiges Medium - binnen zweieinhalb Jahren ist ein Viertel der wichtigen Online-Quellen zum Arabischen Frühling, dem Schweinegrippe-Ausbruch und Michael Jacksons Tod wieder verschwunden. http://www.spiegel.de/netzwelt/web/0,1518,856936,00.html
Für die Wissenschaft ist das eine Katastrophe.
3. Im Vergleich zu einer Tageszeitung ..
mopsfidel 22.09.2012
.. oder einem Monatsmagazin sind Internet-Inhalte extrem langlebig. Der Autor schmeißt Tagesaktuelles zusammen in einen Topf mit Wikipedia-Nachschlagewerken. Das Ergebnis der Studie ist übrigens weder spektakulär noch sollte es einen sonderlich überraschen.
4. Linkverkürzer?
Xanadu09 22.09.2012
Interessant wäre jetzt noch, ob wirklich die verlinkten Seiten weg sind, oder die Links in Twitter nicht mehr gehen. Da ja nur Verweise aus 2009 in Twitter untersucht wurden, ist das ja auch ein entscheidender Faktor, da ja fast immer URL Verkürzer wie bit.ly genutzt werden.
5. danke
seikor 22.09.2012
danke für diese bahnbrechende und überraschende Erkenntnis: "Die wesentliche Erkenntnis der Untersuchung: Je länger die Ereignisse zurückliegen, desto weniger der in Tweets verlinkten Quellen sind noch abrufbar." Damit wird jeder Internetnutzer doch täglich konfrontiert, wenn er ältere Nachrichten sucht! Die Historiker sind gefragt: sie müssen Konzepte entwickeln, wie die aktuellen zeitgeschichtlichen Ereignisse für die Nachwelt erhalten bleiben.
Alle Kommentare öffnen
    Seite 1    

© SPIEGEL ONLINE 2012
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH




Anzeige
  • Christian Stöcker:
    Spielmacher

    Gespräche mit Pionieren der Gamesbranche.

    Mit Dan Houser ("Grand Theft Auto"), Ken Levine ("Bioshock"), Sid Meier ("Civilization"), Hideo Kojima ("Metal Gear Solid") u.v.a.

    SPIEGEL E-Book; 2,69 Euro.

  • Bei Amazon kaufen.
Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: