Datenlese

Populärste Aufrufe So hat die Hitzewelle Wikipedia erwischt

Hitzewelle in Berlin: Wikipedia als Gradmesser für "Breaking News" Zur Großansicht
Getty Images

Hitzewelle in Berlin: Wikipedia als Gradmesser für "Breaking News"

Die interne Statistik von Wikipedia verrät, was gerade besonders viele Menschen interessiert. Wir haben nachgesehen: Unter den Aufsteigern dieser Woche ist natürlich die Hitzewelle - aber auch der Eintrag zur Bananenschale.

Donnerstag, 16. Mai 2013, 15:57 Uhr: Die Nachrichtenagentur Reuters verschickt an ihre zahlenden Kunden eine einzeilige Eilmeldung: David Beckham wird seine Karriere als Fußballer am Ende der Saison beenden. Zwanzig Minuten später steht ein Artikel auf SPIEGEL ONLINE.

Noch schneller war der "Wikipedia Live Monitor" von Thomas Steiner. Der Google-Mitarbeiter aus Hamburg hat mit Unterstützung der Europäischen Kommission eine Open-Source-Software entwickelt, die verschiedene Sprachversionen des Mitmach-Lexikons Wikipedia beobachtet. Die Artikel, die plötzlich in mehreren Wikipedia-Versionen gleichzeitig geändert werden, vermeldet sein Tool als "Breaking News Candidate". Und der Artikel "David Beckham" verändert sich am 16. Mai um kurz nach vier plötzlich in der englischen und italienischen, in der französischen und hebräischen, in der russischen und deutschen und in einigen weiteren Wikipedia-Versionen.

Steiner macht sich den globalen Erfolg des Online-Lexikons zunutze. Beim Start 2001 wurde das Projekt noch belächelt. Seitdem hat sich das von vielen Freiwilligen aktuell gehaltene Nachschlagewerk etabliert - und das finden immer mehr Forscher interessant. Anfang Mai beispielsweise haben Wissenschaftler eine Arbeit veröffentlicht, die den Zusammenhang zwischen vermehrten Aufrufen bestimmter Wikipedia-Artikel und Veränderungen bei Börsenkursen untersucht. Ergebnis: Offenbar informieren sich Börsenspekulanten gerne bei Wikipedia, bevor sie entscheiden, ob sie bestimmte Aktien kaufen oder verkaufen.

Eine demnächst erscheinende Arbeit ungarischer Physiker und Informatiker beschäftigt sich mit der Frage, ob sich der Kassenerfolg von Kinofilmen anhand von Wikipedia-Nutzungsdaten vorhersagen lässt. Fazit: Es geht.

Zugänge zur internen Wikipedia-Statistik

Die Nutzungsdaten der kollektiv geschriebenen Enzyklopädie sind ein Schatz. Und im Vergleich zu den Datenschätzen von Google, Facebook oder Amazon, die von den Firmen eifersüchtig gehütet werden, haben die Wikipedia-Daten einen Vorteil: Sie lassen sich einfach herunterladen.

Welche Artikel zuletzt geändert wurden, lässt sich diesem RSS-Feed entnehmen (Feed für die deutsche Wikipedia) - das sind die Daten, auf die sich das Tool von Thomas Steiner stützt. Welche Artikel wie oft aufgerufen wurden, wird für alle Wikipedia-Versionen stündlich zentral erhoben, die Auswertung ist hier abrufbar.

Letztere Daten nutzen wir in der SPIEGEL-Dokumentation für unsere eigene Wikipedia-Analyse. Unser Tool erfasst, welche Artikel in den vergangenen Tagen überhaupt aufgerufen wurden. Daraus berechnet es die durchschnittlichen Aufrufe pro Tag und meldet uns schließlich die Artikel, bei denen die Aufrufe im Vergleich zum Durchschnitt zuletzt deutlich angestiegen sind.

Im Gegensatz zur Software von Thomas Steiner funktioniert unsere Analyse also nur rückblickend. Doch im Unterschied zu einfachen Statistiken, welche Artikel am häufigsten aufgerufen oder bearbeitet wurden, kann unsere Software abbilden, bei welchen Themen das Interesse in den letzten Tagen ungewöhnlich gewachsen ist. Durch eine entsprechende Wahl der Parameter und adaptive Gradientenanpassung lassen sich dabei sowohl kurz- als auch längerfristige Trends aufspüren.

Die Aufsteiger dieser Woche

Hitzewelle: Mehr als nachvollziehbar sind zwei plötzliche Wikipedia-Magneten: die Beiträge Temperaturextrema und Klimaanlage. Je heißer es in Deutschland wurde, desto mehr Menschen interessierten sich offenbar für langjährige Rekorde und Methoden der Abkühlung.

Hitzewelle auf der Wikipedia: Abkühlung interessierte sehr viele Menschen in Deutschland Zur Großansicht

Hitzewelle auf der Wikipedia: Abkühlung interessierte sehr viele Menschen in Deutschland

Massenproteste: Auch das weltweite Nachrichtengeschehen spiegelt sich auf Wikipedia wider. Seit einigen Tagen existiert ein Eintrag zu den Protesten in Brasilien, der direkt von Tausenden Lesern aufgerufen wurde.

Nachrufe: Traurige Anlässe sorgen regelmäßig für plötzlich steigende Zugriffe. So wurden in der vergangenen Woche der Tod von Schauspieler James Gandolfini, des tschechischen Musikers Filip Topol und des US-Autors Vince Flynn vermeldet, was offenbar schlagartig ein großes Bedürfnis nach hintergründigen Informationen auslöste. Ebenfalls in diese Kategorie fällt die Pleite des Baukonzerns Alpine.

TV-Gesichter: Neben den Inhalten der Nachrichtensendungen lassen sich auch zu deren Moderatoren Einträge auf Wikipedia finden. Hannelore Fischer zum Beispiel präsentiert regelmäßig das ARD-Mittagsmagazin. Und wann immer sie das tut, lesen wieder Hunderte Menschen den recht kurzen Wikipedia-Artikel über sie.

Voll Banane? Warum ausgerechnet die Wikipedia-Seite zur Bananenschale plötzlich so häufig aufgerufen wurde, erschien zunächst völlig mysteriös. Zwar kamen Bananenrepubliken mehrfach in den Nachrichten vor, aber das allein kann nicht für 38.000 Aufrufe an einem Tag gesorgt haben. Des Rätsels Lösung: Auf der Wikipedia-Startseite wurde der Eintrag in der Rubrik "Schon gewusst?" empfohlen, mit dem folgenden, offenbar ziemlich erfolgreichen Köder:

"Jährlich fallen mehr als 20 Millionen Tonnen Bananenschalen an - mit großem Potential für die Reinigung von Abwässern und die Heilung von Arteriosklerose."

So viel zur vergangenen Woche. Wir sind schon gespannt auf die nächste Wikipedia-Datenlese - und werden dann noch tiefer in die Datenanalyse einsteigen.

Diesen Artikel...
9 Leserkommentare Diskutieren Sie mit!
Leon 22.06.2013
derdichter 22.06.2013
Jondo 22.06.2013
Jondo 22.06.2013
blubb321 22.06.2013
SisterOfNight 22.06.2013
iffel1 22.06.2013
Ponce 23.06.2013
jungletiger9 24.06.2013
News verfolgen

HilfeLassen Sie sich mit kostenlosen Diensten auf dem Laufenden halten:

alles aus der Rubrik Netzwelt
Twitter | RSS
alles aus der Rubrik Web
RSS
alles zum Thema Datenlese
RSS

© SPIEGEL ONLINE 2013
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH



Datenlese schafft neue Zusammenhänge in Wissenschaft und Politik. Wir bergen Datenschätze der digitalen Welt und erzählen ihre Geschichten - ein Experiment.

Hier bloggen Christina Elmer, Bertolt Hunger, Kurt Jansson, Nicola Kuhrt, Friedrich Lindenberg und Maximilian Schäfer.


Mehr zum Thema Daten

Datenjournalist.de stellt Datenjournalismus aus Deutschland vor.

GovData.de ist das gemeinsame Datenportal von Bund und Ländern. Es befindet sich noch im Aufbau.

DataWrapper ist ein einfaches Werkzeug zum Erstellen von attraktiven Web-Grafiken.

datavisualization.ch sammelt die schönsten Visualisierungen des Webs und beleuchtet deren Entstehung.

World Bank Data Viz verweist auf spannende Analysen aus dem Bereich der Entwicklungspolitik.


Anzeige
  • Christian Stöcker:
    Spielmacher

    Gespräche mit Pionieren der Gamesbranche.

    Mit Dan Houser ("Grand Theft Auto"), Ken Levine ("Bioshock"), Sid Meier ("Civilization"), Hideo Kojima ("Metal Gear Solid") u.v.a.

    SPIEGEL E-Book; 2,69 Euro.

  • Einfach und bequem: Direkt bei Amazon kaufen.