Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Datenlese

Making-of Expedition auf den Datenberg

 |

Dieses Projekt war schon fast tot, bevor es richtig begann. Am Anfang sollte es nämlich "Städte 1900" heißen und die Bevölkerungsentwicklung der größten 100 Städte in Deutschland seit 1900 zeigen. Doch das ging nicht. Am Ende wurde etwas viel Schöneres daraus.

Es begann mit einer Überraschung: Bei unseren ersten Schritten im Datenlese-Team mussten wir feststellen, dass die Städtedaten gar nicht digital vorliegen. Sondern gefangen in alten Büchern mit vielen, vielen Tabellen. Die zeigte uns eine freundliche Mitarbeiterin im Statistikamt Nord - praktischerweise neben dem SPIEGEL-Gebäude in Hamburg gelegen und für Regionaldaten ganz Deutschlands zuständig.

Die Tabellen hätten wir für unsere Auswertung scannen und von Hand korrigieren müssen, 113 Seiten mit jeweils 100 Zahlen, also über 10.000 Daten: nicht besonders verlockend. Das nächste Problem: Das explosionsartige Wachstum der deutschen Städte im 20. Jahrhundert beruhte auch auf zahlreichen Eingemeindungen. Wir hätten also verschiedene Raumbezüge berücksichtigen müssen, aber wie?

Und die dritte Schwierigkeit: Eigentlich wollten wir die Daten nach dem Vorbild eines Datenjournalismus-Klassikers präsentieren - Hans Roslings Animation zur Entwicklung der Bevölkerung in 200 Staaten über 200 Jahre. Dabei betrachtete Rosling Lebenserwartung, Einkommen und Bevölkerungsgröße. Wir hingegen wollten uns auf die Bevölkerungsentwicklung beschränken. Roslings Darstellung war da gar nicht so passend. Also was tun?

Datenbasis aus Rostock

Beim Weiterrecherchieren sind wir auf Sebastian Klüsener vom Rostocker Max-Planck-Institut für demografische Forschung gestoßen. Der hatte gerade eine aufwändige Studie erstellt zur Bevölkerungsentwicklung in Deutschland seit 1855 - allerdings nicht zu Städten, sondern flächendeckend zu den rund 400 Landkreisen und kreisfreien Städten.

Allerdings bestand die Bundesrepublik mit ihren heutigen Außengrenzen und der Gliederung in Landkreise und Bundesländer im 19. Jahrhundert noch nicht. Ein deutscher, halbwegs einheitlicher Staat wurde ja erst 1871 gegründet. Und auch seitdem wurden Verwaltungsgrenzen immer wieder neu gezogen.

Also musste Klüsener alle Daten in einem komplizierten Verfahren auf die Kreisgrenzen von 2008 umrechnen. Erst dadurch ist es möglich, die Entwicklung im heutigen Ostdeutschland über lange Zeit präzise zu verfolgen und so neue Erkenntnisse zu gewinnen.

Vom Glück der Raumordnungsregionen

Brauchbare Daten hatten wir damit - aber noch keine Idee, wie wir sie präsentieren könnten. Roslings Blasensuppe war auch für die Regionaldaten ungeeignet. Beim gemeinsamen Überlegen im Datenlese-Team blieben wir schließlich bei sogenannten "isodemografischen Karten" hängen. Auf ihnen werden Flächen nicht gemäß ihrer geografischen Größe dargestellt, sondern gemäß ihrer Einwohnerzahl.

Die Umrisse ähneln zwar noch den bekannten Gebieten, was allerdings nur der Orientierung dient, denn die Ursprungsfläche spielt für die Darstellung keine Rolle mehr: Gebiete, in denen viele Menschen leben, nehmen auch viel Platz ein, Gebiete mit wenigen Menschen verschwinden fast. Mathematisch präzise ist diese Verzerrung nicht, sie macht aber die Bevölkerungsverteilung sehr anschaulich.

Beim Herumprobieren mit ersten Animationen tauchte das nächste Problem auf: Geräte wie das erste iPad würden nicht in der Lage sein, die Verzerrung für die 400 Flächen in akzeptabler Zeit zu berechnen. Nach jedem Klick 10 Sekunden warten - inakzeptabel. Die 16 Bundesländer als Grundlage zu nehmen hätte aber zu viele Trends unsichtbar gemacht.

Zum Glück gibt es zwischen Kreisen und Ländern noch eine Ebene in Deutschland, auf die wir ausweichen konnten: die sogenannten Raumordnungsregionen. Es handelt sich um Gebiete, die Behörden zur Raumplanung verwenden. Sie beinhalten jeweils ein ökonomisches Zentrum und dessen Umland. Nur bei den Stadtstaaten sind die Regionen mit den Landesgrenzen identisch. Von ihnen gibt es 96. Auch die Prognose der Bevölkerungsentwicklung bis 2030 ließ sich mit geringem Aufwand einbauen, denn die Daten lagen ebenfalls für Raumordnungsregionen vor. Berechnet wurden sie vom Bundesinstitut für Bau-, Stadt- und Raumforschung (BBSR).

Die Kernaussage von Klüseners Arbeit, dass nämlich Ostdeutschland schon vor 1900 begann, im Vergleich zu anderen Großregionen zurückzufallen, haben wir schließlich mit einer weiteren Darstellung verdeutlicht: der Berechnung nur eines einzigen Bevölkerungsschwerpunkts für ganz Deutschland.

Berge von Zahlen, kondensiert in einem Punkt

Dieser Punkt ist so etwas wie die Mitte Deutschlands, an der die Menschen "zerren". Der Effekt ist, dass sich der Mittelpunkt ein wenig in die Richtung verschiebt, in der die meisten Menschen wohnen. Durch den Vergleich von Bevölkerungsschwerpunkten in verschiedenen Jahren lässt sich so auf einen Blick sehen, wie sich die Bevölkerung in Deutschland verlagert.

Zur Berechnung haben wir zunächst näherungsweise den Mittelpunkt jeder der 96 Raumordnungsregionen bestimmt, indem wir ein Rechteck um jede Region gelegt und den Mittelpunkt dieses Rechtecks in Längen- und Breitengraden errechnet haben. Diese Grade sind die sphärischen Koordinaten von Punkten auf der Erdoberfläche. Wir haben sie in dreidimensionale kartesische Koordinaten umgerechnet und konnten dann den gemeinsamen Mittelpunkt der 96 Raumordnungsregionen einfach durch Vektoraddition bestimmen.

Die Gewichtung durch die Bevölkerungsanteile haben wir berücksichtigt, indem wir die Länge der Vektoren proportional zur Bevölkerungszahl der Regionen verändert haben. Das Ergebnis ist ein einziger Vektor, zunächst ebenfalls mit dreidimensionalen kartesischen Koordinaten - woraus sich nach Rückrechnung auf sphärische Koordinaten ein Punkt in der Mitte Deutschlands ergibt: der Bevölkerungsschwerpunkt.

Die Wanderung dieses Schwerpunkts zeigt die Quintessenz aus den Daten: Die Bevölkerung Deutschlands hat schon vor 1900 angefangen, sich nach Westen zu verlagern - während sie sich gleichzeitig zunächst von Süden nach Norden verschoben und seit dem Zweiten Weltkrieg die umgekehrte Richtung eingeschlagen hat. Den Excel-Tabellen mit den Zahlen sieht man das nicht an: ein Paradebeispiel dafür, wie eine Visualisierung Entwicklungen auf einen Blick deutlich machen kann, die in Bergen von Zahlen versteckt sind.

Animation: Bevölkerungsmittelpunkt

Hintergrund: Die Berechnung der Einwohnerdaten

Soweit verfügbar, beruhen die Einwohnerdaten auf Rückrechnungen seitens der Statistischen Landesämter (auf Basis der Grenzen der Raumordnungsregionen von 2010). Da für einzelne Bundesländer diese Daten für bestimmte Jahre nicht verfügbar waren, wurden die fehlenden Werte durch Schätzungen ermittelt (unter Verwendung von zeitlichen und räumlichen Interpolierungsverfahren). Dabei dienten u.a. veröffentlichte Daten für die in dem Jahr existierenden Kreise und deren Grenzen als Grundlage. Die Verwendung unterschiedlicher Verfahren kann dazu führen, dass für einzelne Jahre die Gesamtbevölkerung der Bundesrepublik Deutschland leicht von den offiziell berichteten Zahlen abweicht.

Für die Zeit der deutschen Teilung wurden für Ost- und Westdeutschland jeweils die Volkszählungsergebnisse verwendet, wobei es teilweise zu leichten Abweichungen bei den Volkszählungsjahren kommt. So gibt z.B. der Zeitschnitt 1961 Daten der westdeutschen Volkszählung im Jahr 1961 und der ostdeutschen Volkszählung im Jahr 1964 wieder. Eine dokumentierte Datendatei kann bei der Pressestelle des Max-Planck-Instituts für demografische Forschung unter folgender Adresse angefordert werden: presse@demogr.mpg.de (Betreffzeile: Bevölkerungsdaten 1855-2012).

Diesen Artikel...

© SPIEGEL ONLINE 2014
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH




Ein Jahr in seinen Einzelteilen

Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: