Datenlese Zensusstatistik für alle

Messbare Differenzen: Große Gemeinden müssen nach dem Zensus stärkere Verluste in ihren Einwohnerzahlen verkraften (Beispiel Niedersachsen)

Messbare Differenzen: Große Gemeinden müssen nach dem Zensus stärkere Verluste in ihren Einwohnerzahlen verkraften (Beispiel Niedersachsen)

Foto: Björn Schwentker

Die letzte Volkszählung könnte verfassungswidrig gewesen sein, weil große Gemeinden gegenüber kleinen benachteiligt wurden. Das belegen statistische Berechnungen mit Daten für Niedersachsen und Rheinland-Pfalz, die SPIEGEL ONLINE exklusiv vorliegen. Wir veröffentlichen Daten und Rechnungen hier im Detail.

Der Zensus 2011 hat offenbar großen Gemeinden mit mehr als 10.000 Einwohnern systematisch mehr Bürger abgezogen als kleineren Kommunen. In den großen Gemeinden wurde nur eine Stichprobe von durchschnittlich zehn Prozent der Bewohner befragt und die Einwohnerzahl dann hochgerechnet. In den Kommunen mit weniger als 10.000 Bewohnern gab es keine Stichprobe. Unstimmigkeiten wie Hinweise auf Karteileichen wurden hier einzeln durch Hausbesuche geklärt. Wo es eine Hochrechnung gab, sank die Einwohnerzahl im Mittel stärker - es gibt also eine Ungleichbehandlung, die sich nur aus der gewählten Zensusmethode ergibt.

Kommt die Zählung deswegen vor das Bundesverfassungsgericht, könnte dies das Aus für den Zensus der Bauart 2011 bedeuten, da das Grundgesetz Gleichbehandlung vorschreibt. Die Frage ist allerdings, ob sich vor Gericht beweisen lässt, dass der Zensus dagegen verstößt. Denn die amtliche Statistik, die für den Zensus verantwortlich ist, gibt die nötigen Bevölkerungszahlen nicht heraus, mit denen sich die Abweichungen für große und kleine Gemeinden berechnen und gegenüberstellen ließen. Außerdem glaubt man im Statistischen Bundesamt, die Ungleichheit würde sich in Luft auflösen, wenn man harte statistische Kriterien anlegt.

Deswegen schaffen wir an dieser Stelle Transparenz: Wir veröffentlichen hier die zurückgehaltenen Daten  aus den kommunalen Melderegistern für Niedersachsen und Rheinland-Pfalz und belegen mit statistischen Berechnungen, dass große und kleine Gemeinden dort tatsächlich ungleich behandelt wurden. Wir veröffentlichen dazu den kompletten, ausführlich kommentierten Quellcode  unseres statistischen Programms, das jeder herunterladen und mit der freien Statistiksoftware R  selbst ausführen kann. Es erzeugt Grafiken, Tabellen und eine Übersicht statistischer Indizien, die wir hier beschreiben.

Wir haben uns bei unserem statistischen Modell von einem unabhängigen Wissenschaftler beraten lassen. Der Statistikprofessor Helmut Küchenhoff  vom Statistischen Beratungslabor der Ludwigs-Maximilians-Universität München half uns, adäquate Methoden zu wählen und sie richtig anzuwenden. Er bestätigt, dass es gelungen ist, einen systematischen Unterschied der prozentualen Zensusabweichungen von den Melderegistern zwischen Gemeinden mit und ohne Stichprobe nachzuweisen.

Wie groß ist die Ungleichheit?

Der stärkste Beleg für die Ungleichbehandlung kommt aus dem statistischen Modell von SPIEGEL ONLINE, einem sogenannten Regressionsmodell. Für alle Gemeinden von Niedersachsen und Rheinland-Pfalz zusammen bleibt das Zensusergebnis einer großen Kommune im statistischen Modell um 1,5 Prozentpunkte mehr hinter der Einwohnerzahl im kommunalen Melderegister zurück als in einer kleinen Gemeinde. Für den Datensatz der beiden Bundesländer, in dem zusammen 30 Prozent aller deutschen Gemeinden liegen, ist dieses Ergebnis höchst signifikant. Um Ausreißereffekte bei besonders kleinen und großen Gemeinden auszublenden, haben wir unser Programm nur für Kommunen mit 5000 bis 20.000 Einwohnern laufen lassen. Dadurch ist die Güte der Analyse hoch. Mit 95-prozentiger Sicherheit liegt der Methodensprung zwischen einem und 1,9 Prozentpunkten.

Wie hat SPIEGEL ONLINE gerechnet?

Wir haben die Einwohnerzahlen aller Gemeinden aus Niedersachsen und Rheinland-Pfalz in ein lineares Regressionsmodell  gesteckt. Es berechnet, wie stark der Zusammenhang zwischen der Erhebungsmethode beim Zensus (Stichprobe oder nicht) und der prozentualen Abweichung der Zensusergebnisses vom Melderegisterwert ist. Das Ergebnis gilt nicht für einzelne Gemeinden, sondern ist eine Art Mittelwert, der für alle Gemeinden am besten stimmt. ("Beta-Wert")

Gleichzeitig gibt das Modell Qualitätswerte aus, die besagen, ob der Zusammenhang zwischen Methode (Stichprobe oder nicht) und Zensusabweichung überhaupt existiert. (Zum Beispiel "Signifikanzniveau" und "Konfidenzintervall").

Das Modell versucht die Zensusabweichungen nicht nur durch die Zensusmethode zu erklären (sogenannte Methodenvariable im Modell), sondern zusätzlich durch die Größe der Gemeinde anhand deren Einwohnerzahl im Melderegister. Diese "Kontrollvariable" stellt sicher, dass der Effekt nicht dem Methodenwechsel zugeschlagen wird, obwohl er tatsächlich damit zusammenhängt, wie groß eine Stadt ist. Wäre dem so, würde das Modell einen großen (Beta-)Wert für die Kontrollvariable "Bevölkerungsgröße" ergeben, aber nur einen kleinen (oder null) für die Methodenvariable.

Außerdem bewertet das Modell seine eigene Aussagekraft: Das "Bestimmtheitsmaß R²" sagt aus, ob alle Variablen des Modells zusammen die Zensusabweichungen gut erklären können, oder ob ein zu großer unerklärter Rest bleibt.

Um zu testen, ob wir nicht den falschen statistischen Modell-Typ verwendet haben, machten wir dieselbe Analyse auch mit einem weiteren Typ Modell, der sogenannten Poisson-Regression. Sie ist besonders geeignet für Zähldaten wie die des Zensus. Die Poisson-Regression ergab in jedem Fall sehr ähnliche Resultate wie unser anderes Modell.

Ungleichbehandlung der Gemeinden

Auch in jedem der einzelnen Bundesländer lässt sich eine Ungleichbehandlung der Gemeinden nachweisen. Dazu braucht man erst einmal gar kein statistisches Programm. Man sieht es mit bloßem Auge.

Niedersachsen: Abweichung Zensus vs. Melderegister

Foto: Björn Schwentker

Die Grafik, in der jeder Punkt eine niedersächsische Gemeinde ist, zeigt, dass die Einwohnerzahlen des Zensus für die kleinen Kommunen mal über und mal unter dem Wert des eigenen Melderegisters liegen. Im arithmetischen Mittel landet der Zensus nur knapp unter dem Register: Die Abweichung beträgt 0,37 Prozent. Für die großen Gemeinden ist sie mit 1,77 Prozent viel größer. Im Durchschnitt bleibt das Zensusergebnis einer großen Gemeinde in Niedersachsen also um 1,4 Prozentpunkte mehr hinter der Einwohnerzahl im kommunalen Melderegister zurück als in einer kleinen Gemeinde.

Demnach hätte zum Beispiel die Stadt Hannover nicht mehr als 6000 Bürger gegenüber ihrem Register verloren, sondern gut 1000 gewonnen, wenn sie methodisch so behandelt worden wäre wie eine kleine Gemeinde. Allerdings gilt die Ungleichbehandlung von 1,4 Prozentpunkten nur im Mittel. Die Abweichungen der Kommunen schwanken individuell. Außerdem schwanken die Zensusergebnisse der großen Gemeinden nicht mehr zufällig um die Melderegister, sondern sie liegen fast immer darunter. Die Ergebnisse auf beiden Seiten der Zehntausendergrenze sind also systematisch verschieden.

Auch das statistische Modell von SPIEGEL ONLINE ergibt für Niedersachsen einen Sprung der Zensusabweichungen bei 10.000 Einwohnern. Für eine Gemeinde mit Stichprobe liegt das Zensusergebnis um 1,63 Prozentpunkte mehr unter der Melderegisterzahl als für Gemeinden ohne Hochrechnung. Diese Ergebnisse für Niedersachsen sind ebenfalls statistisch höchst signifikant, die Güte der Analyse ist hoch.

Auch in Rheinland-Pfalz gibt es einen eindeutigen Methodensprung: Gemeinden mit Stichprobe bekamen im Durchschnitt einen Prozentpunkte mehr vom Registerwert abgezogen als Kommunen ohne Hochrechnung.

Rheinland Pfalz: Abweichung Zensus vs. Melderegister

Foto: Björn Schwentker

Das statistische Modell ergibt für rheinland-pfälzische Kommunen zwischen 5000 und 20.000 Einwohner, dass das Zensusergebnis einer Gemeinde mit Stichprobe um 0,7 Prozentpunkte mehr unter der Melderegisterzahl liegt als für Gemeinden ohne Hochrechnung. Die Güte der Analyse ist auch für Rheinland-Pfalz hoch, allerdings ist das Ergebnis für den Methodensprung knapp nicht mehr statistisch signifikant. Allerdings besagt das Modell auch, dass es einen Methodensprung mit großer Wahrscheinlichkeit gibt und dass er sogar bei bis zu 1,5 Prozentpunkten liegen könnte.

SPIEGEL ONLINE liegen die Melderegisterzahlen aller Gemeinden aus Niedersachsen und Rheinland-Pfalz zum Zeitpunkt des Zensus im Jahr 2011 vor. Sie sind für die Bewertung der Zensusmethoden entscheidend, weil die gesamte Zählung vor allem auf diesen Bevölkerungszahlen aus den kommunalen Melderegistern basiert. Sie sind der wichtigste Daten-Input, der ganz am Anfang der Zensusberechnungen stand.

Um so erstaunlicher, dass die statistischen Ämter sich weigern, diese Daten herauszugeben, oder sogar behaupten, sie seien alle gelöscht worden. Zumindest für Niedersachsen gibt es sie offensichtlich. Denn die uns zugespielten Daten stammen eindeutig aus dem niedersächsischen Landesamt. Unsere rheinland-pfälzischen Daten kommen nicht aus dem dortigen Landesamt, sondern dem zentralen kommunalen Melderegister, einer Besonderheit der Pfälzer. Die Zentraldatei wird von allen Gemeinden gemeinsam geführt und sie gaben uns ihre Einwohnerzahlen sofort.

Städtestatistiker aus Magdeburg hatten schon vor SPIEGEL ONLINE eine sehr ähnliche Analyse der Zensusmethode  gemacht und veröffentlicht. Sie kommen für jedes einzelne Bundesland zum selben Ergebnis wie wir: dass Gemeinden mit Stichprobe mehr Einwohner abgezogen bekamen. Allerdings hatten die Magdeburger keine Registerdaten und verglichen die Zensusergebnisse der Kommunen stattdessen mit der alten amtlichen Einwohnerzahl (der sogenannten Fortschreibung), die vor dem Zensus galt.

Sobald die erste Version dieser Studie erschienen war, hatte das Statistische Bundesamt daran kritisiert , dass die Fortschreibung, die nicht in den Gemeinden, sondern in den Statistischen Landesämtern geführt wird, durch viele Effekte verzerrt sein kann. Sie spielt außerdem im Zensus keinerlei Rolle. Deshalb sei sie auch nicht für den Methodenvergleich geeignet. Diesem Einwand entgeht das SPIEGEL-ONLINE-Modell, das die echten Melderegisterdaten nutzt.

Was ist die Ursache für die Unterschiede?

Durch unser statistisches Modell lässt sich nur herausfinden, dass es eine Ungleichbehandlung durch die Stichprobe gibt, wie groß sie ist, und wie gut unser Modell das überhaupt beweisen kann. Die Methoden selbst analysiert das Programm nicht. Es kann auch nicht entscheiden, ob eine Methode besser ist als die andere. Es könnte also sein, dass die Hochrechnung aus der Stichprobe recht nah an der Wahrheit liegt und die kleinen Gemeinden zu hohe Zensusergebnisse haben, also übervorteilt werden. Dann wäre nicht die Stichprobe zu kritisieren, sondern das Verfahren in den kleinen Gemeinden, wo Unstimmigkeiten im Einzelfall durch Nachfragen geklärt wurden.

Außerhalb unserer statistischen Analyse kann es natürlich allerlei Argumente dafür geben, dass es eher die Stichprobe war, die daneben lag.

Warum sind wir uns so sicher, dass es die Ungleichheit gibt?

Der größte Fehler unseres statistischen Modells wäre, wenn es einen viel wichtigeren Grund für die unterschiedlichen Zensusergebnisse kleiner und großer Gemeinden gibt als die Stichprobe, den wir mit dem Modell aber nicht erfasst haben. Der wichtigste dieser Gründe wäre die Größe der Gemeinde selbst: Es könnte ja ein, dass große Städte ihre Register wegen der Masse der gemeldeten Menschen tatsächlich anders führen als kleine Gemeinden, und der Zensus deshalb dort etwas anderes ergab. Und es könnte sein, dass es Stadt-Land-Unterschiede gibt, die zufällig ebenfalls ab ungefähr 10.000 Einwohnern auftreten.

Doch diese Fälle schließen wir in unserem Modell aus (ebenso wie die Magdeburger Studie für ganz Deutschland): Wir haben es gleich so gebaut, dass es nicht nur untersuchen soll, wie stark der Einfluss einer Stichprobe auf das Zensusergebnis ist. Gleichzeitig soll es den konkurrierenden Einfluss der Einwohnergröße berechnen. Resultat: Sowohl für Niedersachsen als auch für Rheinland-Pfalz ergibt sich ein starker Effekt für die Zensusmethode (Stichprobe oder nicht) und keiner oder nur ein winziger für die Einwohnergröße.

Wir wollten uns aber noch sicherer sein und auch verhindern, dass wir von vornherein den falschen Modelltyp gewählt haben. Denn unsere Regression gilt nur für lineare, also geradlinige Zusammenhänge. Was aber, wenn es tatsächlich einen sehr kurvigen Zusammenhang zwischen Einwohnergröße und Zensusabweichung gibt, der je nach Größenordnung mal auf-, mal abschwillt?

Auch dafür ist unser lineares Modell geeignet, wenn man nur Gemeinden in die Rechnung einbezieht, deren Größe sich wenig unterscheidet. Denn jeder kurvige Zusammenhang wird auf kleinen Skalen so gut wie linear, und das Modell stimmt wieder. Wir haben unser Programm darum nicht nur für alle Gemeinden in den beiden Bundesländern laufen lassen, sondern auch für kleinere Gruppen von Kommunen, die etwa gleich groß waren. Selbst als wir für Niedersachsen nur noch 44 Gemeinden von 9000 bis 11.000 Einwohner in unser Programm einspeisten, blieb das Ergebnis, wie es war: Die Stichprobe führt signifikant zur Ungleichbehandlung der Gemeinden, die Einwohnergröße ist egal. Gleichzeitig wurden die Qualitätswerte des Modells besonders gut. Das heißt: Wir haben den Effekt eingekreist. Eine andere Interpretation ist kaum noch möglich.

Für Rheinland-Pfalz lässt sich das statistische Modell nicht mehr anwenden, wenn man nur Gemeinden um die Zehntausendergrenze herum wählt. Es gibt zwar mehr als 2000 Gemeinden in Rheinland-Pfalz, aber die meisten sind sehr klein. Nur 13 Kommunen haben zwischen 9000 und 11.000 Bürger. Das ist zu wenig für eine multivariate Analyse.

Das bedeutet aber nicht, dass es keine Ungleichbehandlung kleiner und großer Gemeinden in Rheinland-Pfalz gibt. Man entdeckt sie auch ohne statistisches Programm, wenn man die durchschnittlichen Abweichungen des Zensusergebnisses von den Registerwerten für Gemeinden in verschiedenen Größenklassen vergleicht: Bei 10.000 Einwohnern sinken die Mittelwerte beträchtlich.

Gibt es die Ungleichbehandlung in ganz Deutschland?

Mit unseren Daten können wir nur zeigen, dass es eine Ungleichheit in Niedersachsen und Rheinland-Pfalz gibt. Dass unsere Ergebnisse gut mit denen der deutschlandweiten Magdeburger Studie übereinstimmen, könnte aber bedeuten, dass deren Berechnungen für alle Bundesländer richtig sind. Dass die Studie keine Registerdaten verwendet, sondern die alten amtlichen Einwohnerzahlen, scheint also kein Problem zu sein - anders als das Statistische Bundesamt behauptet. Dennoch: Genau wissen wir das erst, wenn die statistischen Ämter auch die Registerzahlen für andere Bundesländer zur Verfügung stellen. Recherchen von SPIEGEL ONLINE lassen vermuten, dass es sie noch in einigen Ländern gibt - wenn nicht sogar in allen. Mit ihnen könnten sich die Ämter im eigenen Interesse an der Aufklärungsarbeit über den Zensus beteiligen. Um für das nächstes Mal eine bessere Methode entwerfen zu können.

Abweichungen in niedersächsischen Gemeinden nach Größenklasse

Größenklasse (Einwohner) Anzahl Gemeinden Durchschnittliche Abweichung Zensus - Register in %
1.000 247 -0,24
1.000 bis 2.500 321 -0,49
2.500 bis 5.000 125 -0,37
5.000 bis 10.000 126 -0,29
9.000 bis 10.000 23 -0,28
10.000 bis 11.000 21 -2,09
10.000 bis 15.000 85 -1,76
10.000 bis 20.000 116 -1,69
15.000 bis 20.000 31 -1,51
20.000 bis 30.000 39 -1,89
30.000 und mehr 50 -1,84

Abweichungen in rheinland-pfälzischen Gemeinden nach Größenklasse

Größenklasse (Einwohner) Anzahl Gemeinden Durchschnittliche Abweichung Zensus - Register in %
1.000 1611 -0,50
1.000 bis 2.500 435 -0,53
2.500 bis 5.000 133 -0,33
5.000 bis 10.000 82 -0,15
9.000 bis 10.000 5 -0,40
10.000 bis 11.000 8 -1,03
10.000 bis 15.000 12 -1,25
10.000 bis 20.000 24 -1,60
15.000 bis 20.000 12 -1,95
20.000 bis 30.000 6 -2,45
30.000 und mehr 15 -0,98