Daten-FAQ Das Kleingedruckte zur Corona-Statistik

Welche Daten nutzt der SPIEGEL in der Coronakrise? Wie gut beschreiben sie die Ausbreitung des Virus? Antworten auf die häufigsten Fragen.

In der Coronakrise schauen viele auf die Zahlen: Wie viele Menschen sind an Covid-19 schon erkrankt, wie viele gestorben? Wie schnell breitet sich das Virus aus? Zahlen geben uns das Gefühl, die Lage überblicken zu können.

Wir Journalistinnen und Journalisten nutzen sie, um das Infektionsgeschehen zu beschreiben. Sie, unsere Leserinnen und Leser, nutzen sie, um die Situation in der Welt, in Deutschland und bei Ihnen vor Ort einzuschätzen. Und die Politik nutzt die Zahlen, um über die Verschärfung und Lockerung von Maßnahmen zu entscheiden. Maßnahmen, die die Ausbreitung des Coronavirus bremsen und das Gesundheitssystem vor dem Kollaps bewahren sollen – die aber auch tief in unsere Grundrechte und ins Wirtschaftsgeschehen eingreifen.

Wie verlässlich sind also diese Zahlen, auf die nun alle blicken? Seit Beginn der Pandemie erreichen uns viele Fragen zu den Corona-Daten, die der SPIEGEL in seiner Berichterstattung verwendet. Es geht um die Aussagekraft von Messgrößen, um die Methodik hinter bestimmten Rechnungen. An dieser Stelle wollen wir auf die häufigsten und wichtigsten Fragen eingehen.

Woher kommen die Daten in der Corona-Berichterstattung des SPIEGEL?

In Deutschland laufen alle Daten über das Infektionsgeschehen beim Robert Koch-Institut (RKI) zusammen. Fällt in einem Testlabor ein Test auf das Coronavirus Sars-CoV-2 positiv aus, meldet es das an die Gesundheitsbehörde des Landkreises beziehungsweise der Stadt, in der die infizierte Person lebt. Die Behörde vor Ort übermittelt den Fall weiter an die zuständige Landesbehörde und diese wiederum an das RKI.

Das RKI veröffentlicht die Zahl der bestätigten Infektionen und der im Zusammenhang mit Covid-19 aufgetretenen Todesfälle einmal täglich in einem interaktiven Dashboard , aufgeschlüsselt nach Städten und Landkreisen. Diese Daten nutzt auch der SPIEGEL. Neben den absoluten Fallzahlen weist das RKI die Neuinfektionen der vergangenen sieben Tage auch relativ zur Einwohnerzahl aus – dadurch sollen die Zahlen zwischen den Regionen vergleichbar werden. Für diese sogenannte Sieben-Tage-Inzidenz weicht der SPIEGEL von den Angaben des RKI ab und berechnet eigene Werte. Das liegt daran, dass die RKI-Methodik aufgrund von Verzögerungen bei den Meldungen das Infektionsgeschehen in mehreren Regionen systematisch unterschätzt. Dadurch geht die angestrebte Vergleichbarkeit verloren. Lesen Sie hier, wie genau unsere Werte zustande kommen.

Für andere Länder nutzen wir die Infizierten- und Totenzahlen der Johns-Hopkins-Universität  (JHU). Sie trägt diese Daten aus nationalen Quellen zusammen. In bestimmten Fällen passen wir einzelne Werte an:

Verschiedene Effekte können vereinzelt zu scheinbar widersprüchlichen Entwicklungen in den Zeitreihen führen. In bestimmten Fälle korrigieren wir daher händisch einzelne Werte, statt sie eins zu eins von der JHU zu übernehmen:

Wie aussagekräftig sind die Infiziertenzahlen?

Die tatsächliche Zahl der Menschen, die sich mit dem Coronavirus infiziert haben, dürfte deutlich über der offiziell gemeldeten Zahl liegen. Denn manche Infizierte bekommen keine oder nur schwache Symptome. Wer Symptome hat, konsultiert nicht unbedingt einen Arzt – oder nicht sofort. Und selbst wer sich bei einem Verdacht auf das Coronavirus testen lassen möchte, konnte das gerade in den ersten Monaten der Pandemie nicht immer tun.

Forscher gehen wegen dieser Faktoren davon aus, dass die tatsächliche Zahl an Infizierten um ein Vielfaches höher liegt als die Zahl der offiziellen Fälle. Erhebungsmethodik, Testkriterien und die Testkapazität eines Landes beeinflussen die Zahl der bestätigten Infizierten. Ändert ein Land zum Beispiel die Erfassungskriterien, so kann das zu einem Anstieg oder Rückgang der gemeldeten Neuinfektionen führen.

Auch die Testkapazitäten und die Auswahl der zu testenden Personen können Auswirkungen auf die erfassten Neuinfektionen haben. Stehen nur begrenzt Tests zur Verfügung, können unter Umständen nicht alle Verdachtsfälle oder weiteren Kontaktpersonen getestet werden. Gerade Infizierte mit milden Symptomen oder asymptomatischen Krankheitsverläufen werden so übersehen.

Weil sich das Testvolumen im Lauf der Pandemie verändert hat, ist die Entwicklung der offiziellen Infiziertenzahlen eines Landes über Zeit nur eingeschränkt aussagekräftig. Auch die Zahl der durchgeführten Tests und die Positivquote sollten betrachtet werden, die wir unter anderem in diesem Überblick stets aktuell zeigen.

Zwischen Ländern sollten Infiziertenzahlen – auch in Form von Sieben-Tage-Inzidenzen – nicht verglichen werden, weil die Testregime sehr unterschiedlich sein können. Mehr zum Vergleich über Ländergrenzen hinweg finden Sie weiter unten.

Wie aussagekräftig sind die Totenzahlen?

Auch bei der Zahl der Todesfälle gibt es Unschärfen, insbesondere bei der Erfassung der letztendlichen Todesursache von Menschen mit multiplen Vorerkrankungen. Wie zählt man den Fall eines älteren Patienten mit Vorerkrankungen, der einen Schlaganfall erleidet, in die Klinik kommt, und bei dem dort festgestellt wird, dass er ein asymptomatischer Sars-CoV-2-Träger ist?

Da sich in solchen Fällen nicht immer schnell und eindeutig klären lässt, ob die Covid-19-Erkrankung auch die letztendliche Todesursache war, meldet das RKI die Zahl aller Todesfälle von Menschen mit einer nachgewiesenen Sars-CoV-2-Infektion. Die Gesundheitsbehörden sprechen dann von »Todesfällen in Zusammenhang mit Covid-19-Erkrankungen«, was etwas anderes ist, als »Todesfälle durch Covid-19-Erkrankungen«. Unter Umständen kommt es so zu einer Übererfassung der Corona-Todesfälle. Menschen, die an ihrer Vorerkrankung gestorben sind, aber auch mit dem Coronavirus infiziert waren, werden miterfasst.

Zugleich gibt es auch Konstellationen, in denen es zu Untererfassungen kommen kann. Nicht bei jedem Verstorbenen schafft man es, einen Test durchzuführen. Und bei Obduktionen könnte das Virus nicht mehr nachweisbar sein, obwohl der Mensch an der Infektion gestorben ist. Oft zeigt erst die sogenannte Übersterblichkeit das volle Ausmaß der Pandemie. Sie beschreibt, dass die Zahl der gestorbenen Menschen in einem bestimmten Zeitraum höher liegt, als es üblicherweise zu dieser Jahreszeit zu erwarten wäre. Aktuelle Zahlen zur Übersterblichkeit in verschiedenen Ländern finden Sie stets aktuell in diesem Überblick.

Trotz solcher Unsicherheiten sind internationale Vergleiche basierend auf den Todeszahlen wohl verlässlicher als Vergleiche der Infiziertenzahlen. Die dortigen Verzerrungen durch die Dunkelziffer und die unterschiedliche Testpraxis dürften größer sein.

Weniger geeignet ist die Zahl der Toten zur Einschätzung der aktuellen Infektionsdynamik. Denn bei einem tödlichen Verlauf der Krankheit liegen zwischen Infektion und Tod im Mittel rund 18 Tage.

Wie aussagekräftig sind die Hospitalisierungszahlen?

Mit fortschreitender Impfkampagne führen hohe Infektionszahlen nicht mehr im gleichen Maße zu Krankenhausaufnahmen wie zu Beginn der Pandemie. Bei der Frage, anhand welcher Indikatoren über Corona-Maßnahmen entschieden werden soll, verlagerte sich daher der Fokus: weg von den Infektionen, hin zu den Hospitalisierungen.

Bis Juli 2021 wurde zwar ein Großteil der coronabedingten Klinikaufnahmen statistisch erfasst. Doch für rund ein Viertel der bestätigten Infektionen fehlte dem RKI die Angabe darüber, ob die Person im Krankenhaus behandelt wurde oder nicht. Seit Mitte Juli 2021 sind Klinikaufnahmen meldepflichtig und somit annähernd vollständig erfasst. Seit Mitte September gilt die sogenannte Hospitalisierungsinzidenz als Leitindikator in der Pandemiebekämpfung. Gemeint sind die coronabedingten Krankenhausaufnahmen in sieben Tagen je 100.000 Einwohner.

Die vom RKI gemäß Infektionsschutzgesetz veröffentlichte  Hospitalisierungsinzidenz vermittelt allerdings einen falschen Eindruck von der aktuellen Lage: Sie fällt systematisch zu niedrig aus und der ausgewiesene Trend ist irreführend . Denn berücksichtigt werden nur jene Klinikaufnahmen, bei denen die Infektion (!) in den vergangenen sieben Tagen registriert wurde. Zwischen diesem Tag und der Aufnahme im Krankenhaus vergehen aber oft mehrere Tage.

Daher weist das RKI inzwischen auch »adjustierte« Hospitalisierungsinzidenzen aus. Bei ihnen wird berücksichtigt, wie viele zusätzliche Klinikaufnahmen statistisch zu erwarten sind, deren Meldung noch nicht beim RKI eingegangen ist (»Nowcasting«). Der SPIEGEL verwendet in Bundesländervergleichen diese adjustierten Werte, da sie die Situation realistischer abbilden und unter den Ländern besser vergleichbar sind als die ursprünglichen Werte.

Vor der Einführung der adjustierten Werte berechnete der SPIEGEL mit einer alternativen Methode eigene Hospitalisierungsinzidenzen. Sie basierte auf dem Datum, an dem die Information über die Klinikaufnahme beim RKI eingegangen war – unabhängig vom Meldedatum der Infektion.

Warum setzt der SPIEGEL die Infizierten- und Todeszahlen nicht ins Verhältnis zur Bevölkerungszahl?

10.000 Infizierte in einem sehr kleinen Land sind etwas anderes als 10.000 Infizierte in einem bevölkerungsreichen Land. Dennoch zeigen wir – beispielsweise in unserer Ländertabelle – absolute Zahlen. Denn relative Zahlen würden den Eindruck vermitteln, dass die Zahlen verschiedener Länder untereinander eins zu eins miteinander vergleichbar sind. Das sind sie aber nur, wenn überall im gleichen Umfang getestet würde bzw. wenn alle Länder die gleichen Kriterien für die Erfassung von Todesfällen heranziehen würden.

Wie färbt der SPIEGEL seine Corona-Deutschlandkarten ein?

Auf sogenannten Choroplethenkarten werden Regionen je nach Ausprägung eines Merkmals eingefärbt, sodass sich Vergleiche anstellen und regionale Muster erkennen lassen. In der Coronapandemie haben sich beispielsweise Inzidenzkarten etabliert, bei denen Städte und Landkreise je nach Infektionsgeschehen eingefärbt sind: je höher die Sieben-Tage-Inzidenz, desto kräftiger und dunkler.

Der SPIEGEL arbeitet hierbei mit den selbst berechneten Sieben-Tage-Inzidenzen (siehe oben), um Werte darzustellen, die sich tatsächlich sinnvoll untereinander vergleichen lassen. Im niedrigen Inzidenzbereich arbeiten wir mit Grautönen, bei höheren Inzidenzen mit Orange- und Rottönen, um die damit einhergehende Gefahr zu signalisieren.

Im Laufe der Pandemie mussten die Farbklassen und Farbtöne wiederholt angepasst werden. Etwa wenn die Politik Grenzwerte eingeführt hat, wie die 35er- und 50er-Inzidenz. Oder wenn die Inzidenzen flächendeckend so stark angestiegen sind, dass viele Regionen in die höchste Farbstufe fallen und deren Grenzwert bei Weitem übersteigen. Am oberen Ende der Skala wurde dann eine weitere Farbstufe ergänzt, teilweise mussten auch die helleren Farben etwas nachjustiert werden, um wieder gleichmäßige visuelle »Abstände« zwischen den Farbtönen herzustellen.

Im Herbst 2021 hat die Sieben-Tage-Inzidenz neue Rekordwerte erreicht und erneute Änderungen erforderlich gemacht. Zu diesem Anlass haben wir am 11. November 2021 eine größere Anpassung an der Farbskala vorgenommen. Die Überlegungen dabei: Zum einen waren die Rottöne ins Dunkle weitgehend ausgeschöpft. Zum anderen hat sich die Gefahreneinschätzung über die zurückliegenden Monate verändert: Frühere Grenzwerte sind nicht mehr Teil des Infektionsschutzgesetzes, ein Großteil der Bevölkerung ist geimpft und dadurch weniger anfällig für schwere Krankheitsverläufe.

Daher teilen wir nun Inzidenzen bis 50 in weniger Stufen ein, Grautöne werden bis 50 statt bis 35 verwendet. Neu hinzu kam zunächst eine Stufe für Sieben-Tage-Inzidenzen von mehr als 500, am 26. November eine weitere für Inzidenzen von mehr als 1000. Die Orange- und Rottöne verschoben sich und wurden zudem leicht angepasst.

Am 4. Februar 2022 erfolgte eine weitere Anpassung. In der Omikron-Welle wurden in einem Großteil der Städte und Landekreise vierstellige Inzidenzen gemessen, gleichzeitig verursacht die Variante mildere Krankheitsverläufe. Daher haben wir eine neue Stufe ab 2000 eingeführt und die bestehende Farbpalette für Werte ab 50 auf sechs statt fünf Stufen verteilt.

In den Deutschlandkarten zu Todesfällen arbeiten wir mit Grau- und Schwarztönen, bei den Hospitalisierungen mit Blautönen, bei den Impfquoten mit Grüntönen. Die Farbklassen zu den Impfquoten werden dynamisch angepasst, sodass die Spannbreite stets vom Bundesland mit der niedrigsten Quote bis zum Land mit der höchsten Quote reicht.

Wie zuverlässig sind die Impfzahlen?

Die offiziellen Impfquoten des RKI vermitteln grundsätzlich einen guten Eindruck darüber, wie viele Menschen ungefähr sich in Deutschland gegen Covid-19 haben impfen lassen. Die Werte unterliegen verschiedenen Unschärfen, die teils gegenläufige Effekte haben – es kommt sowohl zu Unter- als auch zu Überschätzungen.

1. Generelle Unterschätzung der Impfquoten

Nach Einschätzung des RKI werden nicht alle Impfungen korrekt erfasst. Die tatsächlichen Impfquoten könnten demnach um bis zu fünf Prozentpunkte höher liegen als offiziell ausgewiesen. Grund seien lückenhafte Meldungen durch Ärztinnen und Ärzte.

2. Verzerrungen zwischen Bundesländern

Die regionale Zuordnung einer Impfung erfolgt nach Impfort, nicht nach Wohnort der Geimpften. Dadurch ergeben sich Verzerrungen zwischen den Bundesländern. Insbesondere bei den Stadtstaaten könnten die Impfquoten zu hoch ausfallen  und sogar auf mehr als 100 Prozent steigen.

Wie kommen die Inzidenzen nach Impfstatus zustande?

Das RKI schlüsselt die normale Sieben-Tage-Inzidenz nicht nach Impfstatus auf. Der Vergleich wäre wohl auch stark verzerrt: Asymptomatische Infektionen bei Geimpften dürften eher selten entdeckt werden, weil sie sich nur selten testen lassen müssen. Infektionen bei Ungeimpften haben dagegen eine höhere Chance, registriert zu werden.

Besser vergleichbar sind die Angaben zu symptomatischen Corona-Infektionen sowie zu Corona-bedingten Klinikaufnahmen. Diese schlüsselt das RKI inzwischen wöchentlich nach Altersgruppen und Impfstatus  auf. Um keinen falschen Eindruck zu erwecken, kürzen wir die Zeitreihe der symptomatischen Infektionen um die jeweils letzte, die Zeitreihe der Hospitalisierungen um die letzten beiden Wochen, weil für diesen Zeitraum mit Nachmeldungen zu rechnen ist.

Als das RKI die Inzidenzen nach Impfstatus noch nicht bereitgestellt hat, hat der SPIEGEL sie selbst berechnet. Hierfür wurden die Angaben zu Impfdurchbrüchen in den RKI-Wochenberichten verwendet.

Wie berechnet sich die Reproduktionszahl R?

Die sogenannte Reproduktionszahl R, auch Ansteckungsrate genannt, beschreibt, wie viele andere Menschen ein Corona-Infizierter im Schnitt ansteckt. Ein Wert von 2 bedeutet beispielsweise: Ein Infizierter steckt durchschnittlich zwei weitere Menschen an. Bliebe die Reproduktionszahl dauerhaft in dieser Größenordnung, würde sich das Virus mit zunehmender Geschwindigkeit verbreiten und die Zahl der Neuinfizierten etwa alle vier Tage verdoppeln. Umgekehrt bedeutet etwa ein R-Wert von 0,5: Nur jeder zweite Infizierte steckt eine andere Person an, die Fallzahlen sinken.

Natürlich lässt sich nicht feststellen, wie viele andere Personen ein Infizierter tatsächlich ansteckt. Das RKI berechnet die täglich veröffentlichte Reproduktionszahl für Deutschland deshalb aus der Zahl der gemeldeten Neuinfektionen. Es ermittelt dafür den Krankheitsbeginn  eines jeden gemeldeten Infizierten.

Für einen Großteil der Fälle ist dieser Zeitpunkt bekannt. Für Patienten ohne bekannten Krankheitsbeginn wird der Zeitpunkt mithilfe von Erfahrungswerten statistisch berechnet – das nennt sich Imputation. Und schließlich prognostiziert das RKI die Zahl der Infizierten, die zwar schon erkrankt sind, deren Meldung beim RKI aber noch nicht eingegangen ist. Das funktioniert mit der sogenannten Nowcast-Methode. Auch sie basiert auf Erfahrungswerten und statistischer Schätzung und hilft dabei, Meldeverzüge auszugleichen.

Mit der Zahl der Neuerkrankten ermittelt das RKI dann die Reproduktionszahl R. Zwischen der eigenen Erkrankung und dem Erkrankungsbeginn einer weiteren, von dieser Person angesteckten Person, liegen meist rund vier Tage. Der R-Wert eines Tages ergibt sich daher, indem man die Zahl der Neuerkrankten an diesem Tag teilt durch die Zahl der Neuerkrankten vor vier Tagen. Die vom RKI täglich veröffentlichte Reproduktionszahl entspricht dem R-Wert, der dem Tag zugeordnet wurde, der fünf Tage vor der Berechnung liegt. (Für eine noch aktuellere Berechnung sind die Daten der unmittelbar vorangegangenen Tage mit zu hohen statistischen Unsicherheiten behaftet.)

Weil das RKI jeden Tag nicht nur den neuesten R-Wert ermittelt, sondern auch die Werte früherer Tage mit der neuesten Datenlage neu berechnet, können die R-Werte für vergangene Tage von den zuvor veröffentlichten Werten abweichen.

Welche Kennzahlen werden für die Ländertabelle verwendet?

In unserer Ländertabelle zeigen wir, wie viele bestätigte Infektionen und Todesfälle es in einem Land gibt – kumuliert und in den jüngsten sieben Tagen. Die Daten stammen von der JHU (siehe oben), die Daten für Deutschland sind vom RKI übernommen. Darüber hinaus berechnen wir täglich die aktuelle Dynamik in den Ländern.

Zum einen berechnen wir für jedes Land den täglichen Anstieg, sowohl bei den Infiziertenzahlen als auch bei den Todesfällen. Um Schwankungen einzelner Tage auszugleichen, bilden wir den Durchschnitt der Anstiege an den vergangenen sieben Tagen. Um den Anschein einer hohen Präzision zu vermeiden, runden wir die Zahlen, je nach Höhe auf Zehner, Hunderter oder Tausender.

Zum anderen betrachten wir den Anstieg der Infektionen nicht nur in den vergangenen sieben Tagen, sondern auch in den sieben Tagen davor. Aus der Veränderung zwischen den zwei Zeiträumen leiten wir einen groben Trend ab: Liegt die Zahl der bestätigten Neuinfektionen mindestens zehn Prozent höher als in der Vorwoche, »steigen« die Neuinfektionen, liegt sie mindestens 50 Prozent höher, wird daraus in der Tabelle ein »steigen stark«. Nehmen die Neuinfektionen ab, steht in der Tabelle »sinken« (-10 Prozent oder weniger) oder »sinken stark« (-50 Prozent oder weniger). Bei Veränderungen zwischen –10 und +10 Prozent bezeichnen wir den Trend als »konstant«.

Wir prüfen fortlaufend die Auswahl der von uns verwendeten Datenquellen und Messgrößen. Bei Änderungen werden wir diese FAQ aktualisieren.