Covid-19 Benfords Law: Deutsche Covid-Statistiken sind konsistent – schwedische nicht

Wissenschaftler haben die Corona-Daten aus 182 Ländern analysiert. Demnach liefern nur 27 Länder konsistente, also widerspruchsfreie Statistiken, darunter Deutschland, Israel und Großbritannien. Andere erfüllen die Anforderungen nur teilweise.

Zahl der weltweiten Coronafälle und -toten auf der Worldometer-Webseite im November 2020
In der Pandemie haben die meisten Politiker ihre Entscheidungen auf Basis von Statistiken getroffen. Daher sei die Qualität dieser Daten von großer Bedeutung, sagen Forscher. (Symbolbild) Bildrechte: IMAGO / ZUMA Wire

Finanzgeschäfte, Wahlen oder Epidemien haben eines gemeinsam: Sammelt man jeweils alle zu einem Thema gehörende Datensätze zusammen, dann sind die einzelnen Datenpunkte nie ganz zufällig verteilt. Etwa wie bei der Gaußschen Normalverteilung aus dem Mathematikunterricht gibt es bei sehr großen Datenmengen Verteilungsmuster. Eines davon ist das sogenannte Benfordsche Gesetz, das unter anderem aussagt, dass in sozial- oder wirtschaftswissenschaftlichen Datensätzen die Anfangsziffern 1 und 2 häufiger vorkommen als eine 9. Eine 1 ist demnach etwa 6,6 Mal so häufig, wie eine 9.

Corona-Daten aus Deutschland bestehen statistische Überprüfung

Professor Noah Farhadi von der IU Berlin
Professor Noah Farhadi von der IU Berlin Bildrechte: Alan Ovaska

Daher lässt sich "Benfords Law", wie die Regel ursprünglich heißt, auch die offiziell herausgegebenen Corona-Daten von nationalen Gesundheitsbehörden anwenden. Je eher sie Benfords Law entsprechen, als desto zuverlässiger können sie angesehen werden. Je mehr sie abweichen, desto größer die Wahrscheinlichkeit, dass sie unvollständig oder manipuliert sind.

Noah Farhadi von der Privathochschule IU (Internationale Hochschule in Berlin) und Hooshang Lahooti von der Universität Sydney haben für ihre Studie Daten zu Infektions- und Sterbezahlen sowie zu Covid-Tests und Impfungen für 182 Länder gesammelt und mit Hilfe von Benfords Law sowie weiteren statistischen Prüfverfahren analysiert. Ergebnis: 27 Länder, darunter Deutschland, Australien, Spanien, Israel und das Vereinigte Königreich veröffentlichen Statistiken, die den erwarteten Verteilungen entsprechen. Bei 123 Ländern, darunter die USA, China und Frankreich, werden die Anforderungen an die Datenqualität nur teilweise erfüllt. 26 Länder, darunter Weißrussland, Bangladesch aber auch Schweden und die Niederlande, weisen laut der statistischen Analyse jedoch deutliche Abweichungen von der natürlichen Verteilung auf.

Kapazitätsengpässe erzeugen Abweichungen in der Statistik

Die Gründe dafür können unterschiedlich sein. Zum einen können extrem rasch wachsende oder schrumpfende Fallzahlen zu Abweichungen führen. Auch Kapazitätsengpässe, etwa bei den Corona-Tests, können die Statistik künstlich beeinflussen. Ein wichtiger Faktor dafür, dass man das Benfordsche Gesetz erfolgreich anwenden kann, ist, dass es keine künstlich geschaffenen Ober- und Untergrenzen gibt.

"Stehen einem Land beispielsweise eine maximale Zahl von PCR-Tests zur Verfügung, vielleicht 300 am Tag, und sind diese dann voll ausgelastet, dann wird die Zahl bestätigter Neuinfektionen bei einer Ausbruchswelle vielleicht viele Tage hintereinander bei 300 liegen. In der statistischen Analyse nach dem Benfordschen Gesetz fällt das dann als Anomalie auf", sagt Noah Farhadi. Zugleich zeige eine solche Untersuchung, dass die tatsächlichen Fallzahlen sehr viel höher ausfallen könnten.

Gute Daten sind keine reine Geldfrage

Auch manipulierte Daten fallen auf, das zeigt das Beispiel Iran. "Da konnten wir bereits im vergangenen Jahr feststellen, dass sie nicht konsistent sind", sagt Farhadi. Den offiziellen Statistiken zufolge hatte das Land die erste Covid-Welle 2020 mit nur wenigen Infektionen überstanden. Aber schon die statistische Analyse zeige, dass an den Daten etwas nicht stimmen konnte. Reporter der BBC deckten dann Anfang August auf: Das Land hatte seinen Corona-Fälle systematisch zu niedrig angegeben.

Für Europa zeigt die Studie, dass einige Länder nur bedingt den Anforderungen von Benfords Law genügen, etwa Schweden oder die Niederlande. Länder mit geringeren Ausgaben für Gesundheitssysteme können dagegen "zuverlässige beziehungsweise konsistente Daten über den Verlauf der Epidemie veröffentlichen", stellt Farhadi fest und nennt als Beispiel Afghanistan, das sich zwar im Bürgerkrieg befindet, aber offenbar ein gutes Berichtssystem im Gesundheitswesen hat. "Nach Angaben von Macrotrends wurden in Afghanistan im Jahre 2018 nur 50 US-Dollar pro Kopf an Gesundheitsausgaben getätigt. Im gleichen Zeitraum betrugen die Ausgaben in den Niederlanden 5.307 US-Dollar pro Kopf, also fast hundert Mal so viel", sagt Fahrhadi. Am Geld allein kann es also nicht liegen.

(ens)

2 Kommentare

MDR-Team vor 9 Wochen

Hallo @wo geht es hin,
die Meldungen der Impfungen sind in der Tat ein wenig verzögert. Jedoch müsste die Zahl der Geimpften dabei nach oben korrigiert werden - nicht nach unten. Statistiken beziehen sich immer auf die vorliegenden Daten.

Bei der Interpretation von Impfquoten-Daten gibt es laut Robert Koch-Institut (RKI) eine "gewisse Unsicherheit". Mehrere Überlegungen legten nahe, dass die Meldungen im sogenannten Digitalen Impfquotenmonitoring (DIM) die Impfquoten vermutlich unterschätzen, heißt es in einem RKI-Report.

https://www.tagesschau.de/inland/innenpolitik/rki-unsicherheit-impfquote-101.html

Liebe Grüße

wo geht es hin vor 9 Wochen

Lol. Die Datensätze aus Deutschland wären o.k.? Wo in Deutschland noch nicht mal genau bekannt ist, wieviele Menschen z. Bsp. denn nun eigentlich geimpft sind? Noch mal lol.