In Deutschland sind mittlerweile 173.800 Corona-Fälle bekannt (Stand 13. Mai 20:20). Davon sind 148.700 Personen wieder gesundet, 7.790 verstorben. Es gibt somit noch ungefähr 17.300 aktive Fälle.

In den vergangenen Monaten wurde viel Wert auf die Reproduktionszahl gelegt. Noch bis Ende April war sie die wichtigste Zahl, mit der die Kanzlerin und die Ministerpräsidenten Lockerungen und Verschärfungen der Corona-Regelungen auf ihren Pressekonferenzen verdeutlichten.

Als die Reproduktionszahl vor wenigen Tagen zum ersten mal seit einiger Zeit wieder über 1,0 stieg – also vermeintlich die Rate der Corona-Erkrankten wieder anstieg – machten viele Medien dies zu ihrem Titel. Das Ärzteblatt schrieb: „COVID-19: Reproduktionsrate steigt wieder über kritischen Wert 1“. Die Tagesschau: „Reproduktionszahl übersteigt kritischen Wert“.

Das Redaktionsnetzwerk Deutschland titelte am 10. Mai: „RKI sieht Corona-Reproduktionsrate wieder über dem kritischen Wert 1“; um am 13. Mai zu titeln: „RKI-Reproduktionszahl fällt wieder unter kritischen Wert“.

Wie kommt die Reproduktionszahl zustande?

Die Erarbeitung der Reproduktionszahl ist ein langwieriger Vorgang. Denn, obwohl sie ja „nur“ beschreibt, wie viele gesunde Personen ein Infizierter ansteckt, ist dieser Vorgang nicht ohne weiteres verfolgbar.

Tatsächlich erhält das RKI die Meldung eines infiziert Getesteten in der Regel erst fünf bis zehn Tage nach Beginn der ersten Symptome, in der Hälfte der Fälle sieben Tage nach den ersten Symptomen. Dies liegt nicht nur an langen Meldewegen, denn eine Person mit Symptomen muss ja erst zum Arzt gehen und einen Abstrich machen lassen; der Abstrich muss in ein Labor gebracht werden und dieses muss den zeitaufwendigen Test durchführen. Und dass alles setzt voraus, dass der Tag, an dem die Symptome das erste mal auftraten, überhaupt bekannt ist und ans RKI übermittelt wird.

Hier springt das sogenannte „Nowcasting“ mit ein. Der Name ist eine Abwandlung des englischen „Forecasting“: statt Vorher-Sagen, geht es ums Jetzt-Sagen. Mithilfe der am Tag der Berechnung bekannten Zahlen schätzen die Wissenschaftler ein, wie viele Personen an einem in der Vergangenheit liegenden Tag erste Symptome zeigten. Je länger dieser Wert in der Vergangenheit liegt, desto genauer ist er, denn es sind umso mehr Daten bekannt und es muss weniger geschätzt werden.

Dann wird dieser errechnete Wert mit einem Wert verglichen, der vier Tage älter ist. Vier Tage älter, denn so lang schätzt das RKI die sogenannte „Generationszeit“ ein. Die Generationszeit beschreibt, wie lange es von der Infektion einer Person dauert, bis sie jemanden Anderen infiziert.

Es ergibt sich also aus dem Vergleich der für einen Tag geschätzten Erst-Symptomfälle der Gruppe A mit den gesschätzten Erst-Symptomfällen der Gruppe B vier Tage später, wie viele Personen die Gruppe A im Durchschnitt angesteckt hat.

In der Praxis vergleicht das RKI aber nicht einen Tag mit einem anderen Tag, denn das würde Schwankungen der Fallmeldungen, die durch den Wochentag bedingt sind (am Wochenende und an Feiertagen wird viel weniger getestet) zu sehr ins Gewicht fallen lassen und damit die Reproduktionszahl stark verzerren. Stattdessen werden immer vier Tage miteinander verrechnet, um einen Mittelwert zu bekommen, wie viele Personen durchschnittlich in diesem Zeitraum erste Symptome zeigten. Dann werden zwei aufeinanderfolgende Vier-Tages-Blöcke genutzt, um die Reproduktionszahl zu errechnen. Aber, weil wie oben beschrieben, ältere Zahlen mehr Aussagekraft haben als jüngere, wird eine R-Zahl nicht tagesaktuell errechnet, sondern unter Ausschluss der Daten der letzten drei Tage.

Ein praktisches Beispiel:

Am 4. Mai meldete das RKI in seinem täglichen Lagebericht, dass die Reproduktionszahl mit Datenstand 4. Mai 0:00 Uhr, 0,76 betragen würde.

Der jüngste, dieser Berechnung zugrunde liegende Wert ist die „Punktschätzung der Anzahl der Neuerkrankungen (ohne Glättung)“ vom 30. April (denn der 3., 2. und 1. werden außen vorgelassen, siehe oben).

Aus den Werten des 30., 29., 28. und 27. April, wurde der Durchschnitt der vermuteten Neuerkrankungen errechnet (durchschnittlich 827,5 Neuerkrankungen in diesem Zeitraum).

Nach dem gleichen Verfahren wurde ein Mittelwert aus den vermuteten Neuerkrankungen vom 23. April bis einschließlich 26. April errechnet (durchschnittlich 1.090 Neuerkrankungen).

Dann wurde der jüngere Zeitblock durch den älteren dividiert, woraus sich eine Reproduktionszahl von 0,76 ergibt.

Die Zahlen ergeben sich aus den Zahlen der vom RKI veröffentlichen Beispielrechnung.

Das Problem

Tatsächlich, sind die im Rahmen des täglichen Lageberichts veröffentlichen Zahlen bei weitem nicht final – sie sind eben auch nur Schätzungen.

Diese Graphik beschreibt, wie sich die geschätzten Reproduktionszahlen aufgrund der zum jeweiligen Zeitpunkt vorliegenden Daten von der nachträglich, unter Einbeziehung einer größeren Datenmenge, errechneten Rerpoduktionszahl unterscheidet.

Die blau eingefärbte Fläche stellt dabei das 95%-Prädiktionsintervall dar. Dieses beschreibt, in welchem Bereich sich der tatsächliche Wert bewegen sollte; wie hoch die Unsicherheit des veröffentlichten Schätzwertes ist. Dieser Prädiktionsintervall wird im Zeitverlauf größer, weil auch die Unsicherheiten aufgrund fehlender Daten größer werden.

Dabei kommt es teilweise zu erheblichen Unterschieden. Noch klarer wird es, vergleicht man die jeden Tag gemeldeten R-Zahlen mit denen, die rückblickend mit dem Datenstand vom 12. Mai errechnet werden können.

Die blaue Linie zeigt die Reproduktionszahl, wie sie täglich gemeldet wurde, die rote Linie, wie die Reproduktionszahl rückblickend aussieht. Selten sind die beiden Zahlen deckungsgleich oder ähnlich. Am 12. Mai kommen beide Linien zur gleichen Reproduktionszahl, doch dies liegt daran, dass zum Zeitpunkt für beide Zahlen noch die gleiche Datengrundlage herrschte. Dies wird in einigen Tagen wahrscheinlich nicht mehr der Fall sein.

So ergibt sich aus der Beispielrechnung oben für den 4. Mai eine R-Zahl von 0,76; aber nach den Zahlen vom 12. Mai war die Reproduktionszahl zu diesem Zeitpunkt tatsächlich 0,86 – also höher als angenommen. Im Umkehrschluss gibt es allerdings auch Tage, an denen die tatsächliche Reproduktionszahl niedriger war, als die im Situationsbericht gemeldete. Verschiedene Faktoren verwischen die Reproduktionszahl ohnehin stark.

So wirft das RKI ein, dass die stetig steigende Testkapazität in Deutschland dazu führt, dass die Reproduktionszahl überschätzt wird, doch: „Eine Adjustierung für die höheren Testraten ist nicht ohne weiteres möglich, da keine ausreichend differenzierten Testdaten vorliegen.“

Dazu kommt erschwerend hinzu, dass die mittlerweile vergleichsweise geringe Zahl an Neuerkrankungen dazu führt, dass kleine Häufungen von Fällen, bei denen aktiv nach einer Corona-Infektion gesucht wird das Ergebnis nach oben verzerren können, so geschehen in den vergangen Tagen:

„Die geschätzte Reproduktionszahl lag in den letzten Tagen leicht über 1. Dies zeigt, dass der Rückgang der Anzahl von Neuerkrankungen, den wir in den letzten Wochen beobachtet haben, sich abgeflacht hat und möglicherweise ein Plateau erreicht. Von einem erneut ansteigenden Trend gehen wir bisher nicht aus. Die Abschwächung des Rückgangs der Neuerkrankungen hängt auch mit lokalen Häufungen beispielsweise im Umfeld von Schlachtbetrieben zusammen. Da die Fallzahlen in Deutschland zudem insgesamt langsam kleiner werden, beeinflussen diese Ausbrüche den Wert der Reproduktionszahl stärker als bei höheren Fallzahlen. Der Verlauf der Anzahl von Neuerkrankungen in den nächsten Tagen muss abgewartet werden um zu beurteilen, ob nur eine vorübergehende Verlangsamung des Rückgangs vorliegt“.

Um diese Verzerrungen auszugleichen, kündigte das RKI am Dienstag an, die Reproduktionszahl zukünftig aufgrund von geglätteten Zahlen zu errechnen – wie dies genau aussieht, ist noch nicht bekannt. Tatsächlich sollte eine solche Glättung nur bedeuten, dass überraschende Ausschläge der Neuerkrankungen (in beide Richtungen) zu einem gewissen Grad abgeschwächt werden. Das RKI erstellt schon länger geglättete Werte, nutzt diese allerdings nicht für die veröffentlichten Zahlen.

Die Crux mit der Reproduktionszahl

Sie ist ein gutes Werkzeug, um den Ausbruch der Krankheit rückblickend zu beobachten. Sich über mehrere Tage hinweg fortsetzende Tendenzen können auch Aussagen über das aktuelle Geschehen machen. Aber einzelne Tagesergebnisse eignen sich nicht dazu, um eine Strategie zu entwickeln. Zusätzlich zur Ungenauigkeit kommt die Verzögerung, die in der Berechnung zum Ausdruck kommt: Am 12. Mai wurde die Reproduktionszahl für Personen errechnet, die vom 1. bis zum 4. Mai erkrankten. Wenn die Reproduktionszahl also ernsthaft ausschlägt, ist es schon zu spät: Beträgt die echte Reproduktionszahl 1,3, so verdoppelt die Zahl der Neuerkranken sich innerhalb von 11 Tagen. Daher, so das RKI: „Die Reproduktionszahl alleine reicht nicht aus, um die aktuelle Lage zu beschreiben. Zumindest die absolute Zahl an Neuerkrankungen und auch die Zahl schwerer Erkrankungen müssen zusätzlich betrachtet werden, um ein angemessenes Bild zu bekommen.“

Die Reproduktionszahl ist für Entscheidungsträger und Wissenschaftler ein wichtiges Werkzeug. Die tägliche Meldung des RKI wird als Argument für Lockerungen, wie Verschärfungen der Corona-Regelungen, verwendet; dazu eignet sie sich grundlegend nicht. Sie ist zu ungenau und im Zeitpunkt ihrer Veröffentlichung schon zu veraltet, als dass sie, unter Ausschluss anderer Daten, als Seismograph der Pandemie dienen könnte.