BLog

ImprintImpressum
PrivacyDatenschutz
DisclaimerHaftung
Downloads 

Zeitreihenanalyse zur Ausbreitung des n-Coronavirus-2019 in China

Theoretisch kommen für die Virusausbreitung zwei Wachstumsgesetze in Frage, nämlich das ungehemmte (explosionsartige) exponentielle Wachstum und das durch die im statistischen Schnitt maximale Anzahl möglicher Wirte begrenzte logistische Wachstum. Das erste wird durch die Exponentialfunktion und das zweite durch die Logistische Funktion beschrieben. Dabei setzt sich das logistische Wachstum prinzipiell aus exponentiellem und beschränktem Wachstum zusammen. Die gerade im Laufe der Ausbreitung einer ansteckenden Virusinfektion spannende Frage ist die nach dem Wendepunkt bei dem die Wachstumsrate ihr Maximum erreicht und danach beginnt sich abzuschwächen. Der weitere Kurvenverlauf mündet schließlich in einen Grenzwert ein. Die Antworten auf diese und weitere Fragen liefert eine Zeitreihenanalyse.

Die Weltgesundheitsorganisation WHO veröffentlicht seit dem 21. Januar 2020 auf ihrer Web-Seite tagesaktuelle Situationsberichte zur Ausbreitung des n-Coronavirus-2019. Hier kommt eine tabellarische Zusammenfassung der bestätigten Infektionsfälle und Todeszahlen:

laborbestätigte Fälle China global
Datum Berichtstag Infektionen Wachstumsrate Infektionen Tote
2020-01-21 1 278 + 282 6
  2 309 31 314 6
  3 571 213 581 17
  4 830 259 846 25
  5 1297 467 1320 41
  6 1985 688 2014 56
  7 2741 756 2798 80
  8 4537 1796 4593 106
  9 5997 1460 6065 132
  10 7736 1739 7818 170
2020-01-31 11 9720 1984 9826 213
2020-02-01 12 11821 2101 11953 259
  13 14411 2590 14557 305
  14 17238 2827 17391 362
  15 20471 3233 20630 426
2020-02-05 16 24363  3892* 24554 492
  17 28060 3697 28276 565
  18 31211 3151 31481 638
2020-02-08 19 34598 3387 34886 724
  20 37251 2653 37558 813
  21 40235 2984 40554 910
2020-02-11 22 42708 2473 43103 1018
2020-02-12 23 44730 2022 45171 1115
2020-02-13 24 46550 1820 46997 1369
2020-02-14 25 48548 1998 49053 1383
2020-02-15 26 50054 1506 50580 1526
2020-02-16 27 51174 1120 51857 1669

* Wendepunkt

Die visuelle Analyse

Im Diagramm der globalen Infektionsfälle erkennt man jedenfalls am Anfang den exponentiellen Anstieg. Man erkennt aber auch ganz deutlich, daß der exponentielle Trend zum jetzigen Zeitpunkt bereits gebrochen ist, d.h. zum Glück müssen wir also nicht die Auslöschung der Menschheit befürchten.

Die Kurvenanpassungen

Für die Kruvenanpassungen verwende ich die von mir programmierte Software CVA, die ich kostenlos für macOS und Windows zur Verfügung stelle.

Es ist sinnvoll sich auf die Fallzahlen in China zu beschränken, weil die weltweite Ausbreitung noch zu stark dem Zufall unterliegt. Im ersten Schritt werden die reinen Wachstums-Funktionen über ihre variablen Parameter an die Daten angepaßt. Die Anpassung erfolgt mit dem Levenberg-Marquardt-Algorithmus. Dabei werden die Parameter iterativ so variiert, daß die Summe der Abweichungsquadrate 𝜒² minimal wird.

Die Exponentialfunktion:  a·exp(b·(x - c)

Die logistische Funktion:  a·0,5/(0,5 + (a - 0,5)·exp(-b·a·(x - c)))

In beiden Fällen verfügen wir über 3 variable Parameter. Der Parameter a ist ein Skalenfaktor, und bei der logistischen Funktion stellt er zugleich den oberen Grenzwert dar. Der Parameter b ist die Steigung der Exponentialfunktion, und bei c handelt es sich um eine Korrektur der Zeitskala, die bei der Anpassung variabel gehalten werden muß, weil der genaue Zeitpunkt des Ausbruchs (e-Funktion) bzw. die Lage des Wendepunkts (l-Funktion) aus den genannten WHO-Situationsberichten nicht hervorgehen.

Parameter Exponentialfunktion logistische Funktion
a 40,2726 47805,8
b 0,174198 6,21142·10-6
c -20,2571 -22,7806

Die Güte der Anpassung wird visuell und anhand der Summe der Abweichungsquadrate bewertet, und die logistische Funktion schneidet jeweils deutlich besser ab. Die Exponentialfunktion zeigt grobe systematische Abweichungen über den gesamten Kurvenverlauf, und ihr 𝜒² ist etwa 16mal größer als das der logistischen Funktion, die ihrerseits kleinere aber immer noch deutliche systematische Abweichungen im unteren Bereich zeigt, aber dennoch sehr gut mit dem tatsächlichen Verlauf im oberen Bereich übereinstimmt.

Wenn man einmal kurz die systematischen Abweichungen der logistischen Anpassung ignoriert, dann wäre mit einer maximalen Anzahl von knapp 50000 Infektionen in China zu rechnen und die Trendwende (höchste Anzahl Neuinfektionen an einem Tag) wäre vorvorgestern am Tag 16 durchschritten worden. Tatsächlich sollte man aber systematische Abweichungen bei Kurvenanpassungen nicht ignorieren, insbesondere dann nicht wenn man Voraussagen machen will. Die Abweichungen bedeuten, daß das zugrundeliegende Modell verfeinert werden muß.

Die logistische Funktion beschreibt an und für sich den Verlauf der tatsächlichen Infektionen, wohingegen sich in den WHO-Berichten die bestätigten Infektionen wiederfinden, und wir müssen wohl von einer signifikanten Dunkelziffer ausgehen, die zudem von Tag zu Tag zunehmen dürfte. Die erste Verfeinerung des Modells dürfte demnach sein, die logistische Funktion um eine unbekannte Dunkelzifferfunktion D(x) zu erweitern, nämlich a·0,5/(0,5 + (a - 0,5)·exp(-b·a·(x - c))) - D(x)

Die Dunkelziffer muß bei der Anpassung von den durch die logistische Funktion beschriebenen tatsächlichen, deutlich höher liegenden Infektionsverlauf abgezogen werden, damit sich die Kurve an die Meldedaten anschmiegt, daher -D(x).

Die Natur von D(x) ist zunächst unbekannt. Wir können davon ausgehen, daß es bereits zum Tag 0 eine unbekannte Anzahl von Infektionen gab, ferner dürfte die Dunkelziffer seitdem stetig gestiegen sein. In solchen Fällen, ist es gute Übung, es zunächst einmal mit einem linearen Verlauf der unbekannten Funktion zu versuchen, einfach weil man es nicht besser weiß.

Hier kommt also die Anpassung einer um eine lineare Dunkelzifferfunktion korrigierten logistischen Funktion, nämlich a·0,5/(0,5 + (a - 0,5)·exp(-b·a·(x - c))) - (d·x + e):

Parameter Wert Erläuterung
a 85581,5 Grenzwert inkl. Dunkelziffer
b 2,26504·10-6 Steigung der e-Funktion
c -44,435 Wendepunkt bei Tag 17
Ausbruch am Tag -27
= 25.12.2019
d 569,558 tägl. Zunahme der Dunkelziffer
e 2439,04 Dunkelziffer am Tag 0

Das sieht nun sehr gut aus, und 𝜒² beträgt nun nur noch 1/3 im Vergleich zur Anpassung der unkorrigierten logistischen Funktion, und damit trauen wir uns eine Projektion zu:

Demnach sollte sich in etwa 2 Wochen die Zahl der bestätigten n-Coronavirus-2019-Infektionen bei ca. Sechzigtausend eingependelt haben. Die tatsächliche Anzahl dürfte dann bei vielleicht Neunzigtausend liegen.

Update 2020-02-11

Seit dem 6. Februar gibt es eine neue Kategorie positive Tests, die allerdings so in den WHO-Situationsberichten nicht auftaucht. Im Grunde bedeutet das, daß die positiv getesteten sich erst mit einer gewissen Zeitverzögerung im Verlauf der bestätigten Infektionen niederschlagen. Möglicherweise läßt sich das Auf und Ab in den Wachstumsraten der letzten Tage auf die neue Zählweise zurückführen. Jedenfalls verwende ich weiter die WHO-Zahlen für die Kurvenanpassungen.

Parameter Wert Erläuterung
a 63035,5 Grenzwert inkl. Dunkelziffer
b 3,72588·10-6 Steigung der e-Funktion
c -33,3985 Wendepunkt bei Tag 17
Ausbruch 4.1.2020
d 238,125 tägl. Zunahme der Dunkelziffer
e 1214,6 Dunkelziffer am Tag 0

Die zu erwartende Anzahl an Infektionrn läge demnach erheblich niedriger als nach der Schätzung mit den Daten bis zum 8. Februar (WHO-Situationsbericht 19). Nach der neuen Projektion dürfte sich die Zahl der bestätigten n-Coronavirus-2019-Infektionen in den nächsten 14 Tagen auf unter 55000 und die tatsächliche Anzahl bei vielleicht 65000 einpendeln.

Update 2020-02-12

Der neue Wert für die bestätigten Infektionsfälle in China liegt um 127 Fälle (0,3 %) unter der Vorhersage für heute. Die Fortschreibung der Kurvenanpassung konvergiert schon seit mehreren Tagen, d.h. die erhaltenen Parameter weichen jedesmal geringfügiger vom vorherigen Wert ab. Hier kommen das neue Diagramm und die neuen Ergebnisse:

Parameter Wert Erläuterung
a 62265,6 Grenzwert inkl. Dunkelziffer
b 3,8067·10-6 Steigung der e-Funktion
c -32,9249 Wendepunkt bei Tag 17
Ausbruch 4.1.2020
d 224,766 tägl. Zunahme der Dunkelziffer
e 1167,27 Dunkelziffer am Tag 0

Update 2020-02-13

Der 24. WHO-Situationsberichtstag begann mit einer großen Überraschung, nämlich die Provinz Hubei in China hat 13332 klinisch diagnostizierte Infektionsfälle, die bisher nicht gelistet worden waren, zusätzlich zu den auf übliche Weise geführten laborbestätigten Fällen gemeldet. Die WHO schreibt dazu:

Overnight 14’840 cases, including 13’332 clinically diagnosed cases were reported from Hubei. This is the first time China has reported clinically diagnosed cases in addition to laboratory-confirmed cases. For consistency, we report here only the number of laboratory-confirmed cases. WHO has formally requested additional information on the clinically diagnosed cases, in particular when these have occurred in the course of the outbreak and whether suspect cases were reclassified as clinically diagnosed cases.

Ich folge dem Beispiel der WHO, und werde bis zusätzliche Erklärungen vorliegen, die Gesamtzahl der Infektionen in China, also inklusive der klinisch diagnostizierten Infektionsfälle separat führen. Heute:

46550 + 13332  =  59882

Mit einem einzigen Wert läßt sich kein Zeitverlauf analysieren, und für heute bleibt es dabei. Demnächst wird es vermutlich zwei Kurven geben. Der Konsistenz halber, kommen hier nun das neue Diagramm und die neuen Ergebnisse auf Basis der bisher gelisteten laborbestätigte Fälle (laboratory-confirmed cases):

Parameter Wert Erläuterung
a 62156,8 Grenzwert inkl. Dunkelziffer
b 3,8181·10-6 Steigung der e-Funktion
c -32,8594 Wendepunkt bei Tag 17
Ausbruch 4.1.2020
d 222,444 tägl. Zunahme der Dunkelziffer
e 1162,24 Dunkelziffer am Tag 0

Update 2020-02-14

Im neuen Situationsbericht der WHO sind weiterhin nur laborbestätigte Fälle (laboratory-confirmed cases) aufgeführt. Ansonsten gibt es keine Überraschungen. Die Spikes von gestern werden offenbar als Ausnahmen angesehen und weiterhin nicht berücksichtigt, ich werde das weiter beobachten.

Parameter Wert Erläuterung
a 65213,1 Grenzwert inkl. Dunkelziffer
b 3,51595·10-6 Steigung der e-Funktion
c -34,717 Wendepunkt bei Tag 17
Ausbruch 2.1.2020
d 288,728 tägl. Zunahme der Dunkelziffer
e 1320,42 Dunkelziffer am Tag 0

Update 2020-02-15

Ich halte mich weiter an die Daten der WHO, die die laborbestätigten Fälle (laboratory-confirmed cases) verfolgt. Der Verlauf wird wieder leicht steiler, es ist aber zu früh von einer neuerlichen Trendwende zu sprechen. Die Abweichung des letzten Punktes zur blauen Anpassungskurve beträgt 292 laborbestätigte Fälle = 0,6 %

Parameter Wert Erläuterung
a 67710,4 Grenzwert inkl. Dunkelziffer
b 3,29561·10-6 Steigung der e-Funktion
c -36,2353 Wendepunkt bei Tag 17
Ausbruch 1.1.2020
d 342,319 tägl. Zunahme der Dunkelziffer
e 1473,18 Dunkelziffer am Tag 0

Mit dem WHO-Situationsbericht 24 wurde bekannt, daß plötzlich zu den laborbestätigten Fällen noch klinisch bestätigte Fälle irgendwie aufgetaucht waren. Im Gegensatz zur WHO, arbeiten viele Qualitätsmedien seit dem mit den höheren Fallzahlen. Laut WHO-Situationsbericht 24 betrug der Faktor am 13. Februar 59882/46550 = 1,2864. Plausibel wäre, daß die klinisch diagnostizierten Fälle einen mehr oder weniger parallelen zeitlichen Verlauf zu den laborbestätigten Fällen nahmen. Wenn man also die Anpassungskurve der WHO-Daten mit 1,2864 multipliziert, dann erhielte man somit einen etwaigen Verlauf der andernorts verwendeten Fallzahlen.

Update 2020-02-16

Es konvergiert. Will noch jemand darauf wetten, daß das nicht in einen Grenzwert unter 55000 laborbestätigten Infektionsfällen in China einmündet?

Parameter Wert Erläuterung
a 69138,8 Grenzwert inkl. Dunkelziffer
b 3,17729·10-6 Steigung der e-Funktion
c -37,129 Wendepunkt bei Tag 17
Ausbruch 31.12.2019
d 371,479 tägl. Zunahme der Dunkelziffer
e 1577,93 Dunkelziffer am Tag 0

Ich werde den weiteren Verlauf verfolgen und bei Gelegenheit aktualisierte Ergebnisse präsentieren.

Copyright © Dr. Rolf Jansen - 2020-02-08 18:44:32

Diskussion auf Twitter: 1228064480669687827

PROMOTION