Projekce počtu úmrtí na covid-19

Autor: Aleš Král, Zdeněk Roubal

18.10.2020

V předchozích článcích (zde a zde) jsme se věnovali analýze skutečných dat ohledně úmrtnosti. Pojistní matematici se však musí hlavně věnovat odhadu budoucnosti. V případě pojišťoven to znamená horizont desítek let, my si můžeme ukázat modely odhadu na desítky dní na případu počtu úmrtí na COVID-19 v závislosti na počtu nakažených v předchozích dnech.

Při této projekci jsme vycházeli z dat prezentovaných na stránkách ministerstva zdravotnictví. Je v nich zřejmý rozdíl mezi čísly v pracovní a víkendové dny. Pro model si proto data vyhladíme na sedmidenní průměr, a to jak počty nakažených, tak počty zemřelých. Důsledkem je, že model predikuje také sedmidenní průměr zemřelých, tento údaj však lze považovat za rozumnou aproximaci očekávaného počtu zemřelých ve zvoleném dni.

Náš model bude předpokládat, že počet úmrtí v den d bude roven součinu smrtnosti a průměrného počtu nakažených o x dní dříve. Toto x si lze díky sedmidenním průměrům zjednodušeně představit jako průměrnou dobu mezi zjištěním nákazy a úmrtím. Pomocí vzorce můžeme tento model zapsat jako

Počet_úmrtí (d) = Průměrný_počet_nakažených (d-x) * smrtnost

Pro zvolený časový posun x jde o nejjednodušší model lineární regrese. Jak však vybrat nejvhodnější x? Nabízí se dvě možnosti, jak toto nejvhodnější x najít. Buď můžeme využít koeficient determinace R2, který vyjadřuje kvalitu regresního modelu, a tak i jeho předpovědí, nebo můžeme použít více časových posunů. V našem přístupu využijeme obě tyto možnosti. Tabulka níže ukazuje hodnoty pro posuny mezi 5 a 25 dny – statisticky nejpřesnější na minulých datech vychází posun o 25 dní, jemuž odpovídá smrtnost 2,7 %. Nejkratšímu posunu o 5 dní pak odpovídá smrtnosti kolem 1 %, což podle zkušenosti z první vlny na jaře nevypadá jako přiměřený předpoklad.

Časový posunsmrtnostR2
5 dní1,0%95,5%
10 dní1,4%91,4%
15 dní1,7%92,5%
20 dní2,1%97,5%
25 dní2,7%99,1%

Aplikování zvoleného modelu na již ohlášené počty nakažených nám poskytne projekci počtu úmrtí na odpovídající počet dní. Na projektované počty úmrtí na jednotlivé dny i kumulativně se pak můžeme podívat v grafech níže.

Nejoptimističtější budoucnost predikuje model s posunem o 25 dní, který očekává prudký nárůst počtu úmrtí až od 26. 10., což odpovídá relativně stabilnímu počtu nově nakažených ve druhé polovině září. I v tomto modelu počty úmrtí významně rostou, 8. 11. překonává sedmidenní průměr hranici 200 úmrtí za den a na konci projekce k 11. 11. dosahuje kumulativní počet úmrtí hodnoty 4 500.

Projekce kumulativního počtu úmrtí pro různé předpoklady průměrné doby mezi nákazou a úmrtím

Projekce sedmidenního průměru počtu úmrtí pro různé předpoklady průměrné doby mezi nákazou a úmrtím

Jak přesné naše modely jsou, se dozvíme až postupem času. Budeme se zároveň snažit kalibraci modelů aktualizovat. Novější verze očekávejte na webu České společnosti aktuárů www.actuaria.cz či na jejím profilu na Linkedin.

Zdroje dat:

Počty nakažených, počty úmrtí – Ministerstvo zdravotnictví ČR https://onemocneni-aktualne.mzcr.cz/covid-19

Známá zjednodušení a nepřesnosti
  • Modely nezahrnují předpoklad naplnění kapacity zdravotní péče, které může významně ovlivnit počty úmrtí jak na COVID-19 tak i z jiných příčin.
  • Počty úmrtí jsou na webu MZ ČR zpětně revidována. To se týká zejména posledního čísla (tzn. dne poslední aktualizace), dopad na naši projekci by měl být zanedbatelný.
  • Model predikce může být ovlivněný počtem nákaz v jednotlivých věkových kategoriích. Pokud v posledním období rostl podíl nakažených starších osob na všech nakažených, může model skutečný počet úmrtí podceňovat a naopak.
  • Neověřovali jsme, zda jsou plně splněny předpoklady modelu, ale vysoká hodnota koeficientu determinace ukazuje slušnou předpovědní hodnotu modelu.
  • Model projektuje pouze střední hodnoty, skutečné počty úmrtí se budou lišit z důvodu přirozené variability. To zahrnuje i výše zmíněné rozdíly mezi pracovními a víkendovými dny.