En numerosas comparecencias en los medios, el Presidente del Gobierno Pedro Sánchez ha advertido e insistido en que lo peor de la pandemia del COVID1-9 estaba llegar. ¿Pero qué es exactamente lo peor? ¿De qué cifras estamos hablando? En este post analizo la trayectoria esperada de las variables clave de los efectos de la epidemia (contagios, camas de UCI necesarias y muertes) para las próximas semanas. Los números que se obtienen mediante la estimación de modelos epidemiológicos de crecimiento no lineal son demoledores y sirven para hacernos una idea de lo “que está por llegar” en los próximos días.
Recapitulación
En el post anterior del día 10 de marzo cuando lancé los pronósticos de contagiados hasta el 24, todavía estábamos en la fase de arranque y propagación inicial del COVID-19 por lo que suponer que la evolución de los contagiados podía caracterizarse estadísticamente mediante un modelo de crecimiento generalizado (Generalized Growth Model, GGM) a priori, era bastante razonable.
La comparación de los datos oficiales observados entre el 10 de marzo y el 20 de marzo, con el pronóstico a 10 días que se muestra en el Gráfico 1, sugiere que la capacidad del GGM de pronosticar la dinámica del COVID-19 es bastante elevada. En el horizonte de 10 días fuera de muestra sólo los datos del viernes 13 y viernes 20 se fueron del intervalo de confianza del 95%. Esto sugiere que el modelo es bastante fiable lo que está en línea con la evidencia empírica previa sobre el rendimiento predictivo a corto plazo de este tipo de modelos epidemiológicos.
Gráfico 1: Precisión del último pronóstico
Sin embargo, la capacidad predictiva de cualquier modelo se deteriora conforme aumenta el horizonte de la predicción. A partir del 20 de marzo, la realidad se retrasó un día con respecto al pronóstico del modelo, de modo que lo que se predecía para el 21 ocurría el 22, para el 22 el día 23, etc. En el caso de la modelización de un proceso estadístico explosivo de naturaleza no lineal como el que subyace a la pandemia de COVID-19, el deterioro de los pronósticos es muy sustancial más allá de una semana. Esta incapacidad de predecir con exactitud lo que va a suceder explicaría la reticencia de las autoridades de hablar claro y por ello, los técnicos del gobierno no se mojan. Sin embargo, un pronóstico probabilístico, en el que cada dato y trayectoria temporal tiene una probabilidad asociada, “nunca se equivoca”. Puede pasar que lo que suceda finalmente tuviese muy poca probabilidad dada la información existente y se salga de los intervalos de confianza, pero es lo mejor y más honesto que podemos hacer.
La dinámica del COVID-19 y sus efectos sanitarios
Para poder analizar lo que va a suceder, la elección de un proceso generador al que ajustar los datos es importante. Aunque ya llevamos 9 días de cuarentena, la movilidad no se ha reducido por completo y existe un porcentaje relevante de gente que sigue desplazándose todos los días para trabajar. Además, teniendo en cuenta que el período de incubación del virus es de 7 días y que los retrasos promedio en procesar los tests son de 4-6 días (lo que hace que los datos publicados vayan siempre desfasados entre 11 y 13 días), es razonable suponer que hasta el día 28 de marzo no empezaremos a recibir los nuevos datos del patrón de propagación del virus post-cuarentena. Por tanto, mantener el supuesto de que un GGM puede ser preciso pronosticando al menos a 5-6 días vista es realista hasta el día 28/29 de marzo. A partir de estas fechas, una desaceleración sería plausible debido al efecto de la cuarentena, por lo que el análisis también incluye los pronósticos derivados de un modelo crecimiento logístico generalizado (LGM), que permite un punto de inflexión en la curva de contagios y estimar su pico.
Los resultados obtenidos con estos dos modelos que adjunto a continuación se refieren tanto a: (i) número de contagios esperados, (ii) número de camas UCI necesarias esperadas, como (iii) número de muertos esperado.
- Contagios
Como se puede observar en la Tabla 1, según el GGM el número más probable de contagios con los datos oficiales a final de mes sería de 107 mil contagiados, lo que supondría que en menos de una semana podríamos haber superado a China.
Tabla 1: Evolución esperada del número de contagios
Modelo de crecimiento exponencial generalizado (GGM) | |||
Fecha | 2.5% inferior | Mediana | 97.5% Superior |
24/03/2020 | 41.189 | 41.655 | 42.062 |
25/03/2020 | 47.718 | 48.263 | 49.549 |
26/03/2020 | 55.004 | 55.677 | 56.312 |
27/03/2020 | 63.127 | 63.965 | 64.808 |
28/03/2020 | 72.097 | 73.210 | 74.340 |
29/03/2020 | 82.056 | 83.486 | 84.954 |
30/03/2020 | 93.122 | 94.888 | 96.758 |
31/03/2020 | 105.333 | 107.529 | 109.826 |
01/04/2020 | 107.828 | 110.530 | 113.372 |
Modelo de crecimiento logístico generalizado (LGM) | |||
Fecha | 2.5% inferior | Mediana | 97.5% Superior |
24/03/2020 | 40.109 | 40.949 | 41.892 |
25/03/2020 | 45.830 | 46.975 | 48.273 |
26/03/2020 | 51.899 | 53.482 | 55.303 |
27/03/2020 | 58.264 | 60.432 | 62.965 |
28/03/2020 | 64.847 | 67.790 | 71.256 |
29/03/2020 | 71.543 | 75.502 | 80.202 |
30/03/2020 | 78.307 | 83.509 | 89.794 |
31/03/2020 | 85.068 | 91.753 | 100.011 |
01/04/2020 | 91.758 | 100.173 | 110.826 |
Los resultados del modelo logístico, tanto de nuevos contagios como del total, se muestran en el Gráfico 2. Este es el modelo que permite una inflexión, y apunta a una crecimiento similar durante la próxima semana, aunque ligeramente más moderado. En este caso, para el 31 de marzo el escenario más plausible rondaría los 91.7 mil contagiados.
Gráfico 2: Evolución del total de contagiados
La buena noticia que nos da el modelo logístico es que la fecha más probable del pico de nuevos contagios se produciría el día 3 de abril, tal y como se muestra en el Gráfico 3 (línea roja). A partir de esa fecha, el número de nuevos contagiados disminuiría. El valor más probable de estabilización de la epidemia implicado por el modelo se daría en el entorno de los 8500 nuevos contagiados. Sin embargo, el descenso se prevé lento, por lo que lo más probable es que para el 10 abril todavía no hayamos entrado en la fase estacionaria. En el escenario más optimista, pero muy poco probable, el pico se produciría el 1 de abril, haciendo el máximo de nuevos contagios en el entorno de 6690. El peor escenario implicaría que la fase de crecimiento de los nuevos contagiados no llegaría a su fin hasta el 11 de abril con 14 mil nuevos contagiados.
Gráfico 3: El pico de contagios
- Camas UCI
Un problema importante derivado da la propagación del COVID-19, es que el aluvión repentino de contagios con cuadros graves puede desbordar la capacidad de nuestro sistema de salud pública. Por lo general, la necesidad de camas de cuidados intensivos se corresponde a las personas que se contagiaron entre 10 y 14 días atrás y desarrollaron síntomas hace 1 semana. Por tanto, puesto que el crecimiento en contagios ha sido explosivo durante toda la semana, también es plausible suponer que la necesidad de camas UCI lo será durante la semana próxima.
Como se muestra en el Gráfico 4, los ingresos en la UCI han seguido un proceso ligeramente sub-exponencial. Aunque se estén haciendo esfuerzos por ampliar la resiliencia del sistema sanitario ya sea (i) levantando nuevos hospitales y/o (ii) rehabilitando algunos en desuso, la estimación del stock de camas UCI en España es de unas 4633 (aproximadamente un 3.3% del total de camas de hospital). Desgraciadamente la trayectoria esperada de la ingresos en UCI que se muestra en el Gráfico 5, superará con un 97.5% de probabilidad la capacidad de carga base del sistema el día 28/03, ya que para esa fecha en el mejor de los casos harían falta 5869 camas UCI y en el peor de los escenarios unas 7364. Para el día 31 de marzo el número de camas UCI requerido por el sistema más probable será de unas 10602.
Gráfico 4: Ingresos UCI en España por COVID-19
Gráfico 5: Ingresos UCI esperados
Por tanto, la única forma de absorber el shock pandémico de aquí a final de marzo en condiciones pasaría multiplicar por 2.88 (casi triplicar) el número de camas UCI con su debido equipamiento en un plazo de 10 días. Aunque es una tarea muy difícil, no sería imposible si el Estado pusiese en marcha toda su maquinaria. Por contextualizar el dato, este nivel de camas UCI está dentro de los estándares de países como Alemania que tiene 3 veces más camas de UCI que España.
El problema es que la reacción que está mostrando el aparato estatal en la gestión de la crisis está siendo terriblemente lenta y las necesidades van a ir en aumento (y de forma acelerada) conforme pase el tiempo por lo que no me parece muy arriesgado aventurar que la sanidad española colapsará la primera semana de abril cuando se enfrente a sobrecargas del 366% el 1 de abril, del 464% el 2 de abril y del 591% el 3, respectivamente.
Tabla 2: Evolución esperada del número de ingresos en UCI
Fecha | 2.5% inferior | Mediana | 97.5% superior |
24/03/2020 | 2.556 | 2.710 | 2.838 |
25/03/2020 | 3.153 | 3.390 | 3.579 |
26/03/2020 | 3.870 | 4.248 | 4.549 |
27/03/2020 | 4.774 | 5.330 | 5.790 |
28/03/2020 | 5.869 | 6.698 | 7.364 |
29/03/2020 | 7.167 | 8.420 | 9.361 |
30/03/2020 | 8.758 | 10.602 | 11.919 |
31/03/2020 | 10.693 | 13.389 | 15.261 |
01/04/2020 | 13.039 | 16.964 | 19.584 |
02/04/2020 | 15.899 | 21.527 | 25.200 |
03/04/2020 | 19.392 | 27.405 | 32.501 |
- Defunciones
Otro dato negativo que está por materializarse es el de los fallecidos. Este dato es el que va más desfasado en el tiempo ya que según la OMS un paciente que desarrolla un cuadro agudo tarda entre 2 y 8 semanas en morir tras ser contagiado, por lo que de nuevo un GGM es apropiado para modelar la trayectoria de defunciones. En el Gráfico 6 se muestra la trayectoria de muertes esperadas con sus respectivas bandas de confianza.
Gráfico 6: Evolución esperada de defunciones
El número de defunciones más probable por la pandemia es de 12402 para el 31 de marzo. Estos datos supondrían mortalidades superiores a las observadas en Italia. El pronóstico central a dos semanas vista, para el día 5 de abril, apunta a un saldo de más de 28 mil fallecidos, 2.5 veces superior a la cota mínima estimada por Victor García aquí, en el que se hacía el supuesto de que se lograría aplanar la curva de un modo similar a lo que hizo China. La Tabla 3 resume las estimaciones de fallecidos esperados.
Tabla 3: Evolución esperada del número de muertes
Fecha | 2.5% inferior | Mediana | 97.5% superior |
24/03/2020 | 2.722 | 2.867 | 3.022 |
25/03/2020 | 3.383 | 3.602 | 3.836 |
26/03/2020 | 4.172 | 4.494 | 4.850 |
27/03/2020 | 5.105 | 5.566 | 6.125 |
28/03/2020 | 6.218 | 6.848 | 7.704 |
29/03/2020 | 7.519 | 8.392 | 9.617 |
30/03/2020 | 9.016 | 10.229 | 11.935 |
31/03/2020 | 10.778 | 12.402 | 14.732 |
01/04/2020 | 12.839 | 14.964 | 18.100 |
02/04/2020 | 15.212 | 17.961 | 22.211 |
03/04/2020 | 17.936 | 21.486 | 27.159 |
04/04/2020 | 21.065 | 25.571 | 33.068 |
05/04/2020 | 23.431 | 28.575 | 37.443 |
Conclusiones y cuestiones abiertas
Los resultados de los modelos de crecimiento no lineal epidemiológicos estimados sugieren que el valor más probable de contagiados para el día 31 de marzo estará entre 91 mil y 107 mil (por encima de China), que el número de camas UCI necesaria para hacer frente al shock al sistema sanitario el 31 de marzo debería ser de 13899 (3 veces más que el stock disponible) y que el número de defunciones más probable ascenderá a los 12402 mil casos (aproximadamente el doble de los que tiene Italia ahora mismo).
Obviamente la sobrecarga de la sanidad en la ventana de los días 28 de marzo al 3 de abril enmascara que hay comunidades autónomas que tienen más margen que otras para lograr el stock de camas UCIs necesarias para resistir. Sin embargo, todavía no tengo organizadas las estimaciones de la sobrecarga prevista para cada una de ellas los próximos días.
En cualquier caso los números efectivamente muestran que lo peor está por llegar.
Nota técnica: Para los que estén interesados en el ejercicio de modelización del que salen los números que presento les recomiendo leer este paper publicado en el Infectious Disease Modeling. La diferencia principal con este análisis es que en este post, en lugar de utilizar únicamente la información del modelo más reciente, hago un promediado de modelos y pronósticos, introduciendo un factor de olvido geométrico para implementar la ponderación. Así, los pronósticos generados con los modelos alimentados con los últimos datos tienen más peso en el pronóstico ensamblado que los pronósticos de modelos estimados con datos más alejados del presente. Este enfoque de model averaging tiene la ventaja de robustecer el pronóstico contra posibles outliers, artefactos estadísticos y/o fluctuaciones en los datos, que suelen generar grandes discrepancias en las trayectorias pronosticadas.
Fuentes: Wikipedia/Worldometers
Actualización 25/03 5.00h: Los tres datos publicados a última hora del 24/03 de 42,058 contagios acumulados (+19%), de 2,991(+28%) muertes en total y de 2636 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad.
Actualización 26/03 1.50h: Los tres datos publicados a última hora del 26/03 de 49,515 contagios acumulados (+18%), de 3,647 (+22%) muertes en total y 3,434 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad a 2 días del GGM. Para el LGM, el dato de contagios se va fuera del intervalo del 95%, al 2.5% superior de probabilidad.
Excelente artículo. Pequeña errata en tabla1 b. LGM en lugar de GGM.
Excelente artículo. En tabla1b LGM en lugar de GGM
corregido david, thanks
¿De donde sacas que la necesidad de cuidados intensivos de un paciente oscila entre los 10 y 14 días después de haberse contagiado?. Eso no es correcto. La aparición de síntomas puede ocurrir dos días después de la infección (la tos por ejemplo) pero el cuadro de fiebre podría empezar 10-14 días después del contagio y complicarse en 6-7 días. Por lo tanto la necesidad de UCIs se daría entre 20-21 días después del contagio.
¿Cuál piensas que ha sido el número real de fallecidos en China?
Muchos expertos dicen que del orden de 150000 muertos.
Enhorabuena por el artículo. Da un poco de miedo ver la previsión de fallecimientos y la limitación de recursos críticos, basada en datos bastante fiables.
Con respecto al número de contagiados, dada la escasa capacidad hasta ahora para detectarlos (a diferencia de otros países), no termina de convencerme (no x el cálculo, sino x la poca fiabilidad de los datos). He leído q dado el número de fallecidos podríamos llegar a 500k a mediados de abril.
Hola Tim, efectivamente hay un artículo que resume formas de aproximar el número real de contagiados https://elpais.com/politica/2020/03/24/actualidad/1585077503_994849.html. Sería interesante rehacer las series de contagios teniendo en cuenta el under-reporting que hay. Teniendo en cuenta que se estima que la duración mediana entre contagio y muerte son 17.8~18 días y que la tasa Koreana es del 1.1% (creo que es más realista que el 1.38 que usan en el estudio del Imperial college que cita Kiko Llaneras) los 658 muertos del 25 de marzo sugieren que el día 8 de marzo en España había ya unos 59mil-60mil contagios. Suponiendo una duplicación semanal, hoy tendríamos 360mil contagios reales.
Pues no sé si fiarme mucho la verdad. Lo que si que tengo bastante claro es que los contagiados en Wuhan han sido muchos más que los que han reportado.
Es un rango aproximativo que sólo se usa para suponer que hay un margen de una semana de crecimiento cuasi-exponencial que no te la quita nadie. De hecho, no hay ningún valor que dependa de esa conjetura. Lo que tengo claro tras pensar en lo que comentas es que en todo caso, sería menos tiempo y no más (como el intervalo de 20-21 días que planteas). Piensa que la estimación que hay ahora es que el número mediano de días para la aparición de síntomas es 5 y que el 97.5 por ciento de las personas que desarrollan síntomas lo harán dentro de los 11.5 días posteriores a la infección https://www.sciencedaily.com/releases/2020/03/200317175438.htm
Y la entrada la UCI sería siempre posterior a la aparición de síntomas. Si le das un par de días de retraso serían [7-13.5]. Por otro lado, se estima que entre el contagio y la muerte en promedio hay 17.8 días https://www.medrxiv.org/content/10.1101/2020.03.09.20033357v1
Por tanto más de 18 días no tiene ningún sentido
Muchas gracias por el artículo, creo que este tipo de estimaciones y datos es lo que necesitamos saber, aunque sean terribles.
Hola Vicente:
Me llamo Riccardo, soy un estudiante italiano de un master en Big Data. Tu análisis me parece impresionante, el modelo tiene mucha fiabilidad. Te quería preguntar si estabas usando algún instrumento como Python o R y si tienes algún modelo predictivo sobre Italia. Lo necesitaría para un trabajo.
Un saludo.
Pingback: Coronavirus (COVID-19)... | Raiden.tk
Pingback: Coronavirus (COVID-19)... | Raiden.tk