¿De qué cifras estamos hablando cuando se dice que “lo peor” está por llegar?

En numerosas comparecencias en los medios, el Presidente del Gobierno Pedro Sánchez ha advertido e insistido en que lo peor de la pandemia del COVID1-9 estaba llegar. ¿Pero qué es exactamente lo peor? ¿De qué cifras estamos hablando? En este post analizo la trayectoria esperada de las variables clave de los efectos de la epidemia (contagios, camas de UCI necesarias y muertes) para las próximas semanas. Los números que se obtienen mediante la estimación de modelos epidemiológicos de crecimiento no lineal son demoledores y sirven para hacernos una idea de lo “que está por llegar” en los próximos días.

Recapitulación

En el post anterior del día 10 de marzo cuando lancé los pronósticos de contagiados hasta el 24, todavía estábamos en la fase de arranque y propagación inicial del COVID-19 por lo que suponer que la evolución de los contagiados podía caracterizarse estadísticamente mediante un modelo de crecimiento generalizado (Generalized Growth Model, GGM) a priori, era bastante razonable.

La comparación de los datos oficiales observados entre el 10 de marzo y el 20 de marzo, con el pronóstico a 10 días que se muestra en el Gráfico 1, sugiere que la capacidad del GGM de pronosticar la dinámica del COVID-19 es bastante elevada. En el horizonte de 10 días fuera de muestra sólo los datos del viernes 13 y viernes 20 se fueron del intervalo de confianza del 95%. Esto sugiere que el modelo es bastante fiable lo que está en línea con la evidencia empírica previa sobre el rendimiento predictivo a corto plazo de este tipo de modelos epidemiológicos.

Gráfico 1: Precisión del último pronóstico

Fig1_weeklyforecast

Sin embargo, la capacidad predictiva de cualquier modelo se deteriora conforme aumenta el horizonte de la predicción. A partir del 20 de marzo, la realidad se retrasó un día con respecto al pronóstico del modelo, de modo que lo que se predecía para el 21 ocurría el 22, para el 22 el día 23, etc. En el caso de la modelización de un proceso estadístico explosivo de naturaleza no lineal como el que subyace a la pandemia de COVID-19, el deterioro de los pronósticos es muy sustancial más allá de una semana. Esta incapacidad de predecir con exactitud lo que va a suceder explicaría la reticencia de las autoridades de hablar claro y por ello, los técnicos del gobierno no se mojan.  Sin embargo, un pronóstico probabilístico, en el que cada dato y trayectoria temporal tiene una probabilidad asociada, “nunca se equivoca”.  Puede pasar que lo que suceda finalmente tuviese muy poca probabilidad dada la información existente y se salga de los intervalos de confianza, pero es lo mejor y más honesto que podemos hacer.


La dinámica del COVID-19 y sus efectos sanitarios

Para poder analizar lo que va a suceder, la elección de un proceso generador al que ajustar los datos es importante. Aunque ya llevamos 9 días de cuarentena, la movilidad no se ha reducido por completo y existe un porcentaje relevante de gente que sigue desplazándose todos los días para trabajar. Además, teniendo en cuenta que el período de incubación del virus es de 7 días y que los retrasos promedio en procesar los tests son de 4-6 días (lo que hace que los datos publicados vayan siempre desfasados entre 11 y 13 días), es razonable suponer que hasta el día 28 de marzo no empezaremos a recibir los nuevos datos del patrón de propagación del virus post-cuarentena. Por tanto, mantener el supuesto de que un GGM puede ser preciso pronosticando al menos a 5-6 días vista es realista hasta el día 28/29 de marzo. A partir de estas fechas, una desaceleración sería plausible debido al efecto de la cuarentena, por lo que el análisis también incluye los pronósticos derivados de un modelo crecimiento logístico generalizado (LGM), que permite un punto de inflexión en la curva de contagios y estimar su pico.

Los resultados obtenidos con estos dos modelos que adjunto a continuación se refieren tanto a: (i) número de contagios esperados, (ii) número de camas UCI necesarias esperadas, como (iii) número de muertos esperado.

  • Contagios

Como se puede observar en la Tabla 1, según el GGM el número más probable de contagios con los datos oficiales a final de mes sería de 107 mil contagiados, lo que supondría que en menos de una semana podríamos haber superado a China.

Tabla 1: Evolución esperada del número de contagios

  Modelo de crecimiento exponencial generalizado (GGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 41.189 41.655 42.062
25/03/2020 47.718 48.263 49.549
26/03/2020 55.004 55.677 56.312
27/03/2020 63.127 63.965 64.808
28/03/2020 72.097 73.210 74.340
29/03/2020 82.056 83.486 84.954
30/03/2020 93.122 94.888 96.758
31/03/2020 105.333 107.529 109.826
01/04/2020 107.828 110.530 113.372
  Modelo de crecimiento logístico generalizado (LGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 40.109 40.949 41.892
25/03/2020 45.830 46.975 48.273
26/03/2020 51.899 53.482 55.303
27/03/2020 58.264 60.432 62.965
28/03/2020 64.847 67.790 71.256
29/03/2020 71.543 75.502 80.202
30/03/2020 78.307 83.509 89.794
31/03/2020 85.068 91.753 100.011
01/04/2020 91.758 100.173 110.826

Los resultados del modelo logístico, tanto de nuevos contagios como del total, se muestran en el Gráfico 2. Este es el modelo que permite una inflexión, y apunta a una crecimiento similar durante la próxima semana, aunque ligeramente más moderado. En este caso, para el 31 de marzo el escenario más plausible rondaría los 91.7 mil contagiados.

Gráfico 2: Evolución del total de contagiados

FIG3_TOTALCONTAGIOSLGM

La buena noticia que nos da el modelo logístico es que la fecha más probable del pico de nuevos contagios se produciría el día 3 de abril, tal y como se muestra en el Gráfico 3 (línea roja). A partir de esa fecha, el número de nuevos contagiados disminuiría. El valor más probable de estabilización de la epidemia implicado por el modelo se daría en el entorno de los 8500 nuevos contagiados. Sin embargo, el descenso se prevé lento, por lo que lo más probable es que para el 10 abril todavía no hayamos entrado en la fase estacionaria. En el escenario más optimista, pero muy poco probable, el pico se produciría el 1 de abril, haciendo el máximo de nuevos contagios en el entorno de 6690. El peor escenario implicaría que la fase de crecimiento de los nuevos contagiados no llegaría a su fin hasta el 11 de abril con 14 mil nuevos contagiados.

Gráfico 3: El pico de contagios

FIG4_PRONOSTICO_PEAK

  • Camas UCI

Un problema importante derivado da la propagación del COVID-19, es que el aluvión repentino de contagios con cuadros graves puede desbordar la capacidad de nuestro sistema de salud pública. Por lo general, la necesidad de camas de cuidados intensivos se corresponde a las personas que se contagiaron entre 10 y 14 días atrás y desarrollaron síntomas hace 1 semana. Por tanto, puesto que el crecimiento en contagios ha sido explosivo durante toda la semana, también es plausible suponer que la necesidad de camas UCI lo será durante la semana próxima.

Como se muestra en el Gráfico 4, los ingresos en la UCI han seguido un proceso ligeramente sub-exponencial.  Aunque se estén haciendo esfuerzos por ampliar la resiliencia del sistema sanitario ya sea (i) levantando nuevos hospitales y/o (ii) rehabilitando algunos en desuso, la estimación del stock de camas UCI en España es de unas 4633 (aproximadamente un 3.3% del total de camas de hospital). Desgraciadamente la trayectoria esperada de la ingresos en UCI que se muestra en el Gráfico 5, superará con un 97.5% de probabilidad la capacidad de carga base del sistema el día 28/03, ya que para esa fecha en el mejor de los casos harían falta 5869  camas UCI y en el peor de los escenarios unas 7364. Para el día 31 de marzo el número de camas UCI requerido por el sistema más probable será de unas 10602.

Gráfico 4: Ingresos UCI en España por COVID-19

Fig1ICU_GGM_IFit_24f_22m_ESP

Gráfico 5: Ingresos UCI  esperados

Ingresados_UCI_esperados

Por tanto, la única forma de absorber el shock pandémico de aquí a final de marzo en condiciones pasaría multiplicar por 2.88 (casi triplicar) el número de camas UCI con su debido equipamiento en un plazo de 10 días. Aunque es una tarea muy difícil, no sería imposible si el Estado pusiese en marcha toda su maquinaria. Por contextualizar el dato, este nivel de camas UCI está dentro de los estándares de países como Alemania que tiene 3 veces más camas de UCI que España.

El problema es que la reacción que está mostrando el aparato estatal en la gestión de la crisis está siendo terriblemente lenta y las necesidades van a ir en aumento (y de forma acelerada) conforme pase el tiempo por lo que no me parece muy arriesgado aventurar que la sanidad española colapsará la primera semana de abril cuando se enfrente a sobrecargas del 366% el 1 de abril, del 464% el 2 de abril y del 591% el 3, respectivamente.

Tabla 2:  Evolución esperada del número de ingresos en UCI

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.556 2.710 2.838
25/03/2020 3.153 3.390 3.579
26/03/2020 3.870 4.248 4.549
27/03/2020 4.774 5.330 5.790
28/03/2020 5.869 6.698 7.364
29/03/2020 7.167 8.420 9.361
30/03/2020 8.758 10.602 11.919
31/03/2020 10.693 13.389 15.261
01/04/2020 13.039 16.964 19.584
02/04/2020 15.899 21.527 25.200
03/04/2020 19.392 27.405 32.501
  • Defunciones

Otro dato negativo que está por materializarse es el de los fallecidos. Este dato es el que va más desfasado en el tiempo ya que según la OMS un paciente que desarrolla un cuadro agudo tarda entre 2 y 8 semanas en morir tras ser contagiado, por lo que de nuevo un GGM es apropiado para modelar la trayectoria de defunciones. En el Gráfico 6 se muestra la trayectoria de muertes esperadas con sus respectivas bandas de confianza.

Gráfico 6: Evolución esperada de defunciones

Curva_defunciones

El número de defunciones más probable por la pandemia es de 12402 para el 31 de marzo. Estos datos supondrían mortalidades superiores a las observadas en Italia. El pronóstico central a dos semanas vista, para el día 5 de abril, apunta a un saldo de más de 28 mil fallecidos, 2.5 veces superior a la cota mínima estimada por Victor García aquí, en el que se hacía el supuesto de que se lograría aplanar la curva de un modo similar a lo que hizo China. La Tabla 3 resume las estimaciones de fallecidos esperados.

Tabla 3:  Evolución esperada del número de muertes

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.722 2.867 3.022
25/03/2020 3.383 3.602 3.836
26/03/2020 4.172 4.494 4.850
27/03/2020 5.105 5.566 6.125
28/03/2020 6.218 6.848 7.704
29/03/2020 7.519 8.392 9.617
30/03/2020 9.016 10.229 11.935
31/03/2020 10.778 12.402 14.732
01/04/2020 12.839 14.964 18.100
02/04/2020 15.212 17.961 22.211
03/04/2020 17.936 21.486 27.159
04/04/2020 21.065 25.571 33.068
05/04/2020 23.431 28.575 37.443

 

Conclusiones y cuestiones abiertas

Los resultados de los modelos de crecimiento no lineal epidemiológicos estimados sugieren que el valor más probable de contagiados para el día 31 de marzo estará entre 91 mil y 107 mil (por encima de China), que el número de camas UCI necesaria para hacer frente al shock al sistema sanitario el 31 de marzo debería ser de 13899 (3 veces más que el stock disponible)  y que el número de defunciones más probable ascenderá a los 12402 mil casos (aproximadamente el doble de los que tiene Italia ahora mismo).

Obviamente la sobrecarga de la sanidad en la ventana de los días 28 de marzo al 3 de abril enmascara que hay comunidades autónomas que tienen más margen que otras para lograr el stock de camas UCIs necesarias para resistir. Sin embargo, todavía no tengo organizadas las estimaciones de la sobrecarga prevista para cada una de ellas los próximos días.

En cualquier caso los números efectivamente muestran que lo peor está por llegar.


Nota técnica: Para los que estén interesados en el ejercicio de modelización del que salen los números que presento les recomiendo leer este paper publicado en el Infectious Disease Modeling. La diferencia principal con este análisis es que en este post, en lugar de utilizar únicamente la información del modelo más reciente, hago un promediado de modelos y pronósticos, introduciendo un factor de olvido geométrico para implementar la ponderación. Así, los pronósticos generados con los modelos alimentados con los últimos datos tienen más peso en el pronóstico ensamblado que los pronósticos de modelos estimados con datos más alejados del presente. Este enfoque de model averaging tiene la ventaja de robustecer el pronóstico contra posibles outliers, artefactos estadísticos y/o fluctuaciones en los datos, que suelen generar grandes discrepancias en las trayectorias pronosticadas.

Fuentes: Wikipedia/Worldometers


Actualización 25/03  5.00h: Los tres datos publicados a última hora del 24/03 de 42,058 contagios acumulados (+19%), de 2,991(+28%) muertes en total  y de 2636 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad.

Actualización 26/03  1.50h: Los tres datos publicados a última hora del 26/03 de 49,515 contagios acumulados (+18%), de 3,647 (+22%) muertes en total  y 3,434 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad a 2 días del GGM. Para el LGM, el dato de contagios se va fuera del intervalo del 95%, al 2.5% superior de probabilidad.

Acerca de Vicente Rios

Soy investigador de macroeconometría aplicada, especializado en paneles espaciales dinámicos y técnicas de model averaging. Actualmente trabajo en cuestiones de desigualdad, conflicto, crecimiento, instituciones y medio ambiente. Web personal: https://sites.google.com/view/vicenterios/home
Esta entrada fue publicada en Sin categoría. Guarda el enlace permanente.

13 respuestas a ¿De qué cifras estamos hablando cuando se dice que “lo peor” está por llegar?

  1. dserquera dijo:

    Excelente artículo. Pequeña errata en tabla1 b. LGM en lugar de GGM.

    Me gusta

  2. dserquera dijo:

    Excelente artículo. En tabla1b LGM en lugar de GGM

    Me gusta

  3. Vicente Rios dijo:

    corregido david, thanks

    Me gusta

  4. Fito dijo:

    ¿De donde sacas que la necesidad de cuidados intensivos de un paciente oscila entre los 10 y 14 días después de haberse contagiado?. Eso no es correcto. La aparición de síntomas puede ocurrir dos días después de la infección (la tos por ejemplo) pero el cuadro de fiebre podría empezar 10-14 días después del contagio y complicarse en 6-7 días. Por lo tanto la necesidad de UCIs se daría entre 20-21 días después del contagio.

    Me gusta

  5. amparo dijo:

    ¿Cuál piensas que ha sido el número real de fallecidos en China?
    Muchos expertos dicen que del orden de 150000 muertos.

    Me gusta

  6. Tim dijo:

    Enhorabuena por el artículo. Da un poco de miedo ver la previsión de fallecimientos y la limitación de recursos críticos, basada en datos bastante fiables.
    Con respecto al número de contagiados, dada la escasa capacidad hasta ahora para detectarlos (a diferencia de otros países), no termina de convencerme (no x el cálculo, sino x la poca fiabilidad de los datos). He leído q dado el número de fallecidos podríamos llegar a 500k a mediados de abril.

    Me gusta

  7. Vicente Rios dijo:

    Hola Tim, efectivamente hay un artículo que resume formas de aproximar el número real de contagiados https://elpais.com/politica/2020/03/24/actualidad/1585077503_994849.html. Sería interesante rehacer las series de contagios teniendo en cuenta el under-reporting que hay. Teniendo en cuenta que se estima que la duración mediana entre contagio y muerte son 17.8~18 días y que la tasa Koreana es del 1.1% (creo que es más realista que el 1.38 que usan en el estudio del Imperial college que cita Kiko Llaneras) los 658 muertos del 25 de marzo sugieren que el día 8 de marzo en España había ya unos 59mil-60mil contagios. Suponiendo una duplicación semanal, hoy tendríamos 360mil contagios reales.

    Me gusta

  8. Vicente Rios dijo:

    Pues no sé si fiarme mucho la verdad. Lo que si que tengo bastante claro es que los contagiados en Wuhan han sido muchos más que los que han reportado.

    Me gusta

  9. Vicente Rios dijo:

    Es un rango aproximativo que sólo se usa para suponer que hay un margen de una semana de crecimiento cuasi-exponencial que no te la quita nadie. De hecho, no hay ningún valor que dependa de esa conjetura. Lo que tengo claro tras pensar en lo que comentas es que en todo caso, sería menos tiempo y no más (como el intervalo de 20-21 días que planteas). Piensa que la estimación que hay ahora es que el número mediano de días para la aparición de síntomas es 5 y que el 97.5 por ciento de las personas que desarrollan síntomas lo harán dentro de los 11.5 días posteriores a la infección https://www.sciencedaily.com/releases/2020/03/200317175438.htm
    Y la entrada la UCI sería siempre posterior a la aparición de síntomas. Si le das un par de días de retraso serían [7-13.5]. Por otro lado, se estima que entre el contagio y la muerte en promedio hay 17.8 días https://www.medrxiv.org/content/10.1101/2020.03.09.20033357v1
    Por tanto más de 18 días no tiene ningún sentido

    Me gusta

  10. Pepe Jepep dijo:

    Muchas gracias por el artículo, creo que este tipo de estimaciones y datos es lo que necesitamos saber, aunque sean terribles.

    Me gusta

  11. Riccardo dijo:

    Hola Vicente:
    Me llamo Riccardo, soy un estudiante italiano de un master en Big Data. Tu análisis me parece impresionante, el modelo tiene mucha fiabilidad. Te quería preguntar si estabas usando algún instrumento como Python o R y si tienes algún modelo predictivo sobre Italia. Lo necesitaría para un trabajo.
    Un saludo.

    Me gusta

  12. Pingback: Coronavirus (COVID-19)... | Raiden.tk

  13. Pingback: Coronavirus (COVID-19)... | Raiden.tk

Deja un comentario