¿Por qué el uso obligatorio de mascarilla en el exterior no tiene ningún sentido?

La propagación del SARS-CoV-2 por transmisión aérea en espacios cerrados está ampliamente aceptada. Sin embargo, la probabilidad de transmisión por el aire al aire libre depende de varios parámetros, aún bastante inciertos: concentraciones de aerosoles cargados de virus, viabilidad y duración, dosis mínima necesaria para transmitir la enfermedad.

En este trabajo de Belosi et al. (2021) publicado en el Journal of Environmental Research los autores realizan una estimación de las concentraciones al aire libre en el norte de Italia (región de Lombardia) utilizando un enfoque de modelo de caja simple, basado en una estimación de las emisiones respiratorias y para las ciudades de Milán y Bérgamo (Italia).  Además, investigan la probabilidad de interacción del aerosol cargado de virus con partículas preexistentes de diferentes tamaños.

Los resultados indican concentraciones promedio al aire libre muy bajas (<1 copia de ARN / m3) en áreas públicas, excluidas las zonas concurridas, incluso en el peor de los casos y asumiendo una cantidad de infecciones hasta el 25% de la población.

En promedio, asumiendo un número de infecciones igual al 10% de la población (es decir, una IA de 10 mil por 100mil, o unas diez veces peor que en el peor momento de la pandemia), el tiempo necesario para inspirar un cuanto (es decir, la dosis de núcleos de gotitas en el aire requerida para causar infección en el 63% de las personas susceptibles) sería de 31,5 días en Milán (rango 2,7-91 días) y 51,2 días en Bérgamo (rango 4,4-149 días).

Fig. 2
Fig. 3

Por lo tanto, la probabilidad de transmisión aérea debido a aerosoles respiratorios es MUY BAJA en condiciones exteriores.

También muestran que la probabilidad de que el aerosol cargado de virus se adhiera a partículas atmosféricas preexistentes (se ha hablado mucho de las PM2.5 o PM10) resultó ser insignificante, por lo que los resultados aplican también a ciudades densas y con un elevado nivel de contaminación.

Por tanto, la evidencia científica muestra que la ley que se ha aprobado hoy en España y que regula el uso obligatorio de mascarilla en todo momento no tiene ningún fundamento.
Parece que en el gobierno no hay nadie leyéndose lo que va saliendo…

Publicado en Sin categoría | Deja un comentario

La prohibición de fumar en terraza de muchas regiones en España carece de fundamento científico

  La preocupación por la posible transmisión del virus a través del humo de cigarrillo exhalado por fumadores es perfectamente legítima, pero no está justificada ni basada en ninguna evidencia. De hecho, sólo hay un estudio de un grupo de pakistaníes (ver Ahmed et al., 2020) publicado en el journal de medicina de Pakistán que haya analizado la cuestión y sobre todo, muchas opiniones. Por otro lado, la preocupación por la salud de los fumadores en el caso del COVID-19 tampoco está justificada, ya que si bien es cierto que una vez en el hospital suelen tener peor evolución (Faraslinos et al., 2020a), tienen mucha menos probabilidad de entrar en el hospital que el resto de la población (Farsalinos et al., 2020b, Israel et al., 2020; Wenzl, 2020)

En España, a raíz de la prohibición del verano pasado de fumar en terrazas de Galicia (tomada sin ninguna evidencia científica) un elevado número de Comunidades Autónomas rápidamente se unió al festival de restricciones. Actualmente, parece ser que la prohibición ya se ha levantado en Galicia, pero permanece en muchas otras. La justificación teórica que motivó esta restricción es que el coronavirus se transmite mediante aerosoles y que el humo exhalado por cigarrillos, e-cigarrillos o vapeadores podría transportar el virus con capacidad infectiva y favorecer la transmisión de la enfermedad. De momento no hay prueba de ello y en cualquier caso, el riesgo epidémico de permitir/prohibir fumar debe ponerse en contexto con el riesgo de otras actividades respiratorias

Así, hace apenas un mes, un artículo en la revista científica internacional “Journal of Environmental Research and Public Health” elaborado por (Sussman et al., 2021) muestra (y menciona explícitamente en la discusión de sus resultados) que la prohibición de fumar en las terrazas adoptada en España es absurda y no tiene fundamentos científicos.

En sus palabras:

“… Prohibir el vapeo en espacios al aire libre completamente abiertos aludiendo a la eliminación de la máscara o la posible transmisión de fómites tiene una justificación débil y extremadamente especulativa, especialmente en espacios abiertos como terrazas de restaurantes o al aire libre.  Lamentablemente, el Consejo Interterritorial del Sistema Nacional de Salud en España ha invocado precisamente en su documento de posicionamiento la necesidad de proteger a la ciudadanía del contagio del COVID-19 sobre bases débiles para justificar una prohibición a nivel nacional de fumar y vapear en todos los espacios exteriores (incluso espacios completamente abiertos)

… Las autoridades sanitarias españolas no aportan pruebas empíricas de que se haya producido un contagio real de COVID-19 a través de vapeo o exhalaciones de tabaco ni una justificación técnica coherente que respalde su plausibilidad, pero, sin embargo, invocan el principio de precaución para justificar la aplicación de esta prohibición al menos durante el período de vigencia”

De hecho, los autores del estudio platean mediante un riguroso ejercicio de modelización y calibración de parámetros (para los interesados, ver los detalles aquí) que la actividad de vapear y fumar es una actividad respiratoria relativamente infrecuente e intermitente con una tasa de emisión media de 79.82 gotas (media = 6-200, std = 74.66) que sólo añade un riesgo del 1% al hecho de respirar sin mascarilla en un espacio cerrado, por lo que es prácticamente irrelevante desde el punto de vista de la gestión de la epidemia.

La figura abajo, muestra que, comparado con otras actividades permitidas, el incremento del riesgo de contagio viral asociado al hecho de vapear/fumar es casi nulo.  

De hecho, según las estimaciones de estos investigadores, el incremento de riesgo de contagio asociado a fumar es un 43-175% inferior al de hablar 6–24 min por hora y un 259% inferior al de toser cada dos minutos. Estos resultados aplican igualmente al caso de los cigarrillos convencionales, en los que el 80% de los aerosoles no están relacionados con el sistema respiratorio sino con la quema del cigarro).

Sin embargo, vivimos en el único país del mundo en el que se permite comer y hablar en interiores durante más de media hora (donde el riesgo de contagio es mucho más elevado) pero se prohíbe fumar en el exterior de las terrazas, incluso cuando hay distancia de seguridad.

PD: Dedicado a los técnicos y consejeros de la Generalitat Valenciana y otras tantas regiones.

Publicado en covid-19, fumar, Sin categoría | Etiquetado , , | Deja un comentario

¿En qué momento estamos de la epidemia de COVID-19?

La “segunda ola” de COVID-19 ya está causando estragos en toda Europa y el debate sobre los confinamientos de todo tipo e intensidad está abierto. Un elemento importante que ha dificultado la toma de decisiones durante este período, y que sigue distorsionándolo todo, ha sido la mala calidad de los datos.

Así, los que seguimos la evolución de la curva epidémica diariamente, solemos encontrarnos con una imagen fuertemente distorsionada (ver Gráfico 1), ya que las estadísticas oficiales muestran un patrón ascendente de nuevos casos para los cinco países más importantes de Europa. Si tomásemos por buenos estos datos, deberíamos concluir que la segunda ola estaría siendo mucho más intensa que la primera en términos de incidencia.

Gráfico 1. Evolución temporal de los nuevos casos (datos oficiales)

Sin embargo, en este post muestro que la situación actual, aunque es preocupante, al compararse con la situación de primavera de 2020 todavía es bastante buena para la mayoría de los países analizados (sólo Alemania está igual que en marzo) y que las medidas restrictivas, esta vez parece que sí que se están tomado a tiempo.

Ahora bien, para poder comparar la incidencia entre las oleadas, hay que corregir las series históricas de contagios de los diferentes países durante la “primera ola”, ya que están plagadas de errores de medida. Esto se debe a que en la primera oleada de primavera de 2020 sólo se detectó una fracción pequeña del verdadero número de casos (un promedio del 10%). Este nivel contrasta con la elevada capacidad de detección actual (que oscila entre el 80- 100%), tal y como se ve en el Gráfico 2.

Gráfico 2.  Porcentaje de casos de COVID-19 detectados con respecto al total

Para (i) corregir los datos de nuevos casos por los problemas de “under-reporting” y aportar una imagen más realista de lo ocurrido, (ii) así como para ubicarnos en el momento en el contexto en el que estamos ahora; la estimación del porcentaje de casos detectado con respecto al total es crucial. Para llevarla a cabo, he empleado el algoritmo de corrección de Nishuira et al. (2009) que sirve para estimar la incidencia en tiempo real de brotes epidémicos. La forma genérica de corregir las series oficiales de un brote epidémico que propone Nishiura et al. (2009) y que ha sido utilizada por el grupo de investigación de la London School of Hygiene & Tropical Medicine para el caso del COVID-19 (y que replico aquí),  parte de dos observaciones clave.

  • La primera es que una simple división del número de defunciones totales (Dt) entre los casos totales (Ct) en un período t, la denominada naive fatality rate (nCFR=Dt/Ct), es una estimación sesgada de la letalidad real, ya que muchos de esos casos no están resueltos. Es decir, no se sabe con certeza si se recuperarán o no. Esto es así ya que el curso de la enfermedad lleva un tiempo, y existe un desfase o retardo temporal entre contagio y defunción.
  • El segundo hecho es que, aun cuando consigamos una CFR ajustada (CFRa) por los desfases temporales y dividamos las muertes por los contagios en el período que sucedieron con más probabilidad, esas estimaciones de letalidad tenderán a sobreestimar la verdadera letalidad de la enfermedad.

Gráfico 3. Ratio letalidad ingenua: Defunciones totales / Contagios totales

Como puede observarse en el Gráfico 3, según las estadísticas oficiales, la tasa de letalidad ingenua (o nCFR) de España, Francia, Italia o Reino Unido hasta bien entrado el verano ha estado por encima del 10%, lo que no es realista. De hecho, el consenso de la literatura científica (ver aquí, aquí,  aquí o aquí) es que la verdadera letalidad por contagiado está en el rango del 1 al 1.5%. La estimación de letalidad ajustada por retrasos temporales (CFRa) de casos con resultados ciertos también sufre de un problema de sobre-estimación, ya que  hasta el verano, sólo se detectaba una proporción de los casos reales. Así que para corregir esto sesgo, se asume que los excesos de la CFRa con respecto a “la mejor estimación posible” pueden atribuirse a una falta de detección.

Aunque la letalidad puede variar por países y en el tiempo (y con los años puede que converja a un valor entre el 0.5% y el 1% tal y como plantea la OMS),  asumiré que “la mejor estimación posible de letalidad” para el período estudiado y para todos los países considerados es del 1.25%, aún a riesgo de sobreestimar el tamaño real de la epidemia en algunos e infraestimarlo en otros.

Para el caso de España una letalidad del 1.25% es algo superior al 1.16% que arrojó el estudio serológico a 22 de junio (28.3 mil muertos/ 2.47 millones de infectados con anticuerpos) pero me parece un valor bastante razonable.  Por un lado, los datos del MoMo sugieren que los muertos están muy infraestimados (lo que tendería a aumentar bastante el numerador). De otro lado, sabemos que hay una proporción de población que, aunque se infecte y supere la enfermedad, pierde los anticuerpos rápidamente. En la muestra representativa del estudio de seroprevalencia, el 15% perdió anticuerpos a lo largo de las olas del estudio que duró 2 meses (lo que también sube el denominador y cancelaría parcialmente el efecto de infraestimar las defunciones). Por tanto, si tenemos en cuenta este 15% de población adicional que pierde anticuerpos, cualquier estimación fiable de lo ocurrido, para el 22 de junio, debería dar como poco un total 2.8 millones de infectados.

Si usamos el porcentaje de casos no detectados cada período, se puede obtener la magnitud real de la epidemia en cada periodo. Un elemento que le da credibilidad a esta estimación basada en Nishiura et al. (2009) es que, para España a fecha de 22 de junio, este cálculo situaba el impacto de la epidemia en 2.95 millones de casos > 2.8 millones.

Así pues, tal y como puede observarse a continuación, las curvas epidémicas del COVID-19 que se derivan de este análisis, tanto para el caso de España como para el resto de países, son  muy diferentes de los datos oficiales.

Gráfico 4. Comparación datos oficiales vs datos reales: España

Gráfico 5. Nuevos casos por países: datos oficiales vs reales  Estos gráficos son clave para comprender la situación actual.

  • Muy lejos de estar batiendo récords cada día, el esfuerzo que se está realizando con el distanciamiento social, el uso de mascarilla y confinamientos parciales de todo tipo, está dando sus frutos ya que aunque 20 mil – 25 mil casos diarios son muchos, estas cifras no tienen nada que ver con la explosión y el pico de primavera, que para España se situó en unos 143 mil casos diarios el día 26 de marzo. Por poner el dato en contexto: a 4/5 de noviembre, estamos registrando aproximadamente 6 veces menos casos diarios que en el pico real.
  • Si se tiene en cuenta el conjunto de infecciones totales con los datos corregidos, el número total de infecciones asciende a 4 millones. Es decir, ya hay un 8.5% de la población que ha pasado la enfermedad. De nuevo, este dato contrasta con la cifra oficial de 1.2 millones o del 2.6% de la población.
  • En el período de 5 meses del 22 de febrero al 22 junio, se estima que se contagiaron aproximadamente 3 millones mientras que en los 4 meses y medio del 21 de junio al 5 de noviembre, sólo se han contagiado 1 millón de personas. Es decir, los primeros 5 meses son un 74% de los casos. Así pues, hemos ralentizado sustancialmente la velocidad de la epidemia y le hemos quitado casi un 66% de efectividad de transmisión al coronavirus.
  • Otra lección que podemos extraer al comparar lo sucedido recientemente en otros países, es que los gobiernos de Francia y Reino Unido, tras observar un fuerte acelerón en los casos y superar los umbrales del 50-20% de incidencia del pico de primavera, han endurecido las restricciones al máximo. Esto sugiere que en España, con incidencias > 45 mil casos un último endurecimiento de las restricciones y la vuelta al confinamiento domiciliario sería muy probable.

Con los datos del 4/5 de noviembre, en España, estamos al 17% del pico de marzo, por lo que todavía hay un cierto margen de tiempo y maniobra. Sin embargo, registros diarios de 20mil casos (unos 6000-7000 muertos al mes) a la larga podrían ser insostenibles para la capacidad hospitalaria. Llegados a este punto, si se estima que finalmente se va a tener que tomar la medida del confinamiento domiciliario, lo mejor sería ejecutarla cuanto antes para que la bajada de la curva fuese más rápida y se pudiese salvar la Navidad. Obviamente este confinamiento no debería ser tan duro para bajar la curva, ya que como he mostrado, la incidencia actual es 6 veces menor que la de marzo.

Publicado en Epidemics | Deja un comentario

Las Curvas de COVID-19 de Italia y España, 6 meses después

Este gráfico de la trayectoria de contagios acumulada de Italia y España, muestra que si bien fuimos unos días por detrás en el comienzo de la pandemia, les pasamos a comienzos de abril y mantuvimos distancias hasta junio, desde julio la divergencia se ha vuelto brutal.

contagios_ita_esp

Esa divergencia no está provocada por causas estructurales invariantes en el tiempo tipo distribución de riqueza, la descentralización, el civismo, la densidad de población o hacinamiento, ya que esas variables cambian lentamente y son similares entre ambos países. Las condiciones iniciales post-confinamiento tampoco parecen importantes. Unos 40-50 días después del desconfinamiento (nosotros salimos el 10 de mayo y ellos el 17), teníamos el mismo diferencial entre países que en las fechas de la desescalada de mayo, por lo que no habría cambiado mucho alargarlo hasta final de mayo. Sin embargo, a partir de la segunda mitad de junio, las curvas comienzan a separarse hasta que la brecha se hace gigante y en 3 meses acabamos acumulando 400 mil casos detectados más que ellos.

¿Qué es lo que ha pasado en este período?

Mi hipótesis es que son elementos de gestión los que marcan las diferencias:

(1) Contratación de rastreadores y vigilancia epidemiológica. Ellos dejan la ratio en 1 o 2 rastreadores por cada 10 mil habitantes y saben adscribir el origen de la mayoría de brotes. En España, la ratio de rastreadores en muchos sitios sigue a menos de 0.5 por 10 mil habitantes. Esto es MUY importante cuando tienes niveles bajos de transmisión para seguir dejándola en un nivel bajo. Puesto que este virus se propaga en oleadas muy asimétricas (de modo que una persona puede infectar a muchísimas más mientras que muchas infectadas contagiar a muy pocos), si no detectas muy bien los eventos de supercontagio cuando hay pocos casos, al tiempo se produce un efecto “bola de nieve”, los brotes se remezclan y se descontrola.

(2) Restricciones a tiempo y apropiadas. Aunque las mascarillas en espacios abiertos algo hacen (en Italia no son obligatorias salvo en espacios cerrados), dado que la transmisión es mucho más probable en espacios cerrados que al aire libre; lo importante es no permitir aglomeraciones en espacios cerrados. En esto hemos fallado.
En España el cierre del ocio nocturno se produce cuando ya estábamos con un volumen de casos casos diarios 10 veces más alto. En Italia cierran el 17 de agosto con 450 casos, nosotros el 14 con 5500. En el transporte sucede algo similar. Ellos han mantenido los transportes públicos a capacidad baja, para respetar las distancias y evitar densidad. En España no.

(3) Control de fronteras y casos importados. Por ejemplo, en Italia se establecen puestos de testeo en los parkings de los aeropuertos, lo que permite mantener el nivel de casos importados bajo sin que se te desmadre. Alternativamente si vas allí, estás obligado a presentar un test realizado en las últimas 48 horas, con un resultado negativo en función del país del que vengas. Esto es así, al menos desde mediados de agosto. Y aunque este factor sea posiblemente una causa menor para explicar la brecha  ya que la divergencia comienza antes, seguro que ha contribuido en el último mes y medio.

Publicado en Sin categoría | Deja un comentario

Escenarios de desconfinamiento temprano para España a partir de un modelo epidemiológico SEIR ¿Qué podemos esperar?

COVID SEIREste lunes el gobierno español ha decidido empezar la primera fase de desconfinamiento. Vamos a intentar anticipar diversas hipótesis razonables de cómo podría ir la cosa según diversos supuestos y mediante el uso de un modelo SEIR (Susceptible, Expuesto, Infeccioso, Recuperado).

 

Modelo Benchmark: Corea del Sur

Para ello hemos ajustado un modelo con los datos de Corea del Sur tanto para las curvas de infecciosos como para la de decesos para poder estar seguros de que los parámetros básicos del modelo tenían sentido.

Lo que encontramos es que la mortalidad en Corea se está moviendo en un rango de 0.3 a 0.6 y que el período de incubación y de infecciosidad puede asumirse como de 5 días. Además se observa que el reporting de infecciosos y de muertos va más o menos con un decalaje temporal similar de unas dos semanas (14 días) desde el contagio. Asumimos para corea un supuesto de reporting de infecciosos de un 88% , uno de los más altos y que concuerda con otros estudios realizados al respecto: https://cmmid.github.io/topics/covid19/severity/global_cfr_estimates.html

El supuesto será algo conservador, ya que el underrerporting podría ser aún mayor y probablemente tampoco constante sino variable en el tiempo. Pero para poder desarrollar un modelo “boceto” para España ya nos servirá. Basados en los datos de Corea asumimos para España un rango de mortalidad algo superior, del 0.4 al 0.6% según el tramo. Esto es debido a un mayor envejecimiento de la población, un mayor contacto social y también a una mayor saturación del sistema sanitario en el pico de la pandemia.

Asumimos, a tenor de los datos observacionales, que ya estamos transitando el pico de casos activos con lo que en breve deberíamos iniciar la curva descendente. También que, según el estudio citado más arriba, España tiene un reporting del 10% del total de infecciosos. Es decir que hay 10 veces más contagiados de los que se ha dado cuenta oficialmente. Algo lógico debido a la poca atención inicial que las autoridades españolas prestaron al virus y que concuerda también con el hecho de que el virus tuvo que estar circulando por debajo del radar ya durante todo el mes de febrero y probablemente también desde finales de enero. Esa es la clave que explica porque en marzo explota casi de golpe como salido de la nada. Momento en el que la base de infectados es suficiente para que los casos graves lleguen en cantidades relevantes al sistema sanitario.

Escenario no confinado vs confinado

La primera decisión de confinamiento se toma el dia 14 de marzo. Bastante tarde pero aún así suficientemente antes de que la cosa llegue a niveles desmesurados. De no haber hecho nada las consecuencias habrían sido funestas y nos habrían dejado en cifras por encima de los 200.000 muertos solo en casos confirmados y en apenas dos meses, probablemente muchos más debido a una saturación del sistema sanitario fuera de toda escala.

 

Spain1

Y es que la R0 sin contención para España era de alrededor de 5. Un valor altísimo, sin duda.

Escenario con una sola fase de confinamiento a R0 = 1

Gracias a la primera fase de confinamiento parcial en la que aún se mantuvo cierta movilidad laboral no esencial (la llamaremos “parcial1”) hemos curvado la curva lo suficiente para limitar el efecto y contener la cifra de decesos en un máximo de 50.000 por ahora. La R0 ha bajado y se ha situado en alrededor de 1 al menos hasta la segunda fase de confinamiento (la llamaremos “total”).

Dado que el desfase temporal en los datos de infectados es de unas dos semanas será ahora cuando notemos el efecto de esa segunda fase de confinamiento, la total. El problema es que como no tenemos datos del descenso nos es imposible inferir la eficacia de ese confinamiento y es por eso que creemos que la decisión del gobierno es algo imprudente. En teoría estamos justo atravesando la zona pico de casos activos y no podemos aún modelizar con garantías la curva de descenso como hemos hecho para Corea. Así que lo más que podemos hacer son supuestos. Así mismo, al levantar parcialmente el confinamiento corremos el riesgo de que se baje la guardia y nos vayamos de nuevo a valores de la R0 mayores que 1.

 

Escenario de confinamiento en dos fases: 14 a 28 con R0=1 y 28 en adelante con R0=0.7

Asumiendo que no levantamos el confinamiento total y que este ha sido con una R0 como la de Corea, de 0.7 (este dato es el que podremos cuantificar en esta semana del 13 al 19, de ahí la inevitable incertidumbre de los escenarios que siguen). De seguir así hasta el control definitivo de la primera oleada de la epidemia la curva sería bastante buena, dentro de la catástrofe y nos quedaría tal que así:

 

Escenario de confinamiento en tres fases: 14 a 28 con R0=1 , 28 a 12 con R0=0.7 y 12 en adelante con R0=1

Y ahora, ¿qué ocurrirá si dentro de 15 días volvemos a repercutir una R0 de valor 1 tras la reapertura parcial de este lunes? Pues aunque la cosa empeoraría algo la verdad es que seguiría siendo un resultado aceptable, si consideramos aceptable, asumir unas 10.000 muertes más claro está. Aunque si aceptamos el hecho de que, por ahora, con los confinamientos lo único que estamos haciendo es ganar tiempo para descongestionar el sistema sanitario y pertrecharnos de equipamiento, entonces muchos decesos no los estaríamos realmente evitando sino solo retrasando en el tiempo. Al menos hasta que se encuentre un tratamiento o vacuna eficaz. Lo cual puede no ocurrir nunca, no al menos en el curso de la epidemia que podemos intuir que sera de 1 a 3 años en distintas oleadas sucesivas. Lo que quiero decir es que este escenario, siendo peor que el anterior sigue no es ni tan malo habida cuenta de donde nos situamos ahora mismo.

Escenario de confinamiento en tres fases: 14 a 28 con R0=1 , 28 a 12 con R0=0.7 y 12 en adelante con R0=1.15

El riesgo que veo en empezar a desconfinar tan pronto es que la fase tres, la “parcial2” la llamaremos, podría regresar a valores superiores a 1 si nos confiamos y se baja la guardia. ¿Qué pasaría si por un casual se regresa tan solo a un valor de R0 de 1.15?

Pues a poco que en la tercera fase de confinamiento volvamos a una R0 superior a 1 tendremos un rebrote lo que nos podría llevar a duplicar la cifra de muertos respecto al curso actual y alargar la crisis en el tiempo. Y todo eso confiando que la R0 haya bajado ya sustancialmente durante la fase de confinamiento total. Algo que tampoco sabemos aún. En conclusión, el gobierno está decidiendo a ciegas. Podría acertar y si lo hace será por casualidad. Pero si yerra, debido a las dos semanas de desfase con las que recibimos los datos, nos daremos cuenta de nuevo demasiado tarde y la tendremos liada otra vez.

Escenario de confinamiento en dos fases: 9 a 23 con R0=1 y 23 en adelante con R0=0.7

Y ahora como bonus vale la pena preguntarse, ¿qué habría ocurrido si se hubiese actuado tan solo 5 días antes en vez de estar perdiendo el tiempo negando las evidencias para poder llegar abiertos hasta el 8M? Y este es el resultado, habríamos logrado controlar la epidemia en torno a los 12.000 decesos confirmados:

Probablemente no sea muy equivocado afirmar que si el 8M hubiese sido tan solo una semana antes España se habría salvado de lo peor porque muy posiblemente no se habría perdido esa crucial primera semana de marzo en estado de negación y todas las medidas se habrían hecho justo esos 5 días precedentes que serían necesarios para evitar el colapso sanitario que hemos sufrido.

 

Referencias

[1] https://cmmid.github.io/topics/covid19/severity/global_cfr_estimates.html

[2] https://institucional.us.es/blogimus/2020/03/covid-19-analisis-por-medio-de-un-modelo-seir/

[3] https://towardsdatascience.com/social-distancing-to-slow-the-coronavirus-768292f04296

[4] https://www.ijidonline.com/article/S1201-9712(20)30117-X/fulltext

[5] https://www.worldometers.info/coronavirus/coronavirus-incubation-period/

[6] https://annals.org/aim/fullarticle/2762808/incubation-period-coronavirus-disease-2019-covid-19-from-publicly-reported

[7] https://numbersandshapes.net/post/fitting_sir_to_data_in_python/

 

 

Publicado en Sin categoría | 1 Comentario

¿Cuándo debería levantarse la cuarentena?

En este blog hemos venido trabajando con varios modelos para analizar en tiempo real el brote de COVID-19. El modelo de crecimiento exponencial, crecimiento generalizado (sin límite de contagios, pero útiles para la fase temprana explosiva) y el logístico (mejor a medio plazo, por asumir punto de inflexión).

La observación de los datos publicados del Ministerio de Sanidad en estas últimas dos semanas y media, sugiere que los datos oficiales se ajustan claramente a un patrón logístico y que ya hemos pasado el pico ”natural” de esta primera oleada de COVID-19.

  • Recapitulación

El pronóstico sobre el pico realizado el día 23 (dando fecha y cantidad) se muestra en el Gráfico 1 abajo. Como puede verse, el pronóstico que manejábamos era que el pico de nuevos casos se produciría en el entorno de unos 8500 casos nuevos, y que esto sucedería con máxima probabilidad el día 3 de abril siendo las fechas que cubrían el intervalo de confianza del 95% el [1Abril-11Abril]. Lo que han mostrado los datos es que el pico finalmente se produjo el día 31 de marzo, con unos 9200 casos. Por tanto, se produjo más pronto de lo esperado, y fue más intenso. Sin embargo, como puede observarse, el 70% de los datos sucedidos a dos semanas y media vista, han estado dentro de las bandas de confianza, una cobertura bastante decente.

Gráfico 1: Evolución nuevos contagiados 24M-9A

Peak_Forecast2

Usando los datos más recientes del Ministerio de Sanidad organizados por Datadista, el pronóstico que genera el modelo logístico a fecha de hoy sugiere que lo más probable es que entremos en una fase estacionaria a partir del 17 de abril, con un tamaño final de este primer brote de la pandemia en el entorno de los 180 mil casos. De hecho, se obtiene un resultado muy similar a través de la extrapolación de las tasas de crecimiento de nuevos casos usando datos del 27marzo-9abril (-0.6% por día), que ya reflejan el ritmo de contagios del confinamiento parcial, posterior al decreto de Estado de Alarma (aunque todavía podrían no capturan el efecto del confinamiento total).

Gráfico 2: Contagios acumulados

ForecastCum_Nuevos

  • La curva de contagios activos

Sin embargo, el pico de nuevos contagios no es el relevante para saber cuándo se deberían levantar las medidas de confinamiento, que es lo que le interesa a la mayoría de la gente a estas alturas de la película. El que realmente cuenta en este sentido, es el pico de nuevos casos activos que se calculan como:

Casos activos (t) = Casos confirmados (t) – Recuperados(t) – Defunciones(t)

En el Gráfico 3, vemos que según el modelo logístico el pico de esta variable se produjo el 7 de abril. En rojo se muestra la trayectoria esperada de los casos activos mientras que el período del confinamiento que cubre el período que va del 14 de marzo al 26 de abril se muestra en gris.

Gráfico 3: Casos activos

Forecast_Peak_All

Como puede verse, el valor esperado de casos activos del 26 de abril hace que no sea nada recomendable comenzar a reconectar la sociedad esos días y levantar el confinamiento parcial ya que para esas fechas los casos activos que tendremos todavía estarán por encima de los que había en el momento previo a la declaración del Estado de Alarma. Así, para el 26 de abril, se esperan unos 21 mil casos activos equivalentes a los del 20-21 de marzo. Terminar con la cuarentena parcial de la sociedad en esas fechas sería muy imprudente y arriesgado ya que todo lo que se ha logrado podría perderse fácilmente.

Para que nos hagamos una idea, ya que la curva no es simétrica y tiene una cola larga y gruesa a la derecha (es decir, cuesta más bajarla que subirla), la equivalencia temporal en la fase de bajada sería la siguiente:

Fecha de fin de confinamiento parcial Fecha equivalente parte creciente Número de casos activos
26-abr 21-mar 21000
01-may 17-mar 11500
15-may 09-mar 2000
25-may 04-mar 550
01-jun 02-mar 210
07-jun 01-mar 100

Por tanto, para llegar a la situación inicial de casos activos del 9 de marzo, justo después del famoso fin de semana polémico de las manifestaciones y mítines políticos, tendremos que esperar hasta el 15 de mayo. Puesto que existe un consenso generalizado sobre el hecho de que ese fin de semana ya se debería haber decretado el confinamiento parcial, tampoco parece muy razonable una vuelta a la normalidad para ese entonces. Si quisiésemos retroceder en el tiempo y ponernos al nivel de los 100 casos activos estimados que teníamos el 1 de marzo, deberíamos mantener la cuarentena hasta la primera semana de junio (concretamente el 7 de junio).

Aunque esto sería lo ideal (Wuhan volvió a abrir a las 10 semanas con menos contagiados oficiales), es muy probable que los gobernantes consideren que el país no puede permitirse ese coste a nivel económico, ya que las estimaciones que hay ahora mismo indican que cada 15 días de confinamiento restan unos 3-4 puntos de PIB. Alargar la cuarentena todo abril y mayo supondría una pérdida de unos 8-10 puntos del PIB, a lo que habría que añadir, la destrucción del sector turístico por la más que probable pérdida de la temporada de verano.  Estimamos que este shock estaría más cerca de la caída del PIB de la guerra civil (del 25%) que del colapso financiero y del sector de la construcción de 2008 (del 5%).

  • ¿Cuál es el riesgo de levantar la cuarentena demasiado pronto?

La experiencia de otros países muestra que el virus es muy difícil de controlar, por lo que, si a partir del 13 de abril, se vuelven a abrir actividades económicas no esenciales, del 27-28 de abril en adelante deberíamos ver un repunte en los datos de nuevos contagios. En lugar de las tasas de crecimiento del 0-0.5% de nuevos contagiados que veremos en la fase estacionaria del 15 al 27 de abril (y que se corresponderán con el período de confinamiento total), podríamos pasar a ver crecer el número de nuevos contagiados al ritmo del 3-4% (que es el umbral de crecimiento mínimo observado hasta hora de los datos de confinamiento parcial). Si se levantase el confinamiento general a la población, las tasas del 3-4% que estamos viendo ahora serían una broma. Por tanto, aunque pensamos que es bajo, hay un riesgo de rebrote inminente.

Para ejemplificar los riesgos de reconectar la sociedad hago los siguientes supuestos (esto es simplemente un ejercicio hipotético):

(i) Tras levantarse el confinamiento total el 13, el mismo día 14 de abril la tasa de crecimiento de casos activos aumenta al 2%

(ii) El Gobierno tarda entre 13 y 14 días en detectar lo que sucede por el desfase temporal entre contagios y confirmación del contagio, (mínimo 10 de testeo y 3 días adicionales de lag por el policy making)

(iii) Durante esas 2 semanas y media posteriores, la tasa de crecimiento de nuevos contagiados se acelera y aumenta ligeramente al 0.01% diario

(iv) Una vez se detecta el rebrote el 27 de abril, se vuelve a confinar totalmente a la población, lo que desacelera continuadamente el ritmo crecimiento (al -0.6 diario, como se ha visto en esta última fase con datos del periodo de cuarentena parcial).

Si se diese este escenario  estaríamos hablando de un nuevo pico ya no de 84 mil casos activos sino de 140 mil el 8 de mayo y ya no podríamos “suprimir” el virus a comienzos de junio, sino como pronto, a final de julio. La trayectoria temporal sería la graficada abajo.

Gráfico 4: Escenario de rebrote iniminente

Alternative_Scenario

Obviamente que la realidad se ajuste al patrón temporal dibujado arriba depende en gran medida de la validez de los supuestos y todavía hay muchas cosas que desconocemos del virus. Por ejemplo, ¿Cambiará su velocidad de difusión con el uso generalizado de máscaras? ¿Nos darán una tregua las temperaturas y el hecho de que las relaciones se den fundamentalmente en espacios abiertos? Si estos factores, tal y como hipotetizamos, inciden favorablemente, es plausible que la desescalada no derive en un repunte inmediato y se tarde unos meses en volver a los niveles de contagios de marzo (con suerte, deberíamos ver la segunda oleada ascendente en otoño).

En cualquier caso,  hay que insistir en que aunque las cifras de este escenario hipotético son simplemente un “thought experiment”, es un error arriesgarse a abrir tempranamente. El coste económico de mantener el “lockdown” es indudable, pero en economía a lo que hemos vivido lo solemos llamar “sunk costs”. La debacle económica ya no es evitable, y si se mantiene la cuarentena total hasta final de mayo, si que deberíamos ser capaces de extinguir el virus por completo del territorio. De lo contrario, con el tiempo, por no bajar suficientemente la curva de contagios podríamos vernos en una situación en la que no sólo se pierde la economía sino también el control del sistema sanitario por los errores de una política miope.

Publicado en Sin categoría | 4 comentarios

¿De qué cifras estamos hablando cuando se dice que “lo peor” está por llegar?

En numerosas comparecencias en los medios, el Presidente del Gobierno Pedro Sánchez ha advertido e insistido en que lo peor de la pandemia del COVID1-9 estaba llegar. ¿Pero qué es exactamente lo peor? ¿De qué cifras estamos hablando? En este post analizo la trayectoria esperada de las variables clave de los efectos de la epidemia (contagios, camas de UCI necesarias y muertes) para las próximas semanas. Los números que se obtienen mediante la estimación de modelos epidemiológicos de crecimiento no lineal son demoledores y sirven para hacernos una idea de lo “que está por llegar” en los próximos días.

Recapitulación

En el post anterior del día 10 de marzo cuando lancé los pronósticos de contagiados hasta el 24, todavía estábamos en la fase de arranque y propagación inicial del COVID-19 por lo que suponer que la evolución de los contagiados podía caracterizarse estadísticamente mediante un modelo de crecimiento generalizado (Generalized Growth Model, GGM) a priori, era bastante razonable.

La comparación de los datos oficiales observados entre el 10 de marzo y el 20 de marzo, con el pronóstico a 10 días que se muestra en el Gráfico 1, sugiere que la capacidad del GGM de pronosticar la dinámica del COVID-19 es bastante elevada. En el horizonte de 10 días fuera de muestra sólo los datos del viernes 13 y viernes 20 se fueron del intervalo de confianza del 95%. Esto sugiere que el modelo es bastante fiable lo que está en línea con la evidencia empírica previa sobre el rendimiento predictivo a corto plazo de este tipo de modelos epidemiológicos.

Gráfico 1: Precisión del último pronóstico

Fig1_weeklyforecast

Sin embargo, la capacidad predictiva de cualquier modelo se deteriora conforme aumenta el horizonte de la predicción. A partir del 20 de marzo, la realidad se retrasó un día con respecto al pronóstico del modelo, de modo que lo que se predecía para el 21 ocurría el 22, para el 22 el día 23, etc. En el caso de la modelización de un proceso estadístico explosivo de naturaleza no lineal como el que subyace a la pandemia de COVID-19, el deterioro de los pronósticos es muy sustancial más allá de una semana. Esta incapacidad de predecir con exactitud lo que va a suceder explicaría la reticencia de las autoridades de hablar claro y por ello, los técnicos del gobierno no se mojan.  Sin embargo, un pronóstico probabilístico, en el que cada dato y trayectoria temporal tiene una probabilidad asociada, “nunca se equivoca”.  Puede pasar que lo que suceda finalmente tuviese muy poca probabilidad dada la información existente y se salga de los intervalos de confianza, pero es lo mejor y más honesto que podemos hacer.


La dinámica del COVID-19 y sus efectos sanitarios

Para poder analizar lo que va a suceder, la elección de un proceso generador al que ajustar los datos es importante. Aunque ya llevamos 9 días de cuarentena, la movilidad no se ha reducido por completo y existe un porcentaje relevante de gente que sigue desplazándose todos los días para trabajar. Además, teniendo en cuenta que el período de incubación del virus es de 7 días y que los retrasos promedio en procesar los tests son de 4-6 días (lo que hace que los datos publicados vayan siempre desfasados entre 11 y 13 días), es razonable suponer que hasta el día 28 de marzo no empezaremos a recibir los nuevos datos del patrón de propagación del virus post-cuarentena. Por tanto, mantener el supuesto de que un GGM puede ser preciso pronosticando al menos a 5-6 días vista es realista hasta el día 28/29 de marzo. A partir de estas fechas, una desaceleración sería plausible debido al efecto de la cuarentena, por lo que el análisis también incluye los pronósticos derivados de un modelo crecimiento logístico generalizado (LGM), que permite un punto de inflexión en la curva de contagios y estimar su pico.

Los resultados obtenidos con estos dos modelos que adjunto a continuación se refieren tanto a: (i) número de contagios esperados, (ii) número de camas UCI necesarias esperadas, como (iii) número de muertos esperado.

  • Contagios

Como se puede observar en la Tabla 1, según el GGM el número más probable de contagios con los datos oficiales a final de mes sería de 107 mil contagiados, lo que supondría que en menos de una semana podríamos haber superado a China.

Tabla 1: Evolución esperada del número de contagios

  Modelo de crecimiento exponencial generalizado (GGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 41.189 41.655 42.062
25/03/2020 47.718 48.263 49.549
26/03/2020 55.004 55.677 56.312
27/03/2020 63.127 63.965 64.808
28/03/2020 72.097 73.210 74.340
29/03/2020 82.056 83.486 84.954
30/03/2020 93.122 94.888 96.758
31/03/2020 105.333 107.529 109.826
01/04/2020 107.828 110.530 113.372
  Modelo de crecimiento logístico generalizado (LGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 40.109 40.949 41.892
25/03/2020 45.830 46.975 48.273
26/03/2020 51.899 53.482 55.303
27/03/2020 58.264 60.432 62.965
28/03/2020 64.847 67.790 71.256
29/03/2020 71.543 75.502 80.202
30/03/2020 78.307 83.509 89.794
31/03/2020 85.068 91.753 100.011
01/04/2020 91.758 100.173 110.826

Los resultados del modelo logístico, tanto de nuevos contagios como del total, se muestran en el Gráfico 2. Este es el modelo que permite una inflexión, y apunta a una crecimiento similar durante la próxima semana, aunque ligeramente más moderado. En este caso, para el 31 de marzo el escenario más plausible rondaría los 91.7 mil contagiados.

Gráfico 2: Evolución del total de contagiados

FIG3_TOTALCONTAGIOSLGM

La buena noticia que nos da el modelo logístico es que la fecha más probable del pico de nuevos contagios se produciría el día 3 de abril, tal y como se muestra en el Gráfico 3 (línea roja). A partir de esa fecha, el número de nuevos contagiados disminuiría. El valor más probable de estabilización de la epidemia implicado por el modelo se daría en el entorno de los 8500 nuevos contagiados. Sin embargo, el descenso se prevé lento, por lo que lo más probable es que para el 10 abril todavía no hayamos entrado en la fase estacionaria. En el escenario más optimista, pero muy poco probable, el pico se produciría el 1 de abril, haciendo el máximo de nuevos contagios en el entorno de 6690. El peor escenario implicaría que la fase de crecimiento de los nuevos contagiados no llegaría a su fin hasta el 11 de abril con 14 mil nuevos contagiados.

Gráfico 3: El pico de contagios

FIG4_PRONOSTICO_PEAK

  • Camas UCI

Un problema importante derivado da la propagación del COVID-19, es que el aluvión repentino de contagios con cuadros graves puede desbordar la capacidad de nuestro sistema de salud pública. Por lo general, la necesidad de camas de cuidados intensivos se corresponde a las personas que se contagiaron entre 10 y 14 días atrás y desarrollaron síntomas hace 1 semana. Por tanto, puesto que el crecimiento en contagios ha sido explosivo durante toda la semana, también es plausible suponer que la necesidad de camas UCI lo será durante la semana próxima.

Como se muestra en el Gráfico 4, los ingresos en la UCI han seguido un proceso ligeramente sub-exponencial.  Aunque se estén haciendo esfuerzos por ampliar la resiliencia del sistema sanitario ya sea (i) levantando nuevos hospitales y/o (ii) rehabilitando algunos en desuso, la estimación del stock de camas UCI en España es de unas 4633 (aproximadamente un 3.3% del total de camas de hospital). Desgraciadamente la trayectoria esperada de la ingresos en UCI que se muestra en el Gráfico 5, superará con un 97.5% de probabilidad la capacidad de carga base del sistema el día 28/03, ya que para esa fecha en el mejor de los casos harían falta 5869  camas UCI y en el peor de los escenarios unas 7364. Para el día 31 de marzo el número de camas UCI requerido por el sistema más probable será de unas 10602.

Gráfico 4: Ingresos UCI en España por COVID-19

Fig1ICU_GGM_IFit_24f_22m_ESP

Gráfico 5: Ingresos UCI  esperados

Ingresados_UCI_esperados

Por tanto, la única forma de absorber el shock pandémico de aquí a final de marzo en condiciones pasaría multiplicar por 2.88 (casi triplicar) el número de camas UCI con su debido equipamiento en un plazo de 10 días. Aunque es una tarea muy difícil, no sería imposible si el Estado pusiese en marcha toda su maquinaria. Por contextualizar el dato, este nivel de camas UCI está dentro de los estándares de países como Alemania que tiene 3 veces más camas de UCI que España.

El problema es que la reacción que está mostrando el aparato estatal en la gestión de la crisis está siendo terriblemente lenta y las necesidades van a ir en aumento (y de forma acelerada) conforme pase el tiempo por lo que no me parece muy arriesgado aventurar que la sanidad española colapsará la primera semana de abril cuando se enfrente a sobrecargas del 366% el 1 de abril, del 464% el 2 de abril y del 591% el 3, respectivamente.

Tabla 2:  Evolución esperada del número de ingresos en UCI

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.556 2.710 2.838
25/03/2020 3.153 3.390 3.579
26/03/2020 3.870 4.248 4.549
27/03/2020 4.774 5.330 5.790
28/03/2020 5.869 6.698 7.364
29/03/2020 7.167 8.420 9.361
30/03/2020 8.758 10.602 11.919
31/03/2020 10.693 13.389 15.261
01/04/2020 13.039 16.964 19.584
02/04/2020 15.899 21.527 25.200
03/04/2020 19.392 27.405 32.501
  • Defunciones

Otro dato negativo que está por materializarse es el de los fallecidos. Este dato es el que va más desfasado en el tiempo ya que según la OMS un paciente que desarrolla un cuadro agudo tarda entre 2 y 8 semanas en morir tras ser contagiado, por lo que de nuevo un GGM es apropiado para modelar la trayectoria de defunciones. En el Gráfico 6 se muestra la trayectoria de muertes esperadas con sus respectivas bandas de confianza.

Gráfico 6: Evolución esperada de defunciones

Curva_defunciones

El número de defunciones más probable por la pandemia es de 12402 para el 31 de marzo. Estos datos supondrían mortalidades superiores a las observadas en Italia. El pronóstico central a dos semanas vista, para el día 5 de abril, apunta a un saldo de más de 28 mil fallecidos, 2.5 veces superior a la cota mínima estimada por Victor García aquí, en el que se hacía el supuesto de que se lograría aplanar la curva de un modo similar a lo que hizo China. La Tabla 3 resume las estimaciones de fallecidos esperados.

Tabla 3:  Evolución esperada del número de muertes

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.722 2.867 3.022
25/03/2020 3.383 3.602 3.836
26/03/2020 4.172 4.494 4.850
27/03/2020 5.105 5.566 6.125
28/03/2020 6.218 6.848 7.704
29/03/2020 7.519 8.392 9.617
30/03/2020 9.016 10.229 11.935
31/03/2020 10.778 12.402 14.732
01/04/2020 12.839 14.964 18.100
02/04/2020 15.212 17.961 22.211
03/04/2020 17.936 21.486 27.159
04/04/2020 21.065 25.571 33.068
05/04/2020 23.431 28.575 37.443

 

Conclusiones y cuestiones abiertas

Los resultados de los modelos de crecimiento no lineal epidemiológicos estimados sugieren que el valor más probable de contagiados para el día 31 de marzo estará entre 91 mil y 107 mil (por encima de China), que el número de camas UCI necesaria para hacer frente al shock al sistema sanitario el 31 de marzo debería ser de 13899 (3 veces más que el stock disponible)  y que el número de defunciones más probable ascenderá a los 12402 mil casos (aproximadamente el doble de los que tiene Italia ahora mismo).

Obviamente la sobrecarga de la sanidad en la ventana de los días 28 de marzo al 3 de abril enmascara que hay comunidades autónomas que tienen más margen que otras para lograr el stock de camas UCIs necesarias para resistir. Sin embargo, todavía no tengo organizadas las estimaciones de la sobrecarga prevista para cada una de ellas los próximos días.

En cualquier caso los números efectivamente muestran que lo peor está por llegar.


Nota técnica: Para los que estén interesados en el ejercicio de modelización del que salen los números que presento les recomiendo leer este paper publicado en el Infectious Disease Modeling. La diferencia principal con este análisis es que en este post, en lugar de utilizar únicamente la información del modelo más reciente, hago un promediado de modelos y pronósticos, introduciendo un factor de olvido geométrico para implementar la ponderación. Así, los pronósticos generados con los modelos alimentados con los últimos datos tienen más peso en el pronóstico ensamblado que los pronósticos de modelos estimados con datos más alejados del presente. Este enfoque de model averaging tiene la ventaja de robustecer el pronóstico contra posibles outliers, artefactos estadísticos y/o fluctuaciones en los datos, que suelen generar grandes discrepancias en las trayectorias pronosticadas.

Fuentes: Wikipedia/Worldometers


Actualización 25/03  5.00h: Los tres datos publicados a última hora del 24/03 de 42,058 contagios acumulados (+19%), de 2,991(+28%) muertes en total  y de 2636 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad.

Actualización 26/03  1.50h: Los tres datos publicados a última hora del 26/03 de 49,515 contagios acumulados (+18%), de 3,647 (+22%) muertes en total  y 3,434 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad a 2 días del GGM. Para el LGM, el dato de contagios se va fuera del intervalo del 95%, al 2.5% superior de probabilidad.

Publicado en Sin categoría | 13 comentarios

COVID-19: ¿Dónde estará el pico de decesos? Estableciendo una cota inferior en base a la curva china

Esta galería contiene 4 fotos

A estas alturas todos somos ya conscientes de que la epidemia ha avanzado de una forma asombrosa. Probablemente debido a una combinación de alta transmisividad y relativa baja letalidad. Este último factor, a la postre sería decisivo para provocar el … Seguir leyendo

Más galerías | 8 comentarios

Nueva evidencia sobre la dinámica de crecimiento del Covid-19 en España

En esta entrada se analiza la evolución del coronavirus en España durante las últimas   semanas, utilizando los últimos datos disponibles en Wikipedia.

El objetivo de este artículo es doble.  Además de repasar los últimos datos aparecidos, la idea es analizar el patrón de crecimiento mediante la estimación de un Generalized Growth Model (GGM) como en Chowell et al. (2017). y tratar de predecir su evolución.

La modelización matemática y estadística en epidemiología, es especialmente útil para estudiar la propagación de epidemias y puede servir para aportar evidencia sobre las trayectorias más plausibles para las próximas semanas. El ejercico de modelización que presento parece bastante sensible al último dato recogido el 9 de marzo por lo que los resultados hay que tomarlos con cautela.  Aún así, los resultados del GGM estimado con datos para el período comprendido entre el 23 de febrero y el 9 de marzo apuntan a que:

(i) el número de contagiados más plausible para final de semana es de 7.766 y

(ii) que dentro de dos semanas el número de contagios ascendería a los 88.782 casos.

Los datos

El motivo de utilizar los datos Wikipedia y no los oficiales, se debe a que éstos están más en línea con los reportados por otras webs que se están actualizando continuamente como son la de RTVE, Worldmeter o el Johns Hokpins. De hecho, como se ve en el Gráfico 1, el Ministerio de Sanidad y el European Center of Disease Control ECDC parecen estar reportando menos casos que el resto de fuentes de forma sistemática.  En cualquier caso, y con independencia de las discrepancias, en el número exacto de los casos (a las 00.00h del 10 de marzo la Wikipedia apuntaba 1.231 casos vs Ministerio/ECDC con 1.024 casos), el patrón observado en el Gráfico (1) es claramente geométrico, tal y como se mencionó en la entrada anterior aquí  a fecha de miércoles 4 de marzo.

Gráfico 1. Evolución de contagiados por Covid19 en España 24 febrero-09 marzo

Graph1_Wiki_vs_Official1

El Gráfico (2) muestra el número de incidencias o casos diarios. Como puede apreciarse, en los últimos días, el número de casos se ha incrementado sustancialmente. El día 6 de marzo se añadieron 119 casos, el 7 de marzo 115 casos y el 8 de marzo 158 casos. La última actualización en el momento de escribir este artículo (a las 00.00h del 10/03/2020) implica un crecimiento durante el 9 de marzo muy abrupto, de 558  casos.

Gráfico 2. Evolución nuevos contagios 1 febrero – 09 marzo

Graph2_nuevoscontagiosv1
Nota: cálculos basados en la actualización de las 00.00h del 10/03/2020, Wikipedia 

 

El Gráfico 3 a continuación, aporta información de (i) las tasas de variación diarias y de  los factores de (ii)  duplicación y  (iii) multiplicación  por 10, desde el 24 de febrero (fecha del despegue) hasta el 9 de marzo. Los datos implican que para este período, el número de contagiados se está duplicando cada 1.65 días (aprox 40 horas) y que se multiplicaría por un factor de 10 cada 5.48 días (aprox 132 horas).

Gráfico 3: Tasas de crecimiento diarias y factores de multiplicación

Graph3_GrowthRates1

Nota: cálculos basados en la actualización de las 00.00h del 10/03/2020, Wikipedia 

El modelo

Aunque el cálculo de estos factores de multiplicación es informativo de la seriedad de la situación, la estimación de modelos econométricos ampliamente aceptados en el campo de la epidemiología puede permitirnos obtener conclusiones más precisas sobre la propagación del virus. En este sentido, la modelización de epidemias tiene todo un repertorio de modelos matemáticos y estadísticos para analizar su progresión tras la fecha del estallido. Algunos bastante comunes son: (i) el SIR (Susceptibles-Infectados-Recuperados) y  (ii) el SEIR (Susceptibles-Expuestos-Infectados-Recuperados), que utilizan la información de varias variables que desafortunadamente no están disponibles para el caso de España (por lo que he mirado, no existe una serie temporal consolidada de las recuperaciones).

Para analizar la evolución del número de contagiados de Covid-19 en España se emplea un Generalized Growth  Model que sólo requiere la estimación de dos parámetros clave y que se ha mostrado muy eficaz a la hora de predecir outbreaks víricos en otros contextos (Viboud et al., 2016). Una ventaja de este modelo con respecto a un modelo de crecimiento exponencial simple es que permite relajar el supuesto de crecimiento exponencial en las primeras fases mediante un parámetro de escala p. El modelo viene dado por la siguiente ecuación diferencial:

EquationSimpleGrowth

donde C'(t) describe el crecimiento de las incidencias en el período t, C(t) es el número total de contagiados en t, r es un parámetro positivo que captura la tasa de crecimiento y p es el parámetro de desaceleración del crecimiento, que se supone entre 0, 1.

Si p=0, esta ecuación describe una incidencia constante en el tiempo y el número de casos crece de forma lineal, mientras que si p=1 el modelo describe un patrón de crecimiento sub-exponencial (i.e, patrón polinómico).  La estimación de los parámetros clave del modelo r y p, utiliza los datos existentes desde el 23 de febrero al 9 de marzo y se lleva a cabo mediante NLSQ (Non-linear Least Squares).  Como se observa en el Gráfico 4, aunque el modelo es relativamente preciso a la hora de explicar el patrón temporal de los contagiados de Covid-19 tiende a infraestimar ligeramente los contagios del 1 al 4 de marzo y a sobreestimarlos en los días 7 y 8 de marzo. El error más elevado está en el último dato del 9 de marzo. Como vamos a ver, el que el cambio brusco de ayer 9 de marzo sea una nueva tendencia o bien un outlier, tiene consecuencias importantes para la predicción.

Gráfico 4: Ajuste dentro de muestra

Graph4_InSampleFit2

En el Gráfico 5 a continuación, se muestra la distribución aproximada de los parámetros r y p mediante bootstrapping (asumiendo una distribución Poisson en el error)  con 200 repeticiones.  El parámetro de la tasa de crecimiento r toma el valor mediano de 0.6364 mientras que el valor del parámetro de escala p toma el valor de 0.938, lo que sugiere un comportamiento sub-exponencial.

Una de las cuestiones importantes que nos permite la estimación de los parámetros clave del GGM en la fase temprana de la epidemia es que con ellos en mano, es posible determinar el R0 del virus, es decir, el número promedio de casos nuevos que genera un caso a lo largo de un período infeccioso (Chowell et al, 2016). Sin embargo, para obtener el  R0 es preciso una estimación externa de lo que en epidemiología se denomina el intervalo de serie del virus (Tg), que se refiere al tiempo entre casos sucesivos en una cadena de transmisión. Las estimaciones existentes sobre Tg en el caso del coronavirus apuntan a que este parámetro está entre 4 y 5.2 (ver aquí y aquí) lo que indicaría un valor promedio del R0 centrado entre 2.54 y 3.3 para España, por encima de los datos de la Organización Mundial de la Salud (OMS) que estimaba que el valor del R0  se situó entre el 2 y 2.5 para el caso de China.

Gráfico 5: Distribución de los parámetros del modelo e incertidumbre

Graph5_Distribution

En el panel inferior, del Gráfico 5 se incorpora la incertidumbre a la predicción mostrada en el Gráfico 4 derivada del posible error de estimación de los parámetros.

Una de las cosas que podemos hacer con el modelo es utilizarlo para predecir la evolución de casos. Es importante destacar que aunque el modelo ajuste bien los datos dentro de muestra, otra cosa muy diferente es utilizarlo para predecir el futuro con certeza. Para ver si un modelo es fiable en sus pronósticos, en casi todos los campos se suelen realizar ejercicios de “backtesting”, que básicamente consisten en probar la capacidad predictiva del modelo haciendo pronósticos fuera de muestra en momentos pasados y comparar los resultados con lo que finalmente sucedió. Aunque un análisis más riguroso de su fiabilidad pasaría por estimar el período en una ventana móvil e ir haciendo los pronósticos recursivamente,  el ejercicio aquí es más sencillo. Consiste en alimentar el modelo únicamente con datos del período comprendido entre el 23 de febrero y el  4 marzo y ver, si las predicciones para los días del 5, 6, 7 y  8 de marzo no se desvían mucho de lo que ha sucedido. El Gráfico 6 muestra que el resultado de este ejercicio de backtest: los intervalos de confianza de la predicción a 4 días vista cubren en todo momento la trayectoria observada. Por tanto, el miércoles pasado ya se podía prever que para el domingo 8 como poco habría 600 casos y como máximo 1200 casos.

Gráfico 6: Backtesting del GGM,  4 marzo – 8 marzo

Graph6_BackTestOutOfSampleForecast

Finalmente, el Gráfico 7 muestra los resultados de utilizar el modelo con los parámetros estimados r=0.6364 y p=0.938, teniendo en cuenta su incertidumbre (outputs de los Gráficos 4 y 5) y utilizando toda la información disponible desde el 23 de febrero al 9 de marzo para pronosticar la trayectoria del 10 al 24 de marzo. Por otro lado, en la Tabla 1 se reporta la predicción mediana o central por días, así como el intervalo de confianza del 95%. Los resultados apuntan a que con un 95% de probabilidad los contagios se situarán entre los 6400-9991 siendo el escenario más probable el de los 7.766 contagios.   Para dentro de dos semanas el escenario central sería de 88.782 casos y el intervalo de [56.300-155.776] casos. Como se observa en el ensanchamiento de las bandas de confianza del Gráfico 7,  la incertidumbre es muy elevada y  crece considerablemente conforme nos alejamos del origen del pronóstico.

Gráfico 7: Predicciones modelo

Graph6_DoomForecast

Tabla 1: Proyecciones del número de contagios en España

Fecha2.5%
Inferior
Mediana97.5%
Superior
10/03/2020149515951748
11/03/2020204622282525
12/03/2020276630793602
13/03/2020367942255097
14/03/2020486457597162
15/03/2020640077669991
16/03/202083601042813851
17/03/2020108261393419114
18/03/2020138911849126211
19/03/2020177142437135641
20/03/2020225433191248248
21/03/2020285614160365071
22/03/2020359925387787462
23/03/20204512769387117015
24/03/20205630088782155776

En cualquier ejercicio de modelización y/o pronóstico un punto importante es el de la robustez. En este sentido, es importante mencionar que el dato de ayer del 9 de marzo es bastante clave en la generación de este resultado tan explosivo, y que los resultados presentados NO son robustos. De hecho, el mismo modelo estimado y calibrado únicamente hasta el 8 de marzo (adjunto las trayectorias pronosticadas dentro y fuera de muestra abajo) no implicaba una evolución tan explosiva. A una semana y dos semanas vista, las horquillas que cubren el 95% de probabilidad serían de [5-9 mil] y de [15-34 mil] contagiados respectivamente.

Contagiados_model_fit24_08_forecast

Forecast_08m_23m

El que el dato del 9 de marzo finalmente sea un outlier o un cambio drástico de tendencia, va a ser clave para sacar conclusiones y lo sabremos pronto. En cualquier caso, tanto si nos quedamos con el output del modelo alimentado únicamente con información hasta el 8 de marzo  (mínimo 4 mil casos adicionales) como si nos fiamos de lo que dice el modelo alimentado con información más reciente (mínimo 5200 casos adicionales),  los resultados de este análisis sugieren que las medidas de control de la epidemia en España tendrán que ser muy enérgicas si no queremos que el coronavirus se extienda masivamente por la población y el territorio.

En el caso de Italia las medidas de cierre de colegios en todo el país se tomaron hace ya días 5 días con 3 mil contagios y aún con ello, el número ha crecido a 9 mil infectados. Está por ver su efectividad pero ayer se tomaron medidas drásticas de cuarentena y restricción a la movilidad en todo el territorio italiano hasta el 4 de abril. Aunque sean duras, parecen correctas puesto que existe evidencia que apunta a que las restricciones a la movilidad implementadas en China sirvieron para evitar los escenarios de crecimiento exponencial. Dejo los enlaces aquí y aquí.

—————————————————————————————————————————————
*** Actualización a las 15.00h del 10/03/2020: Con 1592 casos se confirma que el dato del 9 de marzo no era un outlier ya que el crecimiento observado parece ajustarse al modelo usando toda la información muestral. De hecho, puede que a final del día el dato sea tan elevado que caíga en el 2.5% de probabilidad que tenían las trayectorias de contagios por encima de los 1748 casos.

*** Actualización a las 00.00h del 11/03/2020: Con 1695 casos se confirma que el dato del 9 de marzo no era un outlier ya que el crecimiento observado parece ajustarse al modelo usando toda la información muestral.  El resultado del pronóstico a 1 día finalmente cae dentro del intervalo del 95%. 

Publicado en Sin categoría | 3 comentarios

Notas sobre la propagación temporal del Coronavirus: España vs Italia

He estado haciendo unos números sobre la propagación de la epidemia del coronavirus y creo que ya se puede decir que en España ésta se ha descontrolado, al igual que sucedió en el caso de Italia. Usando los datos oficiales de la UE (https://www.ecdc.europa.eu/…/geographical-distribution-2019…) y las revisiones de wikipedia (que se actualizan más rápido) se observa que:

1) Ya se está formando una curva exponencial

CasosContagioESP

2) La tasa de crecimiento diaria en los días 24 febrero-04 marzo ha sido proximadamente del 55% ~= exp(0.44) -1

LnContagiosESP_UltimosDias

3) Llevamos un desfase de 10 días con Italia, ya que a 24 de febrero allí también contabilizaron 227 casos (nosotros hemos llegado a esa cifra a cierre de 4 de marzo)

Desfase10dias_ITA_ESP

4) El crecimiento en ESP es más estable que el de Italia que tiene dos fases diferenciadas : del 15-24 feb tasas muy aceleradas del 105% y del 25feb-04 marzo más suaves del 35.7%. En concreto, el crecimiento promedio diario en Italia desde el 15 de febrero al 4 de marzo ha sido del 70.5%, superior al 55% de España.

LnContagios_ITA_ESP

5) En los últimos 6 días las tasas de variación se han situado a la par (las tendencias lineales más recientes son casi paralelas) por lo que el virus ahora mismo estaría expandiéndose al mismo ritmo en ambos países
LnContagiosESP_ITA_Last6Dias

*** Esto ya no es evidencia, sino especulación, pero sirve para hacernos una idea del período/timming para el podría comenzar a remitir la epidemia y de la implementación de medidas de contención.

Teniendo en cuenta el desfase de 10 días con Italia, es probable que las políticas para cortar la propagación que ha tomado hoy el Gobierno Italiano (cierre de escuelas, universidades, prohibición de aglomeraciones, etc) se apliquen en España a final de la semana que viene.

Por otro lado, si pensamos en un escenario hipotético muy optimista, en el que la evolución en España fuese similar a la de China y se siguiese el patrón temporal cuadrático del gráfico de abajo (lo que es complicado, debido a las fuertes medidas de control y cuarentena que se implementaron allí y que en una sociedad occidental serían muy mal vistas por la población), en este caso, el peak de contagios de la epidemia se produciría el 7 de abril con unos 80 mil casos acumulados (asumiendo una mortalidad del 1%, esto supondría 800 muertos).

Contagiados_quadratic

 

 

 

 

Publicado en Sin categoría | 2 comentarios