¿En qué momento estamos de la epidemia de COVID-19?

La “segunda ola” de COVID-19 ya está causando estragos en toda Europa y el debate sobre los confinamientos de todo tipo e intensidad está abierto. Un elemento importante que ha dificultado la toma de decisiones durante este período, y que sigue distorsionándolo todo, ha sido la mala calidad de los datos.

Así, los que seguimos la evolución de la curva epidémica diariamente, solemos encontrarnos con una imagen fuertemente distorsionada (ver Gráfico 1), ya que las estadísticas oficiales muestran un patrón ascendente de nuevos casos para los cinco países más importantes de Europa. Si tomásemos por buenos estos datos, deberíamos concluir que la segunda ola estaría siendo mucho más intensa que la primera en términos de incidencia.

Gráfico 1. Evolución temporal de los nuevos casos (datos oficiales)

Sin embargo, en este post muestro que la situación actual, aunque es preocupante, al compararse con la situación de primavera de 2020 todavía es bastante buena para la mayoría de los países analizados (sólo Alemania está igual que en marzo) y que las medidas restrictivas, esta vez parece que sí que se están tomado a tiempo.

Ahora bien, para poder comparar la incidencia entre las oleadas, hay que corregir las series históricas de contagios de los diferentes países durante la “primera ola”, ya que están plagadas de errores de medida. Esto se debe a que en la primera oleada de primavera de 2020 sólo se detectó una fracción pequeña del verdadero número de casos (un promedio del 10%). Este nivel contrasta con la elevada capacidad de detección actual (que oscila entre el 80- 100%), tal y como se ve en el Gráfico 2.

Gráfico 2.  Porcentaje de casos de COVID-19 detectados con respecto al total

Para (i) corregir los datos de nuevos casos por los problemas de “under-reporting” y aportar una imagen más realista de lo ocurrido, (ii) así como para ubicarnos en el momento en el contexto en el que estamos ahora; la estimación del porcentaje de casos detectado con respecto al total es crucial. Para llevarla a cabo, he empleado el algoritmo de corrección de Nishuira et al. (2009) que sirve para estimar la incidencia en tiempo real de brotes epidémicos. La forma genérica de corregir las series oficiales de un brote epidémico que propone Nishiura et al. (2009) y que ha sido utilizada por el grupo de investigación de la London School of Hygiene & Tropical Medicine para el caso del COVID-19 (y que replico aquí),  parte de dos observaciones clave.

  • La primera es que una simple división del número de defunciones totales (Dt) entre los casos totales (Ct) en un período t, la denominada naive fatality rate (nCFR=Dt/Ct), es una estimación sesgada de la letalidad real, ya que muchos de esos casos no están resueltos. Es decir, no se sabe con certeza si se recuperarán o no. Esto es así ya que el curso de la enfermedad lleva un tiempo, y existe un desfase o retardo temporal entre contagio y defunción.
  • El segundo hecho es que, aun cuando consigamos una CFR ajustada (CFRa) por los desfases temporales y dividamos las muertes por los contagios en el período que sucedieron con más probabilidad, esas estimaciones de letalidad tenderán a sobreestimar la verdadera letalidad de la enfermedad.

Gráfico 3. Ratio letalidad ingenua: Defunciones totales / Contagios totales

Como puede observarse en el Gráfico 3, según las estadísticas oficiales, la tasa de letalidad ingenua (o nCFR) de España, Francia, Italia o Reino Unido hasta bien entrado el verano ha estado por encima del 10%, lo que no es realista. De hecho, el consenso de la literatura científica (ver aquí, aquí,  aquí o aquí) es que la verdadera letalidad por contagiado está en el rango del 1 al 1.5%. La estimación de letalidad ajustada por retrasos temporales (CFRa) de casos con resultados ciertos también sufre de un problema de sobre-estimación, ya que  hasta el verano, sólo se detectaba una proporción de los casos reales. Así que para corregir esto sesgo, se asume que los excesos de la CFRa con respecto a “la mejor estimación posible” pueden atribuirse a una falta de detección.

Aunque la letalidad puede variar por países y en el tiempo (y con los años puede que converja a un valor entre el 0.5% y el 1% tal y como plantea la OMS),  asumiré que “la mejor estimación posible de letalidad” para el período estudiado y para todos los países considerados es del 1.25%, aún a riesgo de sobreestimar el tamaño real de la epidemia en algunos e infraestimarlo en otros.

Para el caso de España una letalidad del 1.25% es algo superior al 1.16% que arrojó el estudio serológico a 22 de junio (28.3 mil muertos/ 2.47 millones de infectados con anticuerpos) pero me parece un valor bastante razonable.  Por un lado, los datos del MoMo sugieren que los muertos están muy infraestimados (lo que tendería a aumentar bastante el numerador). De otro lado, sabemos que hay una proporción de población que, aunque se infecte y supere la enfermedad, pierde los anticuerpos rápidamente. En la muestra representativa del estudio de seroprevalencia, el 15% perdió anticuerpos a lo largo de las olas del estudio que duró 2 meses (lo que también sube el denominador y cancelaría parcialmente el efecto de infraestimar las defunciones). Por tanto, si tenemos en cuenta este 15% de población adicional que pierde anticuerpos, cualquier estimación fiable de lo ocurrido, para el 22 de junio, debería dar como poco un total 2.8 millones de infectados.

Si usamos el porcentaje de casos no detectados cada período, se puede obtener la magnitud real de la epidemia en cada periodo. Un elemento que le da credibilidad a esta estimación basada en Nishiura et al. (2009) es que, para España a fecha de 22 de junio, este cálculo situaba el impacto de la epidemia en 2.95 millones de casos > 2.8 millones.

Así pues, tal y como puede observarse a continuación, las curvas epidémicas del COVID-19 que se derivan de este análisis, tanto para el caso de España como para el resto de países, son  muy diferentes de los datos oficiales.

Gráfico 4. Comparación datos oficiales vs datos reales: España

Gráfico 5. Nuevos casos por países: datos oficiales vs reales  Estos gráficos son clave para comprender la situación actual.

  • Muy lejos de estar batiendo récords cada día, el esfuerzo que se está realizando con el distanciamiento social, el uso de mascarilla y confinamientos parciales de todo tipo, está dando sus frutos ya que aunque 20 mil – 25 mil casos diarios son muchos, estas cifras no tienen nada que ver con la explosión y el pico de primavera, que para España se situó en unos 143 mil casos diarios el día 26 de marzo. Por poner el dato en contexto: a 4/5 de noviembre, estamos registrando aproximadamente 6 veces menos casos diarios que en el pico real.
  • Si se tiene en cuenta el conjunto de infecciones totales con los datos corregidos, el número total de infecciones asciende a 4 millones. Es decir, ya hay un 8.5% de la población que ha pasado la enfermedad. De nuevo, este dato contrasta con la cifra oficial de 1.2 millones o del 2.6% de la población.
  • En el período de 5 meses del 22 de febrero al 22 junio, se estima que se contagiaron aproximadamente 3 millones mientras que en los 4 meses y medio del 21 de junio al 5 de noviembre, sólo se han contagiado 1 millón de personas. Es decir, los primeros 5 meses son un 74% de los casos. Así pues, hemos ralentizado sustancialmente la velocidad de la epidemia y le hemos quitado casi un 66% de efectividad de transmisión al coronavirus.
  • Otra lección que podemos extraer al comparar lo sucedido recientemente en otros países, es que los gobiernos de Francia y Reino Unido, tras observar un fuerte acelerón en los casos y superar los umbrales del 50-20% de incidencia del pico de primavera, han endurecido las restricciones al máximo. Esto sugiere que en España, con incidencias > 45 mil casos un último endurecimiento de las restricciones y la vuelta al confinamiento domiciliario sería muy probable.

Con los datos del 4/5 de noviembre, en España, estamos al 17% del pico de marzo, por lo que todavía hay un cierto margen de tiempo y maniobra. Sin embargo, registros diarios de 20mil casos (unos 6000-7000 muertos al mes) a la larga podrían ser insostenibles para la capacidad hospitalaria. Llegados a este punto, si se estima que finalmente se va a tener que tomar la medida del confinamiento domiciliario, lo mejor sería ejecutarla cuanto antes para que la bajada de la curva fuese más rápida y se pudiese salvar la Navidad. Obviamente este confinamiento no debería ser tan duro para bajar la curva, ya que como he mostrado, la incidencia actual es 6 veces menor que la de marzo.

Minientrada | Publicado el por | Deja un comentario

Las Curvas de COVID-19 de Italia y España, 6 meses después

Este gráfico de la trayectoria de contagios acumulada de Italia y España, muestra que si bien fuimos unos días por detrás en el comienzo de la pandemia, les pasamos a comienzos de abril y mantuvimos distancias hasta junio, desde julio la divergencia se ha vuelto brutal.

contagios_ita_esp

Esa divergencia no está provocada por causas estructurales invariantes en el tiempo tipo distribución de riqueza, la descentralización, el civismo, la densidad de población o hacinamiento, ya que esas variables cambian lentamente y son similares entre ambos países. Las condiciones iniciales post-confinamiento tampoco parecen importantes. Unos 40-50 días después del desconfinamiento (nosotros salimos el 10 de mayo y ellos el 17), teníamos el mismo diferencial entre países que en las fechas de la desescalada de mayo, por lo que no habría cambiado mucho alargarlo hasta final de mayo. Sin embargo, a partir de la segunda mitad de junio, las curvas comienzan a separarse hasta que la brecha se hace gigante y en 3 meses acabamos acumulando 400 mil casos detectados más que ellos.

¿Qué es lo que ha pasado en este período?

Mi hipótesis es que son elementos de gestión los que marcan las diferencias:

(1) Contratación de rastreadores y vigilancia epidemiológica. Ellos dejan la ratio en 1 o 2 rastreadores por cada 10 mil habitantes y saben adscribir el origen de la mayoría de brotes. En España, la ratio de rastreadores en muchos sitios sigue a menos de 0.5 por 10 mil habitantes. Esto es MUY importante cuando tienes niveles bajos de transmisión para seguir dejándola en un nivel bajo. Puesto que este virus se propaga en oleadas muy asimétricas (de modo que una persona puede infectar a muchísimas más mientras que muchas infectadas contagiar a muy pocos), si no detectas muy bien los eventos de supercontagio cuando hay pocos casos, al tiempo se produce un efecto “bola de nieve”, los brotes se remezclan y se descontrola.

(2) Restricciones a tiempo y apropiadas. Aunque las mascarillas en espacios abiertos algo hacen (en Italia no son obligatorias salvo en espacios cerrados), dado que la transmisión es mucho más probable en espacios cerrados que al aire libre; lo importante es no permitir aglomeraciones en espacios cerrados. En esto hemos fallado.
En España el cierre del ocio nocturno se produce cuando ya estábamos con un volumen de casos casos diarios 10 veces más alto. En Italia cierran el 17 de agosto con 450 casos, nosotros el 14 con 5500. En el transporte sucede algo similar. Ellos han mantenido los transportes públicos a capacidad baja, para respetar las distancias y evitar densidad. En España no.

(3) Control de fronteras y casos importados. Por ejemplo, en Italia se establecen puestos de testeo en los parkings de los aeropuertos, lo que permite mantener el nivel de casos importados bajo sin que se te desmadre. Alternativamente si vas allí, estás obligado a presentar un test realizado en las últimas 48 horas, con un resultado negativo en función del país del que vengas. Esto es así, al menos desde mediados de agosto. Y aunque este factor sea posiblemente una causa menor para explicar la brecha  ya que la divergencia comienza antes, seguro que ha contribuido en el último mes y medio.

Minientrada | Publicado el por | Deja un comentario

Escenarios de desconfinamiento temprano para España a partir de un modelo epidemiológico SEIR ¿Qué podemos esperar?

COVID SEIREste lunes el gobierno español ha decidido empezar la primera fase de desconfinamiento. Vamos a intentar anticipar diversas hipótesis razonables de cómo podría ir la cosa según diversos supuestos y mediante el uso de un modelo SEIR (Susceptible, Expuesto, Infeccioso, Recuperado).

 

Modelo Benchmark: Corea del Sur

Para ello hemos ajustado un modelo con los datos de Corea del Sur tanto para las curvas de infecciosos como para la de decesos para poder estar seguros de que los parámetros básicos del modelo tenían sentido.

Lo que encontramos es que la mortalidad en Corea se está moviendo en un rango de 0.3 a 0.6 y que el período de incubación y de infecciosidad puede asumirse como de 5 días. Además se observa que el reporting de infecciosos y de muertos va más o menos con un decalaje temporal similar de unas dos semanas (14 días) desde el contagio. Asumimos para corea un supuesto de reporting de infecciosos de un 88% , uno de los más altos y que concuerda con otros estudios realizados al respecto: https://cmmid.github.io/topics/covid19/severity/global_cfr_estimates.html

El supuesto será algo conservador, ya que el underrerporting podría ser aún mayor y probablemente tampoco constante sino variable en el tiempo. Pero para poder desarrollar un modelo “boceto” para España ya nos servirá. Basados en los datos de Corea asumimos para España un rango de mortalidad algo superior, del 0.4 al 0.6% según el tramo. Esto es debido a un mayor envejecimiento de la población, un mayor contacto social y también a una mayor saturación del sistema sanitario en el pico de la pandemia.

Asumimos, a tenor de los datos observacionales, que ya estamos transitando el pico de casos activos con lo que en breve deberíamos iniciar la curva descendente. También que, según el estudio citado más arriba, España tiene un reporting del 10% del total de infecciosos. Es decir que hay 10 veces más contagiados de los que se ha dado cuenta oficialmente. Algo lógico debido a la poca atención inicial que las autoridades españolas prestaron al virus y que concuerda también con el hecho de que el virus tuvo que estar circulando por debajo del radar ya durante todo el mes de febrero y probablemente también desde finales de enero. Esa es la clave que explica porque en marzo explota casi de golpe como salido de la nada. Momento en el que la base de infectados es suficiente para que los casos graves lleguen en cantidades relevantes al sistema sanitario.

Escenario no confinado vs confinado

La primera decisión de confinamiento se toma el dia 14 de marzo. Bastante tarde pero aún así suficientemente antes de que la cosa llegue a niveles desmesurados. De no haber hecho nada las consecuencias habrían sido funestas y nos habrían dejado en cifras por encima de los 200.000 muertos solo en casos confirmados y en apenas dos meses, probablemente muchos más debido a una saturación del sistema sanitario fuera de toda escala.

 

Spain1

Y es que la R0 sin contención para España era de alrededor de 5. Un valor altísimo, sin duda.

Escenario con una sola fase de confinamiento a R0 = 1

Gracias a la primera fase de confinamiento parcial en la que aún se mantuvo cierta movilidad laboral no esencial (la llamaremos “parcial1”) hemos curvado la curva lo suficiente para limitar el efecto y contener la cifra de decesos en un máximo de 50.000 por ahora. La R0 ha bajado y se ha situado en alrededor de 1 al menos hasta la segunda fase de confinamiento (la llamaremos “total”).

Dado que el desfase temporal en los datos de infectados es de unas dos semanas será ahora cuando notemos el efecto de esa segunda fase de confinamiento, la total. El problema es que como no tenemos datos del descenso nos es imposible inferir la eficacia de ese confinamiento y es por eso que creemos que la decisión del gobierno es algo imprudente. En teoría estamos justo atravesando la zona pico de casos activos y no podemos aún modelizar con garantías la curva de descenso como hemos hecho para Corea. Así que lo más que podemos hacer son supuestos. Así mismo, al levantar parcialmente el confinamiento corremos el riesgo de que se baje la guardia y nos vayamos de nuevo a valores de la R0 mayores que 1.

 

Escenario de confinamiento en dos fases: 14 a 28 con R0=1 y 28 en adelante con R0=0.7

Asumiendo que no levantamos el confinamiento total y que este ha sido con una R0 como la de Corea, de 0.7 (este dato es el que podremos cuantificar en esta semana del 13 al 19, de ahí la inevitable incertidumbre de los escenarios que siguen). De seguir así hasta el control definitivo de la primera oleada de la epidemia la curva sería bastante buena, dentro de la catástrofe y nos quedaría tal que así:

 

Escenario de confinamiento en tres fases: 14 a 28 con R0=1 , 28 a 12 con R0=0.7 y 12 en adelante con R0=1

Y ahora, ¿qué ocurrirá si dentro de 15 días volvemos a repercutir una R0 de valor 1 tras la reapertura parcial de este lunes? Pues aunque la cosa empeoraría algo la verdad es que seguiría siendo un resultado aceptable, si consideramos aceptable, asumir unas 10.000 muertes más claro está. Aunque si aceptamos el hecho de que, por ahora, con los confinamientos lo único que estamos haciendo es ganar tiempo para descongestionar el sistema sanitario y pertrecharnos de equipamiento, entonces muchos decesos no los estaríamos realmente evitando sino solo retrasando en el tiempo. Al menos hasta que se encuentre un tratamiento o vacuna eficaz. Lo cual puede no ocurrir nunca, no al menos en el curso de la epidemia que podemos intuir que sera de 1 a 3 años en distintas oleadas sucesivas. Lo que quiero decir es que este escenario, siendo peor que el anterior sigue no es ni tan malo habida cuenta de donde nos situamos ahora mismo.

Escenario de confinamiento en tres fases: 14 a 28 con R0=1 , 28 a 12 con R0=0.7 y 12 en adelante con R0=1.15

El riesgo que veo en empezar a desconfinar tan pronto es que la fase tres, la “parcial2” la llamaremos, podría regresar a valores superiores a 1 si nos confiamos y se baja la guardia. ¿Qué pasaría si por un casual se regresa tan solo a un valor de R0 de 1.15?

Pues a poco que en la tercera fase de confinamiento volvamos a una R0 superior a 1 tendremos un rebrote lo que nos podría llevar a duplicar la cifra de muertos respecto al curso actual y alargar la crisis en el tiempo. Y todo eso confiando que la R0 haya bajado ya sustancialmente durante la fase de confinamiento total. Algo que tampoco sabemos aún. En conclusión, el gobierno está decidiendo a ciegas. Podría acertar y si lo hace será por casualidad. Pero si yerra, debido a las dos semanas de desfase con las que recibimos los datos, nos daremos cuenta de nuevo demasiado tarde y la tendremos liada otra vez.

Escenario de confinamiento en dos fases: 9 a 23 con R0=1 y 23 en adelante con R0=0.7

Y ahora como bonus vale la pena preguntarse, ¿qué habría ocurrido si se hubiese actuado tan solo 5 días antes en vez de estar perdiendo el tiempo negando las evidencias para poder llegar abiertos hasta el 8M? Y este es el resultado, habríamos logrado controlar la epidemia en torno a los 12.000 decesos confirmados:

Probablemente no sea muy equivocado afirmar que si el 8M hubiese sido tan solo una semana antes España se habría salvado de lo peor porque muy posiblemente no se habría perdido esa crucial primera semana de marzo en estado de negación y todas las medidas se habrían hecho justo esos 5 días precedentes que serían necesarios para evitar el colapso sanitario que hemos sufrido.

 

Referencias

[1] https://cmmid.github.io/topics/covid19/severity/global_cfr_estimates.html

[2] https://institucional.us.es/blogimus/2020/03/covid-19-analisis-por-medio-de-un-modelo-seir/

[3] https://towardsdatascience.com/social-distancing-to-slow-the-coronavirus-768292f04296

[4] https://www.ijidonline.com/article/S1201-9712(20)30117-X/fulltext

[5] https://www.worldometers.info/coronavirus/coronavirus-incubation-period/

[6] https://annals.org/aim/fullarticle/2762808/incubation-period-coronavirus-disease-2019-covid-19-from-publicly-reported

[7] https://numbersandshapes.net/post/fitting_sir_to_data_in_python/

 

 

Minientrada | Publicado el por | Deja un comentario

¿Cuándo debería levantarse la cuarentena?

En este blog hemos venido trabajando con varios modelos para analizar en tiempo real el brote de COVID-19. El modelo de crecimiento exponencial, crecimiento generalizado (sin límite de contagios, pero útiles para la fase temprana explosiva) y el logístico (mejor a medio plazo, por asumir punto de inflexión).

La observación de los datos publicados del Ministerio de Sanidad en estas últimas dos semanas y media, sugiere que los datos oficiales se ajustan claramente a un patrón logístico y que ya hemos pasado el pico ”natural” de esta primera oleada de COVID-19.

  • Recapitulación

El pronóstico sobre el pico realizado el día 23 (dando fecha y cantidad) se muestra en el Gráfico 1 abajo. Como puede verse, el pronóstico que manejábamos era que el pico de nuevos casos se produciría en el entorno de unos 8500 casos nuevos, y que esto sucedería con máxima probabilidad el día 3 de abril siendo las fechas que cubrían el intervalo de confianza del 95% el [1Abril-11Abril]. Lo que han mostrado los datos es que el pico finalmente se produjo el día 31 de marzo, con unos 9200 casos. Por tanto, se produjo más pronto de lo esperado, y fue más intenso. Sin embargo, como puede observarse, el 70% de los datos sucedidos a dos semanas y media vista, han estado dentro de las bandas de confianza, una cobertura bastante decente.

Gráfico 1: Evolución nuevos contagiados 24M-9A

Peak_Forecast2

Usando los datos más recientes del Ministerio de Sanidad organizados por Datadista, el pronóstico que genera el modelo logístico a fecha de hoy sugiere que lo más probable es que entremos en una fase estacionaria a partir del 17 de abril, con un tamaño final de este primer brote de la pandemia en el entorno de los 180 mil casos. De hecho, se obtiene un resultado muy similar a través de la extrapolación de las tasas de crecimiento de nuevos casos usando datos del 27marzo-9abril (-0.6% por día), que ya reflejan el ritmo de contagios del confinamiento parcial, posterior al decreto de Estado de Alarma (aunque todavía podrían no capturan el efecto del confinamiento total).

Gráfico 2: Contagios acumulados

ForecastCum_Nuevos

  • La curva de contagios activos

Sin embargo, el pico de nuevos contagios no es el relevante para saber cuándo se deberían levantar las medidas de confinamiento, que es lo que le interesa a la mayoría de la gente a estas alturas de la película. El que realmente cuenta en este sentido, es el pico de nuevos casos activos que se calculan como:

Casos activos (t) = Casos confirmados (t) – Recuperados(t) – Defunciones(t)

En el Gráfico 3, vemos que según el modelo logístico el pico de esta variable se produjo el 7 de abril. En rojo se muestra la trayectoria esperada de los casos activos mientras que el período del confinamiento que cubre el período que va del 14 de marzo al 26 de abril se muestra en gris.

Gráfico 3: Casos activos

Forecast_Peak_All

Como puede verse, el valor esperado de casos activos del 26 de abril hace que no sea nada recomendable comenzar a reconectar la sociedad esos días y levantar el confinamiento parcial ya que para esas fechas los casos activos que tendremos todavía estarán por encima de los que había en el momento previo a la declaración del Estado de Alarma. Así, para el 26 de abril, se esperan unos 21 mil casos activos equivalentes a los del 20-21 de marzo. Terminar con la cuarentena parcial de la sociedad en esas fechas sería muy imprudente y arriesgado ya que todo lo que se ha logrado podría perderse fácilmente.

Para que nos hagamos una idea, ya que la curva no es simétrica y tiene una cola larga y gruesa a la derecha (es decir, cuesta más bajarla que subirla), la equivalencia temporal en la fase de bajada sería la siguiente:

Fecha de fin de confinamiento parcial Fecha equivalente parte creciente Número de casos activos
26-abr 21-mar 21000
01-may 17-mar 11500
15-may 09-mar 2000
25-may 04-mar 550
01-jun 02-mar 210
07-jun 01-mar 100

Por tanto, para llegar a la situación inicial de casos activos del 9 de marzo, justo después del famoso fin de semana polémico de las manifestaciones y mítines políticos, tendremos que esperar hasta el 15 de mayo. Puesto que existe un consenso generalizado sobre el hecho de que ese fin de semana ya se debería haber decretado el confinamiento parcial, tampoco parece muy razonable una vuelta a la normalidad para ese entonces. Si quisiésemos retroceder en el tiempo y ponernos al nivel de los 100 casos activos estimados que teníamos el 1 de marzo, deberíamos mantener la cuarentena hasta la primera semana de junio (concretamente el 7 de junio).

Aunque esto sería lo ideal (Wuhan volvió a abrir a las 10 semanas con menos contagiados oficiales), es muy probable que los gobernantes consideren que el país no puede permitirse ese coste a nivel económico, ya que las estimaciones que hay ahora mismo indican que cada 15 días de confinamiento restan unos 3-4 puntos de PIB. Alargar la cuarentena todo abril y mayo supondría una pérdida de unos 8-10 puntos del PIB, a lo que habría que añadir, la destrucción del sector turístico por la más que probable pérdida de la temporada de verano.  Estimamos que este shock estaría más cerca de la caída del PIB de la guerra civil (del 25%) que del colapso financiero y del sector de la construcción de 2008 (del 5%).

  • ¿Cuál es el riesgo de levantar la cuarentena demasiado pronto?

La experiencia de otros países muestra que el virus es muy difícil de controlar, por lo que, si a partir del 13 de abril, se vuelven a abrir actividades económicas no esenciales, del 27-28 de abril en adelante deberíamos ver un repunte en los datos de nuevos contagios. En lugar de las tasas de crecimiento del 0-0.5% de nuevos contagiados que veremos en la fase estacionaria del 15 al 27 de abril (y que se corresponderán con el período de confinamiento total), podríamos pasar a ver crecer el número de nuevos contagiados al ritmo del 3-4% (que es el umbral de crecimiento mínimo observado hasta hora de los datos de confinamiento parcial). Si se levantase el confinamiento general a la población, las tasas del 3-4% que estamos viendo ahora serían una broma. Por tanto, aunque pensamos que es bajo, hay un riesgo de rebrote inminente.

Para ejemplificar los riesgos de reconectar la sociedad hago los siguientes supuestos (esto es simplemente un ejercicio hipotético):

(i) Tras levantarse el confinamiento total el 13, el mismo día 14 de abril la tasa de crecimiento de casos activos aumenta al 2%

(ii) El Gobierno tarda entre 13 y 14 días en detectar lo que sucede por el desfase temporal entre contagios y confirmación del contagio, (mínimo 10 de testeo y 3 días adicionales de lag por el policy making)

(iii) Durante esas 2 semanas y media posteriores, la tasa de crecimiento de nuevos contagiados se acelera y aumenta ligeramente al 0.01% diario

(iv) Una vez se detecta el rebrote el 27 de abril, se vuelve a confinar totalmente a la población, lo que desacelera continuadamente el ritmo crecimiento (al -0.6 diario, como se ha visto en esta última fase con datos del periodo de cuarentena parcial).

Si se diese este escenario  estaríamos hablando de un nuevo pico ya no de 84 mil casos activos sino de 140 mil el 8 de mayo y ya no podríamos “suprimir” el virus a comienzos de junio, sino como pronto, a final de julio. La trayectoria temporal sería la graficada abajo.

Gráfico 4: Escenario de rebrote

Alternative_Scenario

Obviamente que la realidad se ajuste al patrón temporal dibujado arriba depende en gran medida de la validez de los supuestos y todavía hay muchas cosas que desconocemos del virus. Por ejemplo, ¿Cambiará su velocidad de difusión con el uso generalizado de máscaras? ¿Nos darán una tregua las temperaturas y el hecho de que las relaciones se den fundamentalmente en espacios abiertos? Si estos factores, tal y como hipotetizamos, inciden favorablemente, es plausible que la desescalada no derive en un repunte inmediato y se tarde unos meses en volver a los niveles de contagios de marzo (con suerte, deberíamos ver la segunda oleada ascendente en otoño).

En cualquier caso,  hay que insistir en que aunque las cifras de este escenario hipotético son simplemente un “thought experiment”, es un error arriesgarse a abrir tempranamente. El coste económico de mantener el “lockdown” es indudable, pero en economía a lo que hemos vivido lo solemos llamar “sunk costs”. La debacle económica ya no es evitable, y si se mantiene la cuarentena total hasta final de mayo, si que deberíamos ser capaces de extinguir el virus por completo del territorio. De lo contrario, con el tiempo, por no bajar suficientemente la curva de contagios podríamos vernos en una situación en la que no sólo se pierde la economía sino también el control del sistema sanitario por los errores de una política miope.

Minientrada | Publicado el por | 4 comentarios

¿De qué cifras estamos hablando cuando se dice que “lo peor” está por llegar?

En numerosas comparecencias en los medios, el Presidente del Gobierno Pedro Sánchez ha advertido e insistido en que lo peor de la pandemia del COVID1-9 estaba llegar. ¿Pero qué es exactamente lo peor? ¿De qué cifras estamos hablando? En este post analizo la trayectoria esperada de las variables clave de los efectos de la epidemia (contagios, camas de UCI necesarias y muertes) para las próximas semanas. Los números que se obtienen mediante la estimación de modelos epidemiológicos de crecimiento no lineal son demoledores y sirven para hacernos una idea de lo “que está por llegar” en los próximos días.

Recapitulación

En el post anterior del día 10 de marzo cuando lancé los pronósticos de contagiados hasta el 24, todavía estábamos en la fase de arranque y propagación inicial del COVID-19 por lo que suponer que la evolución de los contagiados podía caracterizarse estadísticamente mediante un modelo de crecimiento generalizado (Generalized Growth Model, GGM) a priori, era bastante razonable.

La comparación de los datos oficiales observados entre el 10 de marzo y el 20 de marzo, con el pronóstico a 10 días que se muestra en el Gráfico 1, sugiere que la capacidad del GGM de pronosticar la dinámica del COVID-19 es bastante elevada. En el horizonte de 10 días fuera de muestra sólo los datos del viernes 13 y viernes 20 se fueron del intervalo de confianza del 95%. Esto sugiere que el modelo es bastante fiable lo que está en línea con la evidencia empírica previa sobre el rendimiento predictivo a corto plazo de este tipo de modelos epidemiológicos.

Gráfico 1: Precisión del último pronóstico

Fig1_weeklyforecast

Sin embargo, la capacidad predictiva de cualquier modelo se deteriora conforme aumenta el horizonte de la predicción. A partir del 20 de marzo, la realidad se retrasó un día con respecto al pronóstico del modelo, de modo que lo que se predecía para el 21 ocurría el 22, para el 22 el día 23, etc. En el caso de la modelización de un proceso estadístico explosivo de naturaleza no lineal como el que subyace a la pandemia de COVID-19, el deterioro de los pronósticos es muy sustancial más allá de una semana. Esta incapacidad de predecir con exactitud lo que va a suceder explicaría la reticencia de las autoridades de hablar claro y por ello, los técnicos del gobierno no se mojan.  Sin embargo, un pronóstico probabilístico, en el que cada dato y trayectoria temporal tiene una probabilidad asociada, “nunca se equivoca”.  Puede pasar que lo que suceda finalmente tuviese muy poca probabilidad dada la información existente y se salga de los intervalos de confianza, pero es lo mejor y más honesto que podemos hacer.


La dinámica del COVID-19 y sus efectos sanitarios

Para poder analizar lo que va a suceder, la elección de un proceso generador al que ajustar los datos es importante. Aunque ya llevamos 9 días de cuarentena, la movilidad no se ha reducido por completo y existe un porcentaje relevante de gente que sigue desplazándose todos los días para trabajar. Además, teniendo en cuenta que el período de incubación del virus es de 7 días y que los retrasos promedio en procesar los tests son de 4-6 días (lo que hace que los datos publicados vayan siempre desfasados entre 11 y 13 días), es razonable suponer que hasta el día 28 de marzo no empezaremos a recibir los nuevos datos del patrón de propagación del virus post-cuarentena. Por tanto, mantener el supuesto de que un GGM puede ser preciso pronosticando al menos a 5-6 días vista es realista hasta el día 28/29 de marzo. A partir de estas fechas, una desaceleración sería plausible debido al efecto de la cuarentena, por lo que el análisis también incluye los pronósticos derivados de un modelo crecimiento logístico generalizado (LGM), que permite un punto de inflexión en la curva de contagios y estimar su pico.

Los resultados obtenidos con estos dos modelos que adjunto a continuación se refieren tanto a: (i) número de contagios esperados, (ii) número de camas UCI necesarias esperadas, como (iii) número de muertos esperado.

  • Contagios

Como se puede observar en la Tabla 1, según el GGM el número más probable de contagios con los datos oficiales a final de mes sería de 107 mil contagiados, lo que supondría que en menos de una semana podríamos haber superado a China.

Tabla 1: Evolución esperada del número de contagios

  Modelo de crecimiento exponencial generalizado (GGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 41.189 41.655 42.062
25/03/2020 47.718 48.263 49.549
26/03/2020 55.004 55.677 56.312
27/03/2020 63.127 63.965 64.808
28/03/2020 72.097 73.210 74.340
29/03/2020 82.056 83.486 84.954
30/03/2020 93.122 94.888 96.758
31/03/2020 105.333 107.529 109.826
01/04/2020 107.828 110.530 113.372
  Modelo de crecimiento logístico generalizado (LGM)
Fecha 2.5% inferior Mediana 97.5% Superior
24/03/2020 40.109 40.949 41.892
25/03/2020 45.830 46.975 48.273
26/03/2020 51.899 53.482 55.303
27/03/2020 58.264 60.432 62.965
28/03/2020 64.847 67.790 71.256
29/03/2020 71.543 75.502 80.202
30/03/2020 78.307 83.509 89.794
31/03/2020 85.068 91.753 100.011
01/04/2020 91.758 100.173 110.826

Los resultados del modelo logístico, tanto de nuevos contagios como del total, se muestran en el Gráfico 2. Este es el modelo que permite una inflexión, y apunta a una crecimiento similar durante la próxima semana, aunque ligeramente más moderado. En este caso, para el 31 de marzo el escenario más plausible rondaría los 91.7 mil contagiados.

Gráfico 2: Evolución del total de contagiados

FIG3_TOTALCONTAGIOSLGM

La buena noticia que nos da el modelo logístico es que la fecha más probable del pico de nuevos contagios se produciría el día 3 de abril, tal y como se muestra en el Gráfico 3 (línea roja). A partir de esa fecha, el número de nuevos contagiados disminuiría. El valor más probable de estabilización de la epidemia implicado por el modelo se daría en el entorno de los 8500 nuevos contagiados. Sin embargo, el descenso se prevé lento, por lo que lo más probable es que para el 10 abril todavía no hayamos entrado en la fase estacionaria. En el escenario más optimista, pero muy poco probable, el pico se produciría el 1 de abril, haciendo el máximo de nuevos contagios en el entorno de 6690. El peor escenario implicaría que la fase de crecimiento de los nuevos contagiados no llegaría a su fin hasta el 11 de abril con 14 mil nuevos contagiados.

Gráfico 3: El pico de contagios

FIG4_PRONOSTICO_PEAK

  • Camas UCI

Un problema importante derivado da la propagación del COVID-19, es que el aluvión repentino de contagios con cuadros graves puede desbordar la capacidad de nuestro sistema de salud pública. Por lo general, la necesidad de camas de cuidados intensivos se corresponde a las personas que se contagiaron entre 10 y 14 días atrás y desarrollaron síntomas hace 1 semana. Por tanto, puesto que el crecimiento en contagios ha sido explosivo durante toda la semana, también es plausible suponer que la necesidad de camas UCI lo será durante la semana próxima.

Como se muestra en el Gráfico 4, los ingresos en la UCI han seguido un proceso ligeramente sub-exponencial.  Aunque se estén haciendo esfuerzos por ampliar la resiliencia del sistema sanitario ya sea (i) levantando nuevos hospitales y/o (ii) rehabilitando algunos en desuso, la estimación del stock de camas UCI en España es de unas 4633 (aproximadamente un 3.3% del total de camas de hospital). Desgraciadamente la trayectoria esperada de la ingresos en UCI que se muestra en el Gráfico 5, superará con un 97.5% de probabilidad la capacidad de carga base del sistema el día 28/03, ya que para esa fecha en el mejor de los casos harían falta 5869  camas UCI y en el peor de los escenarios unas 7364. Para el día 31 de marzo el número de camas UCI requerido por el sistema más probable será de unas 10602.

Gráfico 4: Ingresos UCI en España por COVID-19

Fig1ICU_GGM_IFit_24f_22m_ESP

Gráfico 5: Ingresos UCI  esperados

Ingresados_UCI_esperados

Por tanto, la única forma de absorber el shock pandémico de aquí a final de marzo en condiciones pasaría multiplicar por 2.88 (casi triplicar) el número de camas UCI con su debido equipamiento en un plazo de 10 días. Aunque es una tarea muy difícil, no sería imposible si el Estado pusiese en marcha toda su maquinaria. Por contextualizar el dato, este nivel de camas UCI está dentro de los estándares de países como Alemania que tiene 3 veces más camas de UCI que España.

El problema es que la reacción que está mostrando el aparato estatal en la gestión de la crisis está siendo terriblemente lenta y las necesidades van a ir en aumento (y de forma acelerada) conforme pase el tiempo por lo que no me parece muy arriesgado aventurar que la sanidad española colapsará la primera semana de abril cuando se enfrente a sobrecargas del 366% el 1 de abril, del 464% el 2 de abril y del 591% el 3, respectivamente.

Tabla 2:  Evolución esperada del número de ingresos en UCI

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.556 2.710 2.838
25/03/2020 3.153 3.390 3.579
26/03/2020 3.870 4.248 4.549
27/03/2020 4.774 5.330 5.790
28/03/2020 5.869 6.698 7.364
29/03/2020 7.167 8.420 9.361
30/03/2020 8.758 10.602 11.919
31/03/2020 10.693 13.389 15.261
01/04/2020 13.039 16.964 19.584
02/04/2020 15.899 21.527 25.200
03/04/2020 19.392 27.405 32.501
  • Defunciones

Otro dato negativo que está por materializarse es el de los fallecidos. Este dato es el que va más desfasado en el tiempo ya que según la OMS un paciente que desarrolla un cuadro agudo tarda entre 2 y 8 semanas en morir tras ser contagiado, por lo que de nuevo un GGM es apropiado para modelar la trayectoria de defunciones. En el Gráfico 6 se muestra la trayectoria de muertes esperadas con sus respectivas bandas de confianza.

Gráfico 6: Evolución esperada de defunciones

Curva_defunciones

El número de defunciones más probable por la pandemia es de 12402 para el 31 de marzo. Estos datos supondrían mortalidades superiores a las observadas en Italia. El pronóstico central a dos semanas vista, para el día 5 de abril, apunta a un saldo de más de 28 mil fallecidos, 2.5 veces superior a la cota mínima estimada por Victor García aquí, en el que se hacía el supuesto de que se lograría aplanar la curva de un modo similar a lo que hizo China. La Tabla 3 resume las estimaciones de fallecidos esperados.

Tabla 3:  Evolución esperada del número de muertes

Fecha 2.5% inferior Mediana 97.5% superior
24/03/2020 2.722 2.867 3.022
25/03/2020 3.383 3.602 3.836
26/03/2020 4.172 4.494 4.850
27/03/2020 5.105 5.566 6.125
28/03/2020 6.218 6.848 7.704
29/03/2020 7.519 8.392 9.617
30/03/2020 9.016 10.229 11.935
31/03/2020 10.778 12.402 14.732
01/04/2020 12.839 14.964 18.100
02/04/2020 15.212 17.961 22.211
03/04/2020 17.936 21.486 27.159
04/04/2020 21.065 25.571 33.068
05/04/2020 23.431 28.575 37.443

 

Conclusiones y cuestiones abiertas

Los resultados de los modelos de crecimiento no lineal epidemiológicos estimados sugieren que el valor más probable de contagiados para el día 31 de marzo estará entre 91 mil y 107 mil (por encima de China), que el número de camas UCI necesaria para hacer frente al shock al sistema sanitario el 31 de marzo debería ser de 13899 (3 veces más que el stock disponible)  y que el número de defunciones más probable ascenderá a los 12402 mil casos (aproximadamente el doble de los que tiene Italia ahora mismo).

Obviamente la sobrecarga de la sanidad en la ventana de los días 28 de marzo al 3 de abril enmascara que hay comunidades autónomas que tienen más margen que otras para lograr el stock de camas UCIs necesarias para resistir. Sin embargo, todavía no tengo organizadas las estimaciones de la sobrecarga prevista para cada una de ellas los próximos días.

En cualquier caso los números efectivamente muestran que lo peor está por llegar.


Nota técnica: Para los que estén interesados en el ejercicio de modelización del que salen los números que presento les recomiendo leer este paper publicado en el Infectious Disease Modeling. La diferencia principal con este análisis es que en este post, en lugar de utilizar únicamente la información del modelo más reciente, hago un promediado de modelos y pronósticos, introduciendo un factor de olvido geométrico para implementar la ponderación. Así, los pronósticos generados con los modelos alimentados con los últimos datos tienen más peso en el pronóstico ensamblado que los pronósticos de modelos estimados con datos más alejados del presente. Este enfoque de model averaging tiene la ventaja de robustecer el pronóstico contra posibles outliers, artefactos estadísticos y/o fluctuaciones en los datos, que suelen generar grandes discrepancias en las trayectorias pronosticadas.

Fuentes: Wikipedia/Worldometers


Actualización 25/03  5.00h: Los tres datos publicados a última hora del 24/03 de 42,058 contagios acumulados (+19%), de 2,991(+28%) muertes en total  y de 2636 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad.

Actualización 26/03  1.50h: Los tres datos publicados a última hora del 26/03 de 49,515 contagios acumulados (+18%), de 3,647 (+22%) muertes en total  y 3,434 ingresos acumulados en UCI están recogidos en los intervalos de confianza del 95% de probabilidad a 2 días del GGM. Para el LGM, el dato de contagios se va fuera del intervalo del 95%, al 2.5% superior de probabilidad.

Minientrada | Publicado el por | 13 comentarios

COVID-19: ¿Dónde estará el pico de decesos? Estableciendo una cota inferior en base a la curva china

A estas alturas todos somos ya conscientes de que la epidemia ha avanzado de una forma asombrosa. Probablemente debido a una combinación de alta transmisividad y relativa baja letalidad. Este último factor, a la postre sería decisivo para provocar el caos posterior. Primero hizo que la enfermedad se propagara insidiosamente en Wuhan pasando por debajo del radar en China. Incomprensiblemente también, provocó la inacción en Occidente que asistía atónito a la potente reacción asiática, tanto en la propia China como en Korea. Aún teniendo la capacidad de obtener la información tanto Europa como EEUU optaron por no prepararse con el coste actual en vidas y en ruina económica por todos conocido.

¿Hasta cuando va a durar esto? Hasta que no se obtenga una vacuna o un tratamiento eficaz será improbable dar por concluida la amenaza vírica aunque sí es cierto que con tiempo y sufrimiento suficientes la selección natural y la adaptación de nuestras defensas resolverían también el asunto. Podemos distinguir dos fases claramente diferenciadas. La primera fase es estabilizar y reducir el crecimiento de la propagación de la enfermedad. Algo que ya se ha logrado con éxito en Asia pero que está lejos de conseguirse tanto en Europa como en América. Esa debe ser la prioridad y a partir de ahí ya se podrá pensar en la sería la segunda fase en la que se establecerís algún régimen de monitoreo y cuarentena selectiva mucho menos lesivo económica y socialmente que el confinamiento generalizado actual. En ese régimen se permanecería hasta encontrar algún tipo de cura.

En este artículo queremos ofrecer una respuesta cuantitativa a la cuestión de cuándo lograremos estabilizar el brote y en qué cifra de muertos e infectados nos podríamos estabilizar. No pretende ser una respuesta precisa, nadie creo que esté en disposición de hacerlo, pero sí una aproximación parcial que nos de una cota inferior de cual será la gravedad del COVID-19 en los diferentes países. Queremos entrever qué podemos esperar en las próximas semanas. Para el ejemplo trabajaremos con los casos de España e Italia por ser los que cuentan por desgracia con un histórico de defunciones más elevado.

A diferencia de los enfoques de modelización epidemiológica como los SIR (Susceptibilidad, Infección y Recuperación) aquí hemos optado por un enfoque de ajuste más naïf aprovechándonos del decurso infeccioso ya conocido en China. Hemos asumido un supuesto muy simple: “No lo haremos mejor que los chinos“. Para analizar lo que digo veamos el caso de la curva china de decesos por millón de habitantes causados por el COVID-19.

chinaFases

Los chinos fueron capaces de salir de la fase exponencial en dos semanas una vez empezaron a ejecutar sus medidas de contención para luego tirarse aún otros 20 días más en fase de crecimiento lineal. Y todo esto, lo sabemos, con unas medidas aplicadas absolutamente extremas. Especialmente en la provincia de Wuhan, el principal foco de infección. Bastante lejos aún de las medidas aplicadas en España y en Italia. Torcieron la curva y doblegaron la propagación a un alto coste sí, pero mucho menor que el que habrían pagado de haber dejado que se extendiese como hemos hecho en Europa. Sabiendo esto podríamos tomar los chinos como el caso límite para nuestras curvas de crecimiento. Veamos el siguiente gráfico.

CountryCurves

Como vemos si disponemos los datos en escala logarítmica, la curva china es la única que ha alcanzado el régimen estacionario seguida muy de cerca de la coreana que lo habría alcanzado más recientemente. Para proyectar las curvas española e italiana hemos optado por usar la curvatura china, suponiendo que las medidas aplicadas desde ahora funcionasen igual de bien. Cosa que, como podemos suponer no será así ya que son aun demasiado relajadas y partiendo de una situación más grave que de la que partieron los chinos. Pero vamos a hacer ese supuesto razonable, en vistas a hallar nuestra cota inferior, nuestro “best case sceneario”. ¿Cómo lo hemos hecho?

Para empezar hemos ajustado un modelo no lineal mediante la técnica de regresión por redes neuronales a la curva de crecimiento para España e Italia. Del modelo hemos extraído el valor de la pendiente de la curva, su der

pendientes

ivada, en el extremo final. Ese en que queremos empalmar con la curva china. Para asegurarnos de que el valor elegido es razonable hemos modelado 200 redes para cada caso quedándonos con la media de todas las pendientes calculadas. El histograma adjunto muestra las pendientes calculadas para el caso de la curva española. Actualmente nos quedamos con el valor 0.00086.

Obtenido ese valor hemos empalmado con el punto de igual pendiente de la curva china y la hemos representado con una línea a trazos dándonos el siguiente resultado.

Forecasts20

De seguir a partir de hoy el patrón de reducción de China, algo que ya añado que es muy improbable, España estabilizaría la situación en unos 12.500 muertos (270 defunciones por millón) en el plazo de un mes superando en muertos totales a Italia entre el 10 y el 15 de abril momento en el que se saldría de la fase exponencial. Italia que habría entrado en fase lineal una semana antes lograría quedarse en 10.000 fallecidos. Así, de seguir el patrón de la curva china, para finales de abril tanto la curvas italiana como la española deberían estar ya en régimen estacionario.

DEFUNCIONES España Italia
20/03/2020

1000

3800

30/03/2020

4000

7500

10/04/2020

9100

9200

20/04/2020

11500

9800

30/04/2020

12400

10000

Podemos así mismo inferir la cota mínima de infectados a partir de las estimaciones de mortalidad. Así si consideramos un 1% como estimación provisional, 10.000 muertos se correspondería a una incidencia total de 1.000.000 de infectados.

Conclusión

Con este simple método vamos a poder medir de forma cuantitativa, día a día en adelante, si nos seguimos separando de la curva china y por cuanto simplemente reajustando esa cota mínima al actualizar las proyecciones con cada entrada de nuevos datos.

Conviene decir que esto no es una predicción al uso sino solamente un ejercicio que sirve de referencia para decirnos cual sería el impacto mínimo en muertos de la epidemia del COVID-19. Por su naturaleza, estos pronósticos basados en la curva china son conservadores y probablemente muy optimistas así que sería muy normal superar ampliamente las cotas calculadas. A pesar de todo nos pueden servir de referencia para saber día a día quan bien lo estamos haciendo respecto a la curva china y si las medidas de distanciamiento social van o no surtiendo efecto.

Otra cosa para la que nos debería servir este análisis es para darnos cuenta de que cifras inferiores a las calculadas aquí tanto en tiempo y magnitud no serían demasiado creíbles ya que supondrían una ejecución de las medidas de confinamiento más eficaz que la llevada a cabo en China. Así pues, no sería descartable que la estabilización tardase más en llegar y que terminásemos con cifras de defunciones bastante más abultadas que las predichas por el método de la curva china.

Fuente de los datos utilizados

https://www.worldometers.info/coronavirus/

Minientrada | Publicado el por | 8 comentarios

Nueva evidencia sobre la dinámica de crecimiento del Covid-19 en España

En esta entrada se analiza la evolución del coronavirus en España durante las últimas   semanas, utilizando los últimos datos disponibles en Wikipedia.

El objetivo de este artículo es doble.  Además de repasar los últimos datos aparecidos, la idea es analizar el patrón de crecimiento mediante la estimación de un Generalized Growth Model (GGM) como en Chowell et al. (2017). y tratar de predecir su evolución.

La modelización matemática y estadística en epidemiología, es especialmente útil para estudiar la propagación de epidemias y puede servir para aportar evidencia sobre las trayectorias más plausibles para las próximas semanas. El ejercico de modelización que presento parece bastante sensible al último dato recogido el 9 de marzo por lo que los resultados hay que tomarlos con cautela.  Aún así, los resultados del GGM estimado con datos para el período comprendido entre el 23 de febrero y el 9 de marzo apuntan a que:

(i) el número de contagiados más plausible para final de semana es de 7.766 y

(ii) que dentro de dos semanas el número de contagios ascendería a los 88.782 casos.

Los datos

El motivo de utilizar los datos Wikipedia y no los oficiales, se debe a que éstos están más en línea con los reportados por otras webs que se están actualizando continuamente como son la de RTVE, Worldmeter o el Johns Hokpins. De hecho, como se ve en el Gráfico 1, el Ministerio de Sanidad y el European Center of Disease Control ECDC parecen estar reportando menos casos que el resto de fuentes de forma sistemática.  En cualquier caso, y con independencia de las discrepancias, en el número exacto de los casos (a las 00.00h del 10 de marzo la Wikipedia apuntaba 1.231 casos vs Ministerio/ECDC con 1.024 casos), el patrón observado en el Gráfico (1) es claramente geométrico, tal y como se mencionó en la entrada anterior aquí  a fecha de miércoles 4 de marzo.

Gráfico 1. Evolución de contagiados por Covid19 en España 24 febrero-09 marzo

Graph1_Wiki_vs_Official1

El Gráfico (2) muestra el número de incidencias o casos diarios. Como puede apreciarse, en los últimos días, el número de casos se ha incrementado sustancialmente. El día 6 de marzo se añadieron 119 casos, el 7 de marzo 115 casos y el 8 de marzo 158 casos. La última actualización en el momento de escribir este artículo (a las 00.00h del 10/03/2020) implica un crecimiento durante el 9 de marzo muy abrupto, de 558  casos.

Gráfico 2. Evolución nuevos contagios 1 febrero – 09 marzo

Graph2_nuevoscontagiosv1
Nota: cálculos basados en la actualización de las 00.00h del 10/03/2020, Wikipedia 

 

El Gráfico 3 a continuación, aporta información de (i) las tasas de variación diarias y de  los factores de (ii)  duplicación y  (iii) multiplicación  por 10, desde el 24 de febrero (fecha del despegue) hasta el 9 de marzo. Los datos implican que para este período, el número de contagiados se está duplicando cada 1.65 días (aprox 40 horas) y que se multiplicaría por un factor de 10 cada 5.48 días (aprox 132 horas).

Gráfico 3: Tasas de crecimiento diarias y factores de multiplicación

Graph3_GrowthRates1

Nota: cálculos basados en la actualización de las 00.00h del 10/03/2020, Wikipedia 

El modelo

Aunque el cálculo de estos factores de multiplicación es informativo de la seriedad de la situación, la estimación de modelos econométricos ampliamente aceptados en el campo de la epidemiología puede permitirnos obtener conclusiones más precisas sobre la propagación del virus. En este sentido, la modelización de epidemias tiene todo un repertorio de modelos matemáticos y estadísticos para analizar su progresión tras la fecha del estallido. Algunos bastante comunes son: (i) el SIR (Susceptibles-Infectados-Recuperados) y  (ii) el SEIR (Susceptibles-Expuestos-Infectados-Recuperados), que utilizan la información de varias variables que desafortunadamente no están disponibles para el caso de España (por lo que he mirado, no existe una serie temporal consolidada de las recuperaciones).

Para analizar la evolución del número de contagiados de Covid-19 en España se emplea un Generalized Growth  Model que sólo requiere la estimación de dos parámetros clave y que se ha mostrado muy eficaz a la hora de predecir outbreaks víricos en otros contextos (Viboud et al., 2016). Una ventaja de este modelo con respecto a un modelo de crecimiento exponencial simple es que permite relajar el supuesto de crecimiento exponencial en las primeras fases mediante un parámetro de escala p. El modelo viene dado por la siguiente ecuación diferencial:

EquationSimpleGrowth

donde C'(t) describe el crecimiento de las incidencias en el período t, C(t) es el número total de contagiados en t, r es un parámetro positivo que captura la tasa de crecimiento y p es el parámetro de desaceleración del crecimiento, que se supone entre 0, 1.

Si p=0, esta ecuación describe una incidencia constante en el tiempo y el número de casos crece de forma lineal, mientras que si p=1 el modelo describe un patrón de crecimiento sub-exponencial (i.e, patrón polinómico).  La estimación de los parámetros clave del modelo r y p, utiliza los datos existentes desde el 23 de febrero al 9 de marzo y se lleva a cabo mediante NLSQ (Non-linear Least Squares).  Como se observa en el Gráfico 4, aunque el modelo es relativamente preciso a la hora de explicar el patrón temporal de los contagiados de Covid-19 tiende a infraestimar ligeramente los contagios del 1 al 4 de marzo y a sobreestimarlos en los días 7 y 8 de marzo. El error más elevado está en el último dato del 9 de marzo. Como vamos a ver, el que el cambio brusco de ayer 9 de marzo sea una nueva tendencia o bien un outlier, tiene consecuencias importantes para la predicción.

Gráfico 4: Ajuste dentro de muestra

Graph4_InSampleFit2

En el Gráfico 5 a continuación, se muestra la distribución aproximada de los parámetros r y p mediante bootstrapping (asumiendo una distribución Poisson en el error)  con 200 repeticiones.  El parámetro de la tasa de crecimiento r toma el valor mediano de 0.6364 mientras que el valor del parámetro de escala p toma el valor de 0.938, lo que sugiere un comportamiento sub-exponencial.

Una de las cuestiones importantes que nos permite la estimación de los parámetros clave del GGM en la fase temprana de la epidemia es que con ellos en mano, es posible determinar el R0 del virus, es decir, el número promedio de casos nuevos que genera un caso a lo largo de un período infeccioso (Chowell et al, 2016). Sin embargo, para obtener el  R0 es preciso una estimación externa de lo que en epidemiología se denomina el intervalo de serie del virus (Tg), que se refiere al tiempo entre casos sucesivos en una cadena de transmisión. Las estimaciones existentes sobre Tg en el caso del coronavirus apuntan a que este parámetro está entre 4 y 5.2 (ver aquí y aquí) lo que indicaría un valor promedio del R0 centrado entre 2.54 y 3.3 para España, por encima de los datos de la Organización Mundial de la Salud (OMS) que estimaba que el valor del R0  se situó entre el 2 y 2.5 para el caso de China.

Gráfico 5: Distribución de los parámetros del modelo e incertidumbre

Graph5_Distribution

En el panel inferior, del Gráfico 5 se incorpora la incertidumbre a la predicción mostrada en el Gráfico 4 derivada del posible error de estimación de los parámetros.

Una de las cosas que podemos hacer con el modelo es utilizarlo para predecir la evolución de casos. Es importante destacar que aunque el modelo ajuste bien los datos dentro de muestra, otra cosa muy diferente es utilizarlo para predecir el futuro con certeza. Para ver si un modelo es fiable en sus pronósticos, en casi todos los campos se suelen realizar ejercicios de “backtesting”, que básicamente consisten en probar la capacidad predictiva del modelo haciendo pronósticos fuera de muestra en momentos pasados y comparar los resultados con lo que finalmente sucedió. Aunque un análisis más riguroso de su fiabilidad pasaría por estimar el período en una ventana móvil e ir haciendo los pronósticos recursivamente,  el ejercicio aquí es más sencillo. Consiste en alimentar el modelo únicamente con datos del período comprendido entre el 23 de febrero y el  4 marzo y ver, si las predicciones para los días del 5, 6, 7 y  8 de marzo no se desvían mucho de lo que ha sucedido. El Gráfico 6 muestra que el resultado de este ejercicio de backtest: los intervalos de confianza de la predicción a 4 días vista cubren en todo momento la trayectoria observada. Por tanto, el miércoles pasado ya se podía prever que para el domingo 8 como poco habría 600 casos y como máximo 1200 casos.

Gráfico 6: Backtesting del GGM,  4 marzo – 8 marzo

Graph6_BackTestOutOfSampleForecast

Finalmente, el Gráfico 7 muestra los resultados de utilizar el modelo con los parámetros estimados r=0.6364 y p=0.938, teniendo en cuenta su incertidumbre (outputs de los Gráficos 4 y 5) y utilizando toda la información disponible desde el 23 de febrero al 9 de marzo para pronosticar la trayectoria del 10 al 24 de marzo. Por otro lado, en la Tabla 1 se reporta la predicción mediana o central por días, así como el intervalo de confianza del 95%. Los resultados apuntan a que con un 95% de probabilidad los contagios se situarán entre los 6400-9991 siendo el escenario más probable el de los 7.766 contagios.   Para dentro de dos semanas el escenario central sería de 88.782 casos y el intervalo de [56.300-155.776] casos. Como se observa en el ensanchamiento de las bandas de confianza del Gráfico 7,  la incertidumbre es muy elevada y  crece considerablemente conforme nos alejamos del origen del pronóstico.

Gráfico 7: Predicciones modelo

Graph6_DoomForecast

Tabla 1: Proyecciones del número de contagios en España

Fecha2.5%
Inferior
Mediana97.5%
Superior
10/03/2020149515951748
11/03/2020204622282525
12/03/2020276630793602
13/03/2020367942255097
14/03/2020486457597162
15/03/2020640077669991
16/03/202083601042813851
17/03/2020108261393419114
18/03/2020138911849126211
19/03/2020177142437135641
20/03/2020225433191248248
21/03/2020285614160365071
22/03/2020359925387787462
23/03/20204512769387117015
24/03/20205630088782155776

En cualquier ejercicio de modelización y/o pronóstico un punto importante es el de la robustez. En este sentido, es importante mencionar que el dato de ayer del 9 de marzo es bastante clave en la generación de este resultado tan explosivo, y que los resultados presentados NO son robustos. De hecho, el mismo modelo estimado y calibrado únicamente hasta el 8 de marzo (adjunto las trayectorias pronosticadas dentro y fuera de muestra abajo) no implicaba una evolución tan explosiva. A una semana y dos semanas vista, las horquillas que cubren el 95% de probabilidad serían de [5-9 mil] y de [15-34 mil] contagiados respectivamente.

Contagiados_model_fit24_08_forecast

Forecast_08m_23m

El que el dato del 9 de marzo finalmente sea un outlier o un cambio drástico de tendencia, va a ser clave para sacar conclusiones y lo sabremos pronto. En cualquier caso, tanto si nos quedamos con el output del modelo alimentado únicamente con información hasta el 8 de marzo  (mínimo 4 mil casos adicionales) como si nos fiamos de lo que dice el modelo alimentado con información más reciente (mínimo 5200 casos adicionales),  los resultados de este análisis sugieren que las medidas de control de la epidemia en España tendrán que ser muy enérgicas si no queremos que el coronavirus se extienda masivamente por la población y el territorio.

En el caso de Italia las medidas de cierre de colegios en todo el país se tomaron hace ya días 5 días con 3 mil contagios y aún con ello, el número ha crecido a 9 mil infectados. Está por ver su efectividad pero ayer se tomaron medidas drásticas de cuarentena y restricción a la movilidad en todo el territorio italiano hasta el 4 de abril. Aunque sean duras, parecen correctas puesto que existe evidencia que apunta a que las restricciones a la movilidad implementadas en China sirvieron para evitar los escenarios de crecimiento exponencial. Dejo los enlaces aquí y aquí.

—————————————————————————————————————————————
*** Actualización a las 15.00h del 10/03/2020: Con 1592 casos se confirma que el dato del 9 de marzo no era un outlier ya que el crecimiento observado parece ajustarse al modelo usando toda la información muestral. De hecho, puede que a final del día el dato sea tan elevado que caíga en el 2.5% de probabilidad que tenían las trayectorias de contagios por encima de los 1748 casos.

*** Actualización a las 00.00h del 11/03/2020: Con 1695 casos se confirma que el dato del 9 de marzo no era un outlier ya que el crecimiento observado parece ajustarse al modelo usando toda la información muestral.  El resultado del pronóstico a 1 día finalmente cae dentro del intervalo del 95%. 

Minientrada | Publicado el por | 3 comentarios

Notas sobre la propagación temporal del Coronavirus: España vs Italia

He estado haciendo unos números sobre la propagación de la epidemia del coronavirus y creo que ya se puede decir que en España ésta se ha descontrolado, al igual que sucedió en el caso de Italia. Usando los datos oficiales de la UE (https://www.ecdc.europa.eu/…/geographical-distribution-2019…) y las revisiones de wikipedia (que se actualizan más rápido) se observa que:

1) Ya se está formando una curva exponencial

CasosContagioESP

2) La tasa de crecimiento diaria en los días 24 febrero-04 marzo ha sido proximadamente del 55% ~= exp(0.44) -1

LnContagiosESP_UltimosDias

3) Llevamos un desfase de 10 días con Italia, ya que a 24 de febrero allí también contabilizaron 227 casos (nosotros hemos llegado a esa cifra a cierre de 4 de marzo)

Desfase10dias_ITA_ESP

4) El crecimiento en ESP es más estable que el de Italia que tiene dos fases diferenciadas : del 15-24 feb tasas muy aceleradas del 105% y del 25feb-04 marzo más suaves del 35.7%. En concreto, el crecimiento promedio diario en Italia desde el 15 de febrero al 4 de marzo ha sido del 70.5%, superior al 55% de España.

LnContagios_ITA_ESP

5) En los últimos 6 días las tasas de variación se han situado a la par (las tendencias lineales más recientes son casi paralelas) por lo que el virus ahora mismo estaría expandiéndose al mismo ritmo en ambos países
LnContagiosESP_ITA_Last6Dias

*** Esto ya no es evidencia, sino especulación, pero sirve para hacernos una idea del período/timming para el podría comenzar a remitir la epidemia y de la implementación de medidas de contención.

Teniendo en cuenta el desfase de 10 días con Italia, es probable que las políticas para cortar la propagación que ha tomado hoy el Gobierno Italiano (cierre de escuelas, universidades, prohibición de aglomeraciones, etc) se apliquen en España a final de la semana que viene.

Por otro lado, si pensamos en un escenario hipotético muy optimista, en el que la evolución en España fuese similar a la de China y se siguiese el patrón temporal cuadrático del gráfico de abajo (lo que es complicado, debido a las fuertes medidas de control y cuarentena que se implementaron allí y que en una sociedad occidental serían muy mal vistas por la población), en este caso, el peak de contagios de la epidemia se produciría el 7 de abril con unos 80 mil casos acumulados (asumiendo una mortalidad del 1%, esto supondría 800 muertos).

Contagiados_quadratic

 

 

 

 

Minientrada | Publicado el por | 2 comentarios

O libre determinación o colonización

Image result for vieñeta new york times catalonia

Es recurrente el debate sobre si Catalunya tiene o no derecho de autodeterminación y creo que se hace en unos términos poco razonables y más fruto del nacionalismo español de pelo en pecho que del raciocinio sosegado y sesudo. Voy a ofrecer varios argumentos lógicos según los cuales Catalunya sí tiene derecho a ejercer ese derecho.

Una afirmación común es decir que el derecho a decidir no se recoge en las Naciones Unidas. Poner semejante excusa es claramente escurrir el bulto ya que la expresión “derecho a decidir” aplicada al debate sobre la cuestión catalana no es más que una forma más elegante y moderna de decir “derecho de autodeterminación” solo que con mejor estilo. Así que, por supuesto que está recogido.

Frente al derecho de autodeterminación nos encontramos con el conocido argumento de que este solo es aplicable a las colonias. Es un argumento que tiene poco sentido y resulta muy cuestionable y contradictorio, como veremos. Pero es que, además, partir de dicha negación es estéril e improductivo para resolver una cuestión que necesita ya la aceptación mayoritaria del cuerpo electoral catalán. Y dado que cualquier consulta que se haga en un contexto de choque de soberanías puede ser convertido de facto en un referéndum de autodeterminación por quienes deseen la secesión negar dicho derecho sólo contribuye a bloquear un problema que en esencia es democrático y político. Reflexión ésta que también debieron hacerse británicos y canadienses antes de decidir aceptar consultar a Escocia y Quebec respectivamente.

 

De la supuesta necesaria condición de colonia. El derecho de libre determinación o de autodeterminación al que España se adhirió firmando en 1977 los principios de la Carta de las Naciones Unidas (https://www.boe.es/buscar/doc.php?id=BOE-A-1977-10733) no especifica que solo las colonias puedan acogerse a él, habla de “pueblos”. Lo que ocurre es que solo se ha desplegado ampliamente para los casos prototípicos que se dieron en abundancia durante los años de la posguerra. Principalmente debido a la descomposición de los antiguos imperios británico y francés. Así, el principio de libre determinación se desarrolló exprofeso para esas realidades concretas y muy comunes en esa época lo que no significa que no pueda posteriormente desarrollarse también para otras realidades, tal y como se ha demostrado recientemente con el caso de Kosovo. Más recientemente, Montenegro mismo ha nacido del acuerdo de un referéndum de autodeterminación. O a los pueblos de Escocia y Quebec que han podido pronunciarse libremente sobre dicha cuestión, sin amenazas ni desprecio, desde el respeto del estado matriz a su soberanía como pueblos y en absoluta concordancia con el citado principio. Que no esté expresamente recogido en sus constituciones no es óbice para que si se dan las circunstancias deba contemplarse su ejercicio ya que todos ellos son firmantes de la carta de las Naciones Unidas.

Pues bien, a mi parecer la cuestión catalana se ha enconado ya tanto que sólo puede resolverse aceptando que ese referéndum debe suceder. Quizá hubo un tiempo en que no fue así pero ciertamente ese momento hace mucho que ya pasó. Y es que precisamente la condición de colonia no es algo que venga dado de jure sino que es valorativo. Me explico con un ejemplo clásico, Cuba no era formalmente una colonia sino una provincia de España, como lo pudiera ser Galícia. Sin embargo, fue el comportamiento de España con Cuba lo que determinó la naturaleza colonial de su relación. O podemos fijarnos en Argelia colonia que acabó formando varios departamentos en igual condición a los situados en territorio francés porque Argelia era también Francia, se daba ya por asimilada. Vemos que es pues el modo y la forma lo que en última instancia define la condición colonial de una relación de poder entre un territorio y el estado matriz. Si es de sumisión obligada a una metrópolis que la exprime entonces la relación será colonial y si no lo és no lo será. Sin entrar a valorar la condición actual de la relación Catalunya – España es evidente que esta es disfuncional y en cierto modo ya obligada. Una relación por tanto que no puede ser calificada de normal y que puede caer en la peligrosa pendiente del trato colonial habida cuenta de que hace tiempo que ha dejado de ser tratada con respeto ni justicia; fundamentalmente a partir del proceso de reforma estatutaria que sabemos todos cómo acabó y culminando en los barcos enviados a sus costas y cargados con miles de antidisturbios. Y no hay mayor expresión colonial que tener que traer elementos externos y armados para controlar a la fuerza a un territorio.

El estado español tiene pues dos opciones ahora mismo. O permite que los catalanes puedan pronunciarse libremente sobre cómo quieren encajar o siquiera si quieren encajar en España o se emperran en negar ese derecho lo que conllevaría profundizar en ese trato colonial que los porrazos del 1 de octubre comenzaron a rebelar ante el mundo. Y este es el problema. Que de la represión de un deseo mayoritario de la sociedad catalana (alrededor del 75% de los cuales manifiestan la voluntad de votar sobre la cuestión) se termina derivando la relación de dominación que permite esgrimir ese derecho ante las Naciones Unidas. Por tanto, lo que los estados inteligentes y modernos hacen es anticiparse, no dejar que las aguas se desborden y encauzar cuanto antes esas demandas de forma sensata y pacífica. También porque es lo que más conviene a sus intereses ya que la negación de ese derecho es precisamente lo que alimentará aún más el deseo de independizarse.

España llega tarde a todo eso y lo cierto es que, tal y como lo veo, no se reformará a menos que justamente acepte la necesidad de dicha consulta. Porque, no nos engañemos, España ahora mismo no tiene incentivos para reformarse y ofrecer un acuerdo federal o confederal que agrade a Catalunya más que si existe un referéndum de autodeterminación de por medio. Por eso el referéndum es necesario no solo para los independentistas sino también y sobretodo para los catalanes que queriendo mantener la unión con España esperan y desean una propuesta que venga del Estado y que sea lo suficientemente atractiva como para que pueda derrotar al proyecto republicano catalán. Porque la batalla democrática es lo único que permite cerrar del todo las heridas, sea en el sentido que sea. Porque supone ganar o perder mediante el juego meramente democrático con la fuerza de los argumentos y no con el único argumento de la fuerza. Se evita así todo riesgo de caer en una situación de dominación a la fuerza de un territorio que, se quiera o no, ha demostrado con su querer ser, que no es soluble y que merece ser tratado como una entidad nacional propia de pleno derecho.

Minientrada | Publicado el por | Deja un comentario

El ocaso de Pedro Sánchez o el rescate fallido del bipartidismo

Pedro Sánchez ha dimitido como Secretario General del PSOE. En la pugna mantenida contra el sector liderado por Susana Díaz, muchos han inclinado sus simpatías hacia Pedro, tanto dentro como fuera del PSOE.

Pero lo bien cierto es que resulta más que dudoso que con Pedro Sánchez no hubiésemos seguido teniendo a Rajoy en Moncloa porque es más que dudoso que nunca hubiese dejado de priorizar su lucha contra Podemos sobre cualquier otra cosa (para salvarse como la pata izquierda de un rescatado bipartidismo y resucitar el fundamento del régimen del 78) y todos sus movimientos aparentes hacia un gobierno de progreso hubieran seguido siendo un postureo para, como ya viene siendo norma, tratar de imponer la narrativa de que “el PSOE intenta un gobierno de progreso pero resulta que Podemos lo impide”. Pedro nunca hubiese pactado gobierno con Podemos, siempre habría, en todo caso, “postureado” con esa perspectiva para tratar de imponer narrativas beneficiosas para el PSOE en los futuros escenarios de confrontación electoral y, por tanto, con Pedro hubiéramos ido a terceras elecciones y hubiéramos seguido teniendo a un Rajoy incólume en Moncloa. Desde este punto de vista, puede considerarse positiva la dimisión de Pedro Sánchez si  se interpreta esto como el fin de la farsa pesoísta. Susana es más “lista” (si se quiere, como las ratas) pero el PSOE tenía más futuro con Pedro ya que ha venido demostrando más inteligencia. ¿Por qué?

Pues porque los intereses personales de Pedro Sánchez eran coincidentes con un rescate del Régimen del 78. En la medida en que su línea estratégica iba prioritariamente encaminada a destruir a Podemos en una lucha sin cuartel resulta que sus esfuerzos iban encaminados de hecho a mantener la lógica bipartidista. Es curioso cómo precisamente el sector más rancio del PSOE, el más cercano a las posiciones más rancias del R78, ha sido precisamente el que puede estar dando la estocada al R78 mediante la fatal condena al PSOE hacia la pasokización y, con ello, sentenciando el derrumbe del régimen en un gesto suicida.

Obviamente, ni parece plausible que Pedro Sánchez tuviera la altura de miras (o “visión de estadista”) como para ser consciente de ello y perseguirlo (desde una coherencia ideológica y ética que podría ser discutible pero sin duda que al menos respetable) ni tampoco parece plausible que Susana Díaz tenga la altura de miras para comprender la trascendencia de su golpe de estado. Esa es la altura política que primaba en el PSOE. Así que no sorprende que el PSOE se encuentre ahora en una situación de inminente pasokización.

El derrumbe del PSOE es un paso más en la descomposición del régimen, aunque no es en absoluto descartable que el régimen tenga aún cierta capacidad de regeneración. No deja de resultar sorprendente la performance de sus actores principales en este conservador cometido.

Minientrada | Publicado el por | Deja un comentario