domingo, 5 de abril de 2020

Modelos matemáticos tradicionales y su falta de ajuste al CoVID-19


Modelado epidémico 101: ¿O por qué sus ajustes exponenciales de CoVID19 son incorrectos?

Bruno Gonçalves
Medium


En las últimas semanas, una terrible aflicción se ha extendido por todo el mundo. De lo contrario, los miembros sanos y productivos de la sociedad se han infectado con esta enfermedad devastadora que hace que enciendan Excel, Python o R y comiencen a extrapolar los últimos números de casos confirmados de CoVID19 en su ciudad, estado, país o incluso en todo el mundo.



XKCD: “By the third trimester, there will be hundreds of babies inside you”

Bromas aparte, la severidad de la epidemia actual de SARS-CoV-2 es innegable y es natural que las personas lidien con el estrés adicional en sus vidas (y el tiempo libre adicional debido a los procedimientos de cierre) de varias maneras.

Una demografía particularmente afectada ha sido la mía, la de los físicos, lo que ha dado lugar al surgimiento de una pequeña industria artesanal de publicaciones de blog, publicaciones de LinkedIn e incluso documentos de arXiv con sus mejores intentos de modelar la propagación de la enfermedad, con poca o ninguna comprensión de dinámica subyacente a la propagación de epidemias.

Invariablemente, nuestros intrépidos seguidores de John Snow (no en el que estás pensando) terminan con alguna variación de esta trama que compara el número acumulado de casos o muertes en varios países en función del tiempo con una tasa de crecimiento exponencial directa.


Financial Times, March 29, 2020


Se producen extrapolaciones a números poco realistas, pronósticos sobre cuándo un país podría superar a otro, consideraciones sobre el éxito o el fracaso de las medidas de contención y varias otras travesuras.

Llevar el orden a un mundo caótico siempre ha sido la fuerza impulsora del progreso humano y se puede argumentar que esta es simplemente su última encarnación: los Numerati intentan usar sus habilidades de modelado y ciencia de datos para dar sentido al mundo que los rodea. Una tendencia que ha llevado en los últimos años a un progreso impresionante en el aprendizaje automático, la inteligencia artificial y la ciencia de datos. Desafortunadamente, si bien existen buenas razones para esperar que las primeras etapas de la propagación de la epidemia sean exponenciales, existen muchos factores prácticos que conspiran contra la eficacia del ajuste de curva simple y un poco de conocimiento previo sobre el modelo de epidemia tradicional puede ser muy útil.

Lo que sigue es mi perspectiva personal, como individuo con cierta experiencia en el mundo real en modelos epidémicos durante pandemias anteriores y no debería reflexionar sobre ningún grupo o institución con la que pueda estar afiliado.

Modelos compartimentales


El modelado matemático en Epidemiología tiene una historia larga y rica, que data de la década de 1920 con la teoría de Kermack-McKendrick. La idea básica es engañosamente simple: podemos dividir a la población en diferentes compartimentos que representan las diferentes etapas de la enfermedad y usar el tamaño relativo de cada compartimento para modelar cómo evolucionan los números en el tiempo.

En la discusión a continuación, presento varios modelos y escenarios simples para ayudar a ilustrar los problemas simplemente tratando de hacer un ajuste de curva en los números empíricos. Puede encontrar el cuaderno que escribí para implementar los modelos y generar las figuras en el repositorio de GitHub que hice específicamente para esta publicación:

Enlace e GitHub


Modelo SI

Comencemos por echar un vistazo al modelo de epidemia más simple posible: el modelo de infección susceptible. Aquí dividimos nuestra población en dos compartimentos, el compartimento sano (generalmente denominado Susceptible) y el compartimento Infeccioso. La dinámica también es simple, cuando una persona sana entra en contacto con una persona infecciosa se infecta con una probabilidad dada. Y, en este simple ejemplo, cuando estás infectado, permaneces infectado para siempre. Matemáticamente, esto a menudo se escribe como:



Descripción matemática del modelo de infección susceptible

lo cual es una manera elegante de decir que la pérdida en el número de personas sanas es la misma que la ganancia en las filas de los infectados. Más específicamente:

  • N es simplemente el tamaño total de la población
  • β es la tasa de infección
  • It / N es la fracción de personas infectadas y representa la probabilidad de que una persona susceptible se encuentre con una infectada.

No es sorprendente que este no sea un modelo muy interesante: dado el tiempo suficiente, todos se infectan:


Fracción infecciosa de la población total en función del tiempo.

Este modelo simple considera solo una forma de transición entre compartimentos: de S a I a través de la interacción (contacto) entre S e I. Una forma compacta de representar esto es:



La transición en el modelo SI

Modelo SIR


Se pueden desarrollar modelos epidémicos más realistas agregando más compartimentos y transiciones. El modelo más común es el modelo Susceptible-Infeccioso-Recuperado:




Modelo SIR

Aquí tenemos un nuevo compartimento, Recuperado, que representa a las personas que han tenido la enfermedad en el pasado y que desde entonces se han recuperado y se han vuelto inmunes. La presencia de Recuperado reduce lentamente la cantidad de individuos infecciosos a medida que se les permite recuperarse.


En términos de transiciones, esto se puede escribir como:

Las transiciones en el modelo SIR

Donde la segunda línea representa una transición espontánea (no interactiva) de Infecciosa a Recuperada a una tasa fija μ.

O, matemáticamente, como:

Modelo Susceptible-Infeccioso-Recuperado

lo que deja en claro que el crecimiento en el número de recuperados depende solo del número actual de individuos infecciosos. También se debe tener en cuenta que este modelo implica un tamaño de población constante:

 
Población total fija

También se podría escribir una expresión similar para el modelo SI.

Si ahora integramos el modelo SIR completo, encontramos:



Fracción de la población en cada compartimento en función del tiempo.

Se deben notar algunas cosas sobre esta trama:

  • El número de individuos Susceptibles solo puede disminuir
  • El número de Recuperados solo puede aumentar
  • El número de individuos Infecciosos crece hasta cierto punto antes de alcanzar un pico y comenzar a disminuir.
  • La mayoría de la población se infecta y finalmente se recupera.

Si nos acercamos solo al comportamiento del compartimento infeccioso, encontramos:


Compartimento infeccioso SIR

Lo que significa que una fracción significativa de la población puede infectarse al mismo tiempo, lo que puede causar (dependiendo de la gravedad de la infección) que el sistema de salud se vea abrumado. Cuando escuche sobre “aplanar la curva”, esta es la curva a la que se refieren.


La conversación / CC BY ND

De la expresión matemática del modelo SIR anterior, se pueden obtener fácilmente algunos resultados interesantes. Si nos centramos en los primeros días de la propagación de la epidemia, podemos suponer que la fracción de individuos susceptibles todavía es ~ 1 y encontramos:



¡El exponencial que todos intentan encajar! Aquí,


se pronuncia "R nada" y es el Número de reproducción básico de la enfermedad. Este número simple define si tenemos o no una epidemia. Si Rₒ <1 la enfermedad muere, de lo contrario, ¡crece exponencialmente!


Una forma intuitiva de interpretar el Rₒ es el número promedio de nuevas infecciones producidas por un solo individuo infeccioso. Si una persona puede transmitir la enfermedad al menos a otra antes de recuperarse, la epidemia puede continuar; de lo contrario, desaparecerá.

Esto es lo que necesitamos determinar y depende de muchos factores diferentes que son característicos del virus, como Kate Winslet lo describió elocuentemente en la película de 2011, Contagion (ver abajo).






Las mejores estimaciones actuales del valor Rₒ para el SARS-CoV-2, el coronavirus que causa el CoVID-19, es de alrededor de 2.5.

El valor de Rₒ también juega un papel fundamental en la determinación del curso de la epidemia. Si consideramos la segunda ecuación que describe el modelo SIR:


Encontramos que la derivada del número de infecciosos se vuelve negativa siempre que:


Este es el punto en el que hemos alcanzado el pico y la epidemia comienza a desaparecer. Este es el punto en el que la población comienza a tener suficiente de lo que se conoce como inmunidad colectiva para que la enfermedad no pueda propagarse más. Siempre que haya vacunas disponibles, los programas de vacunación están diseñados para ayudar a la población a alcanzar la inmunidad del rebaño sin tener que infectar a una fracción significativa de la población.

Rₒ también determina la fracción final de toda la población que no se verá afectada por la enfermedad:



Donde se refiere a la fracción total de individuos sanos (y nunca infectados) después de que la epidemia haya tenido tiempo de seguir su curso por completo. Esta expresión no es susceptible de solución de forma cerrada, pero se puede usar para estimar numéricamente el valor de . La figura SIR anterior se generó usando Rₒ = 2 y vemos que ~ 0.2, que se puede verificar fácilmente conectando estos números en esta expresión.

Consideraciones prácticas

Hasta ahora, nuestro análisis de modelos epidémicos se ha centrado en el escenario ideal que parece justificar el enfoque de ajustar curvas exponenciales como una forma simple de tratar de pronosticar el curso de la epidemia. Desafortunadamente, el mundo real es significativamente más complejo en una variedad de formas.

Casos asintomáticos y levemente infecciosos.

Una de las limitaciones del enfoque descrito hasta ahora es que hace algunas suposiciones poco realistas:
  • No hay incubación ni período de latencia. Un período de incubación retrasa toda la línea de tiempo de la epidemia. Un problema que no es significativo para nuestros propósitos aquí.
  • Hay un solo tipo de individuo infeccioso. En el mundo real, los diferentes sistemas inmunes responden de manera diferente al virus, lo que hace que algunas personas sean completamente asintomáticas (sin síntomas) y casos levemente infecciosos. En el caso de CoVID-19, se cree que el número de casos asintomáticos es del 40% o más.

Ambas dificultades pueden abordarse agregando nuevos compartimentos y transiciones a nuestro modelo SIR básico sin mucha dificultad. Sin embargo, plantean desafíos importantes cuando se trata de los números oficiales publicados.

En los primeros días de la epidemia, solo los casos más graves (no asintomáticos y no leves) se enferman lo suficiente como para buscar ayuda médica y ser diagnosticados oficialmente. Naturalmente, esto lleva a un retraso en la detección de los primeros casos en una ciudad o país dado y una sobreestimación de la gravedad de la enfermedad, ya que los casos más graves tienen más probabilidades de morir.

Los números publicados también suelen ser acumulativos, lo que hace que los números totales parezcan más grandes. Una manera simple de extraer una medida del número de posibles casos confirmados de nuestro modelo SIR simple es contar cuántas personas han sido retiradas del compartimiento Susceptible. Al definir ϕ como la fracción de casos infecciosos que se hacen la prueba, tenemos:



Casos confirmados

Como resultado, los números que se publican dependen directamente de la fracción de casos que son lo suficientemente graves como para llevar atención médica y ser evaluados:



Casos confirmados en el modelo SIR


 El número de individuos recuperados (observados) seguirá una trayectoria similar, aunque con unos pocos días de retraso debido a la línea de tiempo natural de la enfermedad:


Número de casos recuperados observados

Naturalmente, con enfermedades nuevas lleva tiempo desarrollar y distribuir pruebas precisas. Si consideramos además que la fracción de prueba ϕ también depende del tiempo, entonces es fácil ver cómo muchas de las características observadas en la línea de tiempo de casos confirmados son causadas por políticas locales y disponibilidad de pruebas:




Efecto de la tasa de prueba dependiente del tiempo


En esta figura comparamos el número de casos infecciosos reales (en morado), el resultado de una prueba uniforme (línea naranja discontinua) y las tasas de prueba dinámicas (línea naranja continua). Para mayor claridad, trazamos las diferentes curvas en una escala logarítmica (el cambio de una línea de rejilla horizontal a la siguiente corresponde a un factor de 10x) e incluimos una línea de ajuste exponencial (delgada línea azul) como guía para el ojo que representa el tendencia exponencial general.

Retrasos dinámicos

Otro factor importante a considerar es la evolución temporal que es intrínseca a la progresión de la enfermedad. Un individuo sano entra en contacto con una persona infecciosa y se infecta. Su infección durará un número específico de días, lo que significa que el número actual de individuos infecciosos es la suma de todos los que se infectaron hoy, ayer, el día anterior, etc.… y aún no ha tenido tiempo de recuperarse.

Esto implica que existe un retraso natural entre el pico de nuevas infecciones y el pico en el número total de individuos infecciosos que es proporcional a la duración del período infeccioso.


Retraso entre el pico en nuevas infecciones y el número de individuos con infecciones actuales

Una consecuencia importante de este retraso es que incluso si el número de nuevas infecciones hoy es menor que ayer y el día anterior, pasarán varios días antes de que los efectos sean notables como una reducción en el número total de casos infectados.

Procedimientos de encierro

A medida que la epidemia ha progresado, muchos países de todo el mundo, comenzando con China, han tratado de implementar procedimientos de bloqueo o cuarentena para tratar de contener la propagación de la enfermedad. Estas medidas han demostrado ser impopulares con el público debido a sus consecuencias sociales y económicas, por lo que es importante comprender el efecto que tienen en detener la propagación de la epidemia.

Imaginemos el escenario de contención perfecto. Agito una varita mágica y cada uno se queda en casa, exactamente a 6 pies de distancia el uno del otro en todo momento y no se pueden generar nuevas infecciones. En nuestro marco SIR, esto corresponde a establecer repentinamente Rₒ = 0 o simplemente eliminar la transición de interacción del modelo. Los resultados son asombrosos:




Estrategia de contención perfecta. La estrategia se implementa en el momento indicado por la línea discontinua vertical y se mantiene el tiempo que sea necesario para que el número de individuos infecciosos llegue a cero.

Si bien no se generan nuevas infecciones, el número total de individuos infectados sigue siendo alto durante varias semanas a medida que las personas actualmente afectadas se recuperan gradualmente de la enfermedad.

Naturalmente, ninguna estrategia de contención es perfecta, pero digamos que hacemos un trabajo bastante bueno y en lugar de llevar el Rₒ a 0 logramos llevarlo a 0.5. Como hemos mostrado anteriormente, cada vez que Rₒ <1 la epidemia comienza a desaparecer, pero lleva mucho más tiempo que en el escenario ideal y da como resultado un mayor número de infecciones totales:







Estrategia de contención imperfecta. La estrategia se implementa en el momento indicado por la línea vertical y se mantiene durante el tiempo que sea necesario para que el número de infectados llegue a cero. Las líneas continuas finas corresponden al escenario perfecto anterior y se muestran para comparación.

Sin embargo, si, por alguna razón, los costos sociales o económicos del bloqueo se consideran demasiado costosos y la cuarentena se levanta prematuramente, simplemente volvemos al escenario anterior de propagación de epidemia sin restricciones:


Estrategia de contención imperfecta. La estrategia se implementa en el momento indicado por el área sombreada vertical. Las líneas continuas discontinuas y finas corresponden a los escenarios de bloqueo imperfecto y sin intervención, respectivamente, y se muestran para comparación.

Como podemos ver, un cierre prematuro roto rápidamente da como resultado una segunda ola de la epidemia que conduce a casi tantos casos totales como si no hubiera habido intervención alguna. Sin embargo, todavía tiene el beneficio de mantener el número máximo de personas enfermas por debajo de lo que normalmente sería y una "expansión" de la curva epidémica: en otras palabras, el aplanamiento de la curva que ayudará a prevenir la abrumadora atención médica sistema.
Para mayor claridad, veamos también la cantidad de casos infecciosos.


Estrategia de contención imperfecta. La estrategia se implementa en el momento indicado por el área sombreada vertical. Las líneas continuas discontinuas y finas corresponden a los escenarios de bloqueo imperfecto y sin intervención, respectivamente, y se muestran para comparación.
No le corresponde a un físico pobre como yo opinar si el cierre mundial actual vale la pena económica o socialmente. Lo mejor que puedo hacer es ayudarlo a comprender mejor sus efectos prácticos.

Poblaciones estructuradas

Esta publicación ya es extremadamente larga, pero me gustaría considerar un punto extra. Los modelos compartimentales, por su propia naturaleza, hacen simplificaciones y suposiciones significativas. Una suposición fundamental es que la población subyacente está bien mezclada: cada individuo está en contacto potencial con cualquier otro individuo. Si bien esto es claramente falso para cualquier población grande, a menudo es una aproximación suficientemente buena para el análisis cualitativo de la dinámica de la epidemia.

Sin embargo, si tratamos de extender demasiado este tipo de modelos, descubriremos rápidamente que los países y las ciudades no son poblaciones homogéneas. Los países están formados por estados, los estados están constituidos por ciudades y zonas rurales, etc.


Representación esquemática de la epidemia entre poblaciones vecinas.

Dentro de cada población, la epidemia continuará como hemos descrito anteriormente, pero cuando combinamos múltiples poblaciones, los resultados son mucho menos claros. Consideremos dos poblaciones, digamos dos ciudades vecinas. La epidemia comienza en uno de ellos y, a través de desplazamientos o viajes, eventualmente, un individuo infeccioso infectará la ciudad vecina, lo que provocará una diferencia de tiempo entre las dos poblaciones. Si tratamos ingenuamente a estas poblaciones múltiples como una sola (como cuando se observan solo los totales estatales o nacionales), la curva resultante se ve fuertemente afectada por la diferencia de tiempo entre las dos poblaciones, lo que resulta en curvas epidémicas que muestran poca o ninguna similitud con la simple ejemplos que hemos analizado hasta ahora, haciendo que cualquier momento de ajuste exponencial sea una búsqueda ociosa con poco o ningún uso práctico.




Fuentes

Si has llegado hasta aquí, felicidades. Ahora sabe más sobre el modelado epidémico que la mayoría de los intrépidos instaladores de curvas y esperamos que no cometa los mismos errores que están cometiendo.

Y si todavía desea más, la Parte II de esta serie de blogs ya está publicada: Epidemic Modeling 102: All CoVID-19 models are wrong, but some are useful, pero algunos son útiles y debe consultarlos.

No hay comentarios:

Publicar un comentario