Mostrando entradas con la etiqueta webscraping. Mostrar todas las entradas
Mostrando entradas con la etiqueta webscraping. Mostrar todas las entradas

martes, 5 de mayo de 2020

Usando aprendizaje automático para predicción del brote de COVID-19

Una metodología de aprendizaje automático para la predicción en tiempo real del brote COVID-19 2019-2020 mediante búsquedas en Internet, alertas de noticias y estimaciones de modelos mecanicistas

Dianbo Liu, Leonardo Clemente, Canelle Poirier, Xiyu Ding, Matteo Chinazzi, Jessica T Davis, Alessandro Vespignani, Mauricio Santillana
ArXiv


Presentamos una metodología oportuna y novedosa que combina estimaciones de enfermedades a partir de modelos mecanicistas con trazas digitales, a través de metodologías de aprendizaje automático interpretables, para pronosticar de manera confiable la actividad COVID-19 en las provincias chinas en tiempo real. Específicamente, nuestro método es capaz de producir pronósticos estables y precisos 2 días antes de la hora actual, y se utiliza como insumos (a) informes oficiales de salud del Centro Chino para el Control y la Prevención de Enfermedades (CDC de China), (b) relacionados con COVID-19 actividad de búsqueda en Internet de Baidu, (c) actividad de medios informativos informada por Media Cloud, y (d) pronósticos diarios de actividad COVID-19 de GLEAM, un modelo mecanicista basado en agentes. Nuestra metodología de aprendizaje automático utiliza una técnica de agrupamiento que permite la explotación de sincronías geoespaciales de la actividad COVID-19 en las provincias chinas, y una técnica de aumento de datos para tratar el pequeño número de observaciones históricas de actividad de la enfermedad, característica de brotes emergentes. El poder predictivo de nuestro modelo supera a una colección de modelos de referencia en 27 de las 32 provincias chinas, y podría extenderse fácilmente a otras geografías actualmente afectadas por el brote de COVID-19 para ayudar a los tomadores de decisiones.