sábado, 29 de junio de 2019

Modelos epidémicos basados en estructuras de red simuladas

Inferencia de red a partir de la observación a nivel poblacional de epidemias

F. Di Lauro, J.-C. Croix, M. Dashti, L. Berthouze, I.Z. Beso


El paradigma de redes es ampliamente aceptado como el estándar de oro en el modelado de sistemas complejos tales como epidemias o actividad neuronal en el cerebro; sin embargo, en la mayoría de los casos, se desconoce la naturaleza exacta de la red en la que se desarrolla dicha dinámica. Esto ha motivado una cantidad significativa de trabajo en la inferencia de la red. Si bien una gran cantidad de trabajo se ocupa de inferir la estructura de red basada en datos temporales detallados a nivel de nodo, en este trabajo abordamos el escenario más desafiante de inferir la familia de la red subyacente cuando solo se dispone de datos de incidencia temporal a nivel de población. Un obstáculo clave es la alta dimensionalidad prohibitiva del modelo epidémico estocástico resultante. Para abordar esto, aproximamos el modelo susceptible-infectado-susceptible (SIS) en redes mediante un proceso de Nacimiento-Muerte, cuyas tasas codifican la estructura de la red subyacente y la dinámica de la enfermedad. Usando simulaciones sistemáticas, proponemos un modelo parsimonioso (tres parámetros) de estas tasas y mostramos que diferentes familias de redes bien conocidas se mapean en distintas regiones del espacio de parámetros de este modelo. Este resultado proporciona una caracterización a priori de diferentes familias de redes. Luego, dados los datos de la epidemia temporal a nivel de la población, empleamos un clasificador bayesiano para derivar distribuciones posteriores en diferentes familias de redes. Demostramos que la metodología propuesta produce excelentes resultados cuando se prueba en redes sintéticas y del mundo real. Nuestro marco se extiende fácilmente a muchas familias de redes y procesos de difusión y podría proporcionar un nuevo punto de referencia en la inferencia de redes a partir de datos a nivel de población.




Tópicos: Populations and Evolution (q-bio.PE); Physics and Society (physics.soc-ph)
Citar como: arXiv:1906.10966 [q-bio.PE]
(or arXiv:1906.10966v1 [q-bio.PE] para esta versión)


martes, 18 de junio de 2019

Cómo, con qué, para qué: Herramientas para investigar datos de Twitter

Uso de Twitter como fuente de datos: una visión general de las herramientas de investigación en redes sociales (2019)

LSE Impact Blog




Twitter y otras plataformas de redes sociales representan un recurso grande y en gran parte sin explotar para datos y pruebas sociales. En esta publicación, Wasim Ahmed actualiza su serie recurrente en el Blog de Impacto, para ofrecerle los últimos desarrollos en métodos y metodologías digitales para investigar Twitter y otras plataformas de medios sociales.

Esta publicación se basa en las ediciones de 2015 y 2017 de esta publicación, captura tendencias y eventos clave que están configurando la investigación en redes sociales para los científicos sociales y proporciona una colección de métodos y herramientas de investigación para el análisis de datos de redes sociales.

Desde la edición de 2017 de esta publicación de blog, he visto usos aún más únicos e interesantes de los datos de las redes sociales en una amplia variedad de disciplinas de investigación, como sociología, informática, medios y comunicación, ciencia política e ingeniería, solo por mencionar pocos. Las plataformas de medios sociales generan una gran cantidad de datos diariamente sobre una variedad de temas y, en consecuencia, representan una fuente clave de información para cualquiera que busque estudiar la sociedad del siglo XXI.

Twitter sigue siendo la plataforma más popular para la investigación académica, ya que aún proporciona sus datos a través de una serie de interfaces de programación de aplicaciones (API). En contraste, las consecuencias de la "violación de datos" de Cambridge analytica han llevado a ciertas plataformas de redes sociales a limitar los datos proporcionados a través de sus interfaces de programación de aplicaciones. Sin embargo, aunque puede que no sea posible obtener datos de todas las plataformas de redes sociales, aún es posible realizar una investigación cualitativa y cuantitativa, como entrevistas y encuestas, con miembros de comunidades en línea.

Los estudios en redes sociales se pueden encuadrar a partir de una amplia variedad de teorías, construcciones y marcos conceptuales de una amplia variedad de disciplinas y recomendaría echar un vistazo a este documento: Social media research: Theories, constructs, and conceptual frameworks, que resume muy bien algunos de estos enfoques.

También hay una serie de enfoques de investigación que se pueden utilizar como Netnography y Digital Ethnography, que proporcionan marcos para realizar investigaciones en el mundo en línea. La netnografía, por ejemplo, puede basarse en la descarga de datos directamente desde una plataforma de redes sociales, anotando observaciones personales de una comunidad en línea y entrevistando a usuarios de redes sociales. Además, también hay una serie de métodos específicos para el análisis de datos de redes sociales que se resumen en la Tabla 1 a continuación.



Tabla 1: Resumen de los métodos de investigación

La Tabla 2 a continuación proporciona una descripción general de las herramientas para recuperar datos de redes sociales


Tabla 2: Una revisión de las herramientas para 2019
*Algunas herramientas pueden permitir el acceso a otras plataformas y la capacidad de importar sus propios datos.

Recientemente, también se ha vuelto cada vez más difícil para los académicos acceder a datos históricos de Twitter con una serie de servicios para académicos que están llegando a su fin. Esto ha dado lugar a servicios como los proporcionados por ScrapeHero, que permiten a los usuarios obtener datos históricos de Twitter de forma gratuita mediante el uso de web scraping. Sin embargo, esta forma de recuperar Twitter no es recomendable.

Para investigar otras plataformas en Internet, como foros web, blogs y otras plataformas de medios sociales, existen herramientas como Scrape Storm, que es un raspador de web visual basado en la inteligencia artificial y pretende poder recuperar datos de casi cualquier plataforma.

También hay una serie de aplicaciones avanzadas de análisis de datos y estadísticas que se pueden usar para analizar datos de redes sociales, como:

Estos paquetes deben investigarse al decidir qué aplicación se utilizará para un proyecto. También me gustaría mencionar la lista de herramientas de Iniciativas de Métodos Digitales, y la lista de herramientas de la Universidad Ryerson de su Laboratorio de Medios Sociales. Para recuperar datos de Twitter también vale la pena revisar el DMI-TCAT (gratis). SAGE Ocean publicó recientemente una revisión adicional de 100 herramientas de redes sociales.

Para el análisis de imágenes, recomendaría revisar la visión de Google Cloud AI y también existen herramientas como Instaloader que le permiten descargar fotos de Instagram de cuentas públicas. Se realizó un estudio realmente interesante en Instagram y se analizó el hashtag #CheatMeal utilizando el análisis de contenido temático y se puede acceder aquí.

Otro campo en rápido desarrollo de la investigación en redes sociales se centra en la ética. Es importante realizar una investigación ética en redes sociales y recientemente publiqué un capítulo de libro de acceso abierto, que examina el uso de Twitter como fuente de datos y brinda una descripción general de los desafíos éticos, legales y metodológicos. Se puede acceder al capítulo aquí.

Debido a una serie de solicitudes, también he empezado a realizar eventos de capacitación regulares (consulte la lista aquí) con la posibilidad de asistencia virtual. El primero de estos eventos se llevó a cabo en la Escuela de Economía y Ciencias Políticas de Londres el 17 de mayo de 2019 y nuestro hashtag # SMRM19 contiene una gran cantidad de material informativo, ya que el evento fue tweeteado en vivo.