miércoles, 10 de julio de 2019

Explicando diferencias de género en la academia: La duración de la carrera explica mucho

Comparación histórica de la desigualdad de género en las carreras científicas entre países y disciplinas

Junming Huang, Alexander J. Gates, Roberta Sinatra, Albert-Laszlo Barabasi
(Enviado el 9 de julio de 2019)
PDF



Existe una amplia evidencia, aunque fragmentada, de diferencias de género en la academia, lo que sugiere que las mujeres están poco representadas en la mayoría de las disciplinas científicas, publican menos artículos a lo largo de una carrera y su trabajo adquiere menos citas. Aquí, ofrecemos una imagen completa de las discrepancias de género longitudinales en el rendimiento a través de un análisis bibliométrico de las carreras académicas mediante la reconstrucción de la historia completa de la publicación de más de 1,5 millones de autores con identidad de género cuya carrera editorial terminó entre 1955 y 2010, cubriendo 83 países y 13 disciplinas. Encontramos que, paradójicamente, el aumento de la participación de las mujeres en la ciencia en los últimos 60 años fue acompañado por un aumento de las diferencias de género tanto en la productividad como en el impacto. Sin embargo, lo más sorprendente es que descubrimos dos invariantes de género, al encontrar que hombres y mujeres publican a una tasa anual comparable y tienen un impacto equivalente en su carrera para el mismo tamaño de trabajo. Finalmente, demostramos que las diferencias en las tasas de deserción y la duración de la carrera explican una gran parte de las diferencias informadas en cuanto a la carrera en la productividad y el impacto. Este panorama integral de la desigualdad de género en el mundo académico puede ayudar a reformular la conversación sobre la sostenibilidad de las carreras de las mujeres en el mundo académico, con importantes consecuencias para las instituciones y los responsables de la formulación de políticas.





sábado, 29 de junio de 2019

Modelos epidémicos basados en estructuras de red simuladas

Inferencia de red a partir de la observación a nivel poblacional de epidemias

F. Di Lauro, J.-C. Croix, M. Dashti, L. Berthouze, I.Z. Beso


El paradigma de redes es ampliamente aceptado como el estándar de oro en el modelado de sistemas complejos tales como epidemias o actividad neuronal en el cerebro; sin embargo, en la mayoría de los casos, se desconoce la naturaleza exacta de la red en la que se desarrolla dicha dinámica. Esto ha motivado una cantidad significativa de trabajo en la inferencia de la red. Si bien una gran cantidad de trabajo se ocupa de inferir la estructura de red basada en datos temporales detallados a nivel de nodo, en este trabajo abordamos el escenario más desafiante de inferir la familia de la red subyacente cuando solo se dispone de datos de incidencia temporal a nivel de población. Un obstáculo clave es la alta dimensionalidad prohibitiva del modelo epidémico estocástico resultante. Para abordar esto, aproximamos el modelo susceptible-infectado-susceptible (SIS) en redes mediante un proceso de Nacimiento-Muerte, cuyas tasas codifican la estructura de la red subyacente y la dinámica de la enfermedad. Usando simulaciones sistemáticas, proponemos un modelo parsimonioso (tres parámetros) de estas tasas y mostramos que diferentes familias de redes bien conocidas se mapean en distintas regiones del espacio de parámetros de este modelo. Este resultado proporciona una caracterización a priori de diferentes familias de redes. Luego, dados los datos de la epidemia temporal a nivel de la población, empleamos un clasificador bayesiano para derivar distribuciones posteriores en diferentes familias de redes. Demostramos que la metodología propuesta produce excelentes resultados cuando se prueba en redes sintéticas y del mundo real. Nuestro marco se extiende fácilmente a muchas familias de redes y procesos de difusión y podría proporcionar un nuevo punto de referencia en la inferencia de redes a partir de datos a nivel de población.




Tópicos: Populations and Evolution (q-bio.PE); Physics and Society (physics.soc-ph)
Citar como: arXiv:1906.10966 [q-bio.PE]
(or arXiv:1906.10966v1 [q-bio.PE] para esta versión)


martes, 18 de junio de 2019

Cómo, con qué, para qué: Herramientas para investigar datos de Twitter

Uso de Twitter como fuente de datos: una visión general de las herramientas de investigación en redes sociales (2019)

LSE Impact Blog




Twitter y otras plataformas de redes sociales representan un recurso grande y en gran parte sin explotar para datos y pruebas sociales. En esta publicación, Wasim Ahmed actualiza su serie recurrente en el Blog de Impacto, para ofrecerle los últimos desarrollos en métodos y metodologías digitales para investigar Twitter y otras plataformas de medios sociales.

Esta publicación se basa en las ediciones de 2015 y 2017 de esta publicación, captura tendencias y eventos clave que están configurando la investigación en redes sociales para los científicos sociales y proporciona una colección de métodos y herramientas de investigación para el análisis de datos de redes sociales.

Desde la edición de 2017 de esta publicación de blog, he visto usos aún más únicos e interesantes de los datos de las redes sociales en una amplia variedad de disciplinas de investigación, como sociología, informática, medios y comunicación, ciencia política e ingeniería, solo por mencionar pocos. Las plataformas de medios sociales generan una gran cantidad de datos diariamente sobre una variedad de temas y, en consecuencia, representan una fuente clave de información para cualquiera que busque estudiar la sociedad del siglo XXI.

Twitter sigue siendo la plataforma más popular para la investigación académica, ya que aún proporciona sus datos a través de una serie de interfaces de programación de aplicaciones (API). En contraste, las consecuencias de la "violación de datos" de Cambridge analytica han llevado a ciertas plataformas de redes sociales a limitar los datos proporcionados a través de sus interfaces de programación de aplicaciones. Sin embargo, aunque puede que no sea posible obtener datos de todas las plataformas de redes sociales, aún es posible realizar una investigación cualitativa y cuantitativa, como entrevistas y encuestas, con miembros de comunidades en línea.

Los estudios en redes sociales se pueden encuadrar a partir de una amplia variedad de teorías, construcciones y marcos conceptuales de una amplia variedad de disciplinas y recomendaría echar un vistazo a este documento: Social media research: Theories, constructs, and conceptual frameworks, que resume muy bien algunos de estos enfoques.

También hay una serie de enfoques de investigación que se pueden utilizar como Netnography y Digital Ethnography, que proporcionan marcos para realizar investigaciones en el mundo en línea. La netnografía, por ejemplo, puede basarse en la descarga de datos directamente desde una plataforma de redes sociales, anotando observaciones personales de una comunidad en línea y entrevistando a usuarios de redes sociales. Además, también hay una serie de métodos específicos para el análisis de datos de redes sociales que se resumen en la Tabla 1 a continuación.



Tabla 1: Resumen de los métodos de investigación

La Tabla 2 a continuación proporciona una descripción general de las herramientas para recuperar datos de redes sociales


Tabla 2: Una revisión de las herramientas para 2019
*Algunas herramientas pueden permitir el acceso a otras plataformas y la capacidad de importar sus propios datos.

Recientemente, también se ha vuelto cada vez más difícil para los académicos acceder a datos históricos de Twitter con una serie de servicios para académicos que están llegando a su fin. Esto ha dado lugar a servicios como los proporcionados por ScrapeHero, que permiten a los usuarios obtener datos históricos de Twitter de forma gratuita mediante el uso de web scraping. Sin embargo, esta forma de recuperar Twitter no es recomendable.

Para investigar otras plataformas en Internet, como foros web, blogs y otras plataformas de medios sociales, existen herramientas como Scrape Storm, que es un raspador de web visual basado en la inteligencia artificial y pretende poder recuperar datos de casi cualquier plataforma.

También hay una serie de aplicaciones avanzadas de análisis de datos y estadísticas que se pueden usar para analizar datos de redes sociales, como:

Estos paquetes deben investigarse al decidir qué aplicación se utilizará para un proyecto. También me gustaría mencionar la lista de herramientas de Iniciativas de Métodos Digitales, y la lista de herramientas de la Universidad Ryerson de su Laboratorio de Medios Sociales. Para recuperar datos de Twitter también vale la pena revisar el DMI-TCAT (gratis). SAGE Ocean publicó recientemente una revisión adicional de 100 herramientas de redes sociales.

Para el análisis de imágenes, recomendaría revisar la visión de Google Cloud AI y también existen herramientas como Instaloader que le permiten descargar fotos de Instagram de cuentas públicas. Se realizó un estudio realmente interesante en Instagram y se analizó el hashtag #CheatMeal utilizando el análisis de contenido temático y se puede acceder aquí.

Otro campo en rápido desarrollo de la investigación en redes sociales se centra en la ética. Es importante realizar una investigación ética en redes sociales y recientemente publiqué un capítulo de libro de acceso abierto, que examina el uso de Twitter como fuente de datos y brinda una descripción general de los desafíos éticos, legales y metodológicos. Se puede acceder al capítulo aquí.

Debido a una serie de solicitudes, también he empezado a realizar eventos de capacitación regulares (consulte la lista aquí) con la posibilidad de asistencia virtual. El primero de estos eventos se llevó a cabo en la Escuela de Economía y Ciencias Políticas de Londres el 17 de mayo de 2019 y nuestro hashtag # SMRM19 contiene una gran cantidad de material informativo, ya que el evento fue tweeteado en vivo.

lunes, 27 de mayo de 2019

Convocatoria Libro: "El ARS desde Latinoamérica"


LIBRO: “EL ANÁLISIS DE REDES SOCIALES DESDE LATINOAMÉRICA”
Francisca Ortiz
Alejandro Espinosa-Rada 
CONVOCATORIA
El análisis de redes toma en consideración distintos niveles de análisis, ya sea desde el entorno que rodea a una persona (ego-red), pasando por pequeñas sub-estructuras que emergen en redes completas (tales como sub-grupos u otras configuraciones), la descripción de la red global (su composición u otras características generales), la yuxtaposición de varias redes (multiplexas, de k-modos o de multinivel) o la comparación de un conjunto de éstas (muestreo de ego-redes o de redes completas).
En términos metodológicos y empírico, las redes pueden ser descritas relacionando micro mecanismos (tales como selección, influencia, homofilia, asortatividades, entre otros) con métricas formales, permitiendo describir e incluso modelar estadísticamente los modos en que se constituyen los lazos en complejas redes sociales.
En la actualidad el análisis de redes se encuentra en un estado de desarrollo exponencial, congregado en diversos países latinoamericanosy congresos nacionales (ANSNANASN), regionales (EUSNRLARS) e internacional (SUNBELT). Principalmente al alero de importantes organizaciones como la “International Network for Social Network Analysis” (INSNA) y de un conjunto relevante de revistas especializadas con alto índice de impacto en las ciencias sociales. Componiendo así un campo fructífero de desarrollo científico en las ciencias sociales.
El libro estará compuesto por tres secciones, y el autor deberá mencionar a cuál de estas secciones postula:
  • Aspectos teóricos del Análisis de Redes Sociales.
  • Metodologías del Análisis de Redes Sociales.
  • Investigaciones empíricas aplicadas al contexto latinoamericano.
En relación a las secciones de aspectos teóricos y metodológicos, se espera que las contribuciones permitan difundir áreas consolidadas del análisis de redes sociales que no se encuentren disponibles en español y/o que planteen alguna contribución de tal forma de hacer accesible la perspectiva de redes a un público amplio interesado en introducirse o profundizar en esta línea de investigación, especialmente orientado a ser un libro referente para cursos enfocados al análisis de redes. Estas secciones no se encuentran restringidas al contexto latinoamericano esperando que tengan un alcance más amplio y transversal a las ciencias sociales.
Con respecto a la sección de investigaciones empíricas aplicadas al contexto latinoamericano, el libro tiene como pretensión representar a un conjunto amplio de aplicaciones en diversos países latinoamericanos o de estudios comparados en donde se involucren distintos países de la región, junto con cubrir un conjunto amplio de temáticas de interés para las ciencias sociales.

Normas editorial: 
Los capítulos tendrán una extensión de entre 7.000 palabras máximo, contando en ello la bibliografía. Para la fecha de entrega del avance de capítulo, los autores deberán enviar su borrador de 4.000 palabras, de tal forma de que los editores puedan realizar comentarios a sus avances.
Usar: Idioma español, letra Time New Román, tamaño 12, espacio sencillo y referencias Apa 6 ta edición.
Los trabajos finales se entregarán el 13 de abril del 2020,  serán sometidos a revisión de pares evaluadores y, finalmente, al proceso de edición y publicación. El proceso completo de edición conlleva que los autores modifiquen su texto, también en función de las líneas del libro. Esto significa que el capítulo de libro no estará 100% seguro en la impresión del libro, ya que eso será definido en último término por los pares evaluadores anónimos. Así, además de los editores, los pares evaluadores también formarán parte de la decisión final de que capítulos formaran parte del libro completo.

Fechas importantes:
EVENTOFECHAS
Convocatoria abierta para presentar resúmenes (300 a 400 palabras):11 de marzo 2019 – 31 de mayo 2019 
Anuncio de resúmenes aceptados: 1 y 2 de julio 2019
Recepción de avances (4.000 palabras): 14 de diciembre 2019
Entrega de comentarios y/o correcciones a los autores de parte de los editores: 15 de enero 2020
Entrega final del capítulo (7.000 palabras):13 de abril 2020
Proceso de corrección de parte de editores:13 de abril 2020 – 1 de julio 2020 
Proceso editorial (corrección, aceptación, edición):Julio 2020 – Febrero 2021
Fecha estimada de publicación de libro:Primer semestre 2021
Los editores se reservan el derecho de no aceptar alguno de los capítulos, si se devela en sus entregas suficientes críticas como para ello. Actualmente no existe un compromiso previo con alguna editoiral, por lo que los editores mantendrán actualizados a los autores del proceso de maquetación, edición y publicación de este en sus debidos tiempos. Esto implica que los tiempos del libro estarían subordinados a los tiempos que manejaría la editorial elegida para publicar el texto final.
Para el envío de resúmenes:
  • Enviar breve carta de presentación (breve justificación de la sección a la que postula, originalidad del manuscrito, conflictos de interés, posibles pares evaluadores). Extensión máxima: una plana.
  • Adjuntar CV actualizado
  • Resumen de 300 a 400 palabras
  • Enviar antecedentes a los siguientes correos: francisca.ortiz@manchester.ac.uk, alejandro.espinosa@manchester.ac.uk
Se recomienda a los autores la siguiente bibliografía:
  • Bellotti, Elisa (2014). “Qualitative Networks: Mixed methods in sociological research”. Routledge, London. 
  • Borgatti, Stephen; Everett, Martin & Johnson, Jeffrey (2018) “Analyzing Social Networks”. SAGE, The United States of America. 
  • Brandes, Ulrik; Robins, Garry; McCraine, Ann & Wasserman, Stanley (2013). What is network science? Network Science,(1)1: 1-15.
  • Crossley, Nick (2012). “Towards relational sociology”. Routledge, London.
  • Crossley, Nick; Bellotti, Elisa; Edwards, Gemma; Everett, Marton; Koskinen, Johan & Tranmer, Mark (2015). “Social Network Analysis for Ego-Nets”. SAGE, London.                 
  • Hanneman, Robert A (2001). “Introducción a los métodos del análisis de redes sociales”. Libro on-line: Universidad de California, Riverside. http://revista-redes.rediris.es/webredes/text.htm
  • Lusher, Dean; Koskinen, Johan & Robins, Garry (2012). Exponential random graph models for social networks: Theory, methods, and applications. Cambridge University Press, The United States of America.
  • Maya-Jariego, I. & Holgado, D. (2005). Lazos fuertes y proveedores múltiples de apoyo: comparación de dos formas de representación gráfica de las redes personales. Empiria. Revista de Metodología de Ciencias Sociales, 10, 107-127.
  • McCarty, Christopher; Lubbers, Miranda Jessica; Vacca, Raffaele & Molina, José Luis (2019). Conducting Personal Network Research: A Practical Guide. The Guilford Press. 
  • Perry, Brea; Pescosolido, Bernice & Borgatti, Stephen (2018). “Egocentric Network Analysis: Foundations, Methods and Models”. Cambridge University Press, Cambdrige.  
  • Porras, José Ignacio & Espinoza, Vicente (Eds.). (2005). Redes : enfoques y aplicaciones del análisis de redes sociales (ARS). Universidad Bolivariana, Santiago, Chile.
  • Robins, Garry (2015). “Doing Social Network Research: Network-based Research Design for Social Scientists”. SAGE, London.
  • Scott, John (2013). “Social network analysis”. SAGE, California.
  • Wasserman, Stanley & Faust, Katherine (2013). “Análisis de redes sociales: Métodos y aplicaciones”. Centro de Investigaciones Sociológicas, Madrid.

lunes, 6 de mayo de 2019

La información pro-vacunación gana terreno frente al terraplanismo anti-vacunación


Volverse viral: el sarampión se propaga, pero los mensajes pro-vax ganan terreno

Lisa Belkin Corresponsal Nacional
Yahoo News



Virus del sarampión y aviso de brote. (Ilustración de la foto: Yahoo News; fotos: Seth Wenig / AP, Getty Images)

Internet, el lugar donde el mensaje contra la vacuna ganó fuerza en primer lugar, podría volverse a favor de las vacunas, sugiere un estudio preliminar.

Los autores tienen la esperanza de que el mismo medio que llevó a muchos padres a retener la vacuna contra el sarampión de sus hijos, lo que conduzca a brotes de una enfermedad que antes se creía erradicada, pudiera usarse para volver a hacer que la enfermedad volviera al pasado.

"La marea puede estar cambiando contra el movimiento contra la vacunación", escribió Filippo Menczer, profesor de informática e informática de la Universidad de Indiana, sobre su investigación que cuantifica y mapea la difusión de información falsa en las redes sociales en los últimos cinco años. (Su artículo apareció la semana pasada en la revista de ideas académicas en línea The Conversation).

Al rastrear los hashtags de Twitter, él y el estudiante graduado Pik-Mai Hui han llegado a la conclusión de que "la información y la actividad pro-vax están comenzando a rechazar, e incluso a superar, la desinformación anti-vax".




A finales de 2016, el movimiento anti-vax (en verde) era mucho más grande que el movimiento pro-vax (en azul). Con el tiempo, el movimiento pro-vax se expandió y llegó a empequeñecer a los anti-vaxxers. (Gráfico: Filippo Menczer y Pik-Mai Hui, Universidad de Indiana, CC BY-ND)


El movimiento contra la vacuna nació en 1998, cuando el gastroenterólogo británico Andrew Wakefield publicó un estudio basado en datos falsificados que vinculaban las vacunas y el autismo. El documento se retrajo y la licencia médica de Wakefield se revocó en 2010. Pero los años desde la publicación del documento son también los años de crecimiento de Internet similar al kudzu; El 3,6 por ciento de la población mundial estaba en línea en 1998, en comparación con el 56 por ciento actual.

Las opiniones de Wakefield continúan siendo compartidas en línea y, como resultado, un porcentaje cada vez mayor de padres, preocupados por el posible daño a sus hijos, se han negado a darles la vacuna MMR (sarampión, paperas, rubéola). Los legisladores estatales han respondido a los temores de los padres, y mientras que los 50 estados requieren que los niños sean vacunados para asistir a la escuela, casi todos otorgan exenciones para las objeciones religiosas, y 17 también otorgan exenciones por razones filosóficas.

Las vacunas no protegen solo a la persona que las recibe. También protegen a los miembros de la población que, por razones médicas, como inmunidad deteriorada, no pueden ser inoculados. Las matemáticas de la llamada inmunidad de rebaño muestran que si el 96 por ciento de la población está vacunada contra el sarampión, entonces es esencialmente erradicada, porque el virus no tiene lugar para propagarse. Es por eso que la enfermedad fue declarada eliminada en los Estados Unidos en 2000.

Pero muy recientemente, el porcentaje de niños no vacunados ha llegado al punto en que se están produciendo nuevos brotes. A partir del 4 de abril, los Centros para el Control de Enfermedades contabilizaron 465 casos individuales de sarampión en brotes en Arizona, California, Colorado, Connecticut, Florida, Georgia, Illinois, Indiana, Kentucky, Massachusetts, Michigan, Missouri, Nevada, New Hampshire, New Jersey, Estado de Nueva York, Oregón, Texas y Washington: más alto que el total de 372 para todo el año pasado, y se acerca al récord de 667 en 2014.


* Casos al 29 de diciembre de 2018. El conteo de casos es preliminar y está sujeto a cambios. ** Casos al 4 de abril de 2019. El conteo de casos es preliminar y está sujeto a cambios. (Gráfico: CDC)

En respuesta, los funcionarios de salud en el condado de Rockland, Nueva York, prohibieron que los menores no vacunados de los lugares públicos duraran el brote. Y en la ciudad de Nueva York, el alcalde Bill de Blasio declaró una emergencia de salud en la sección de Williamsburg de Brooklyn y exigió que todos los residentes del área fueran vacunados o enfrentaran multas de hasta $ 1,000.

Mientras el CDC ha estado contando casos, Menczer y Hui han estado midiendo el flujo de información. Desde septiembre de 2016 hasta septiembre de 2018, analizaron una muestra aleatoria de más de 40,000 tweets que contenían los hashtags pro y anti-vax más utilizados. Luego clasificaron las casi 30,000 cuentas que generaron esos tweets como pro-vax o anti-vax y crearon mapas virtuales, con cuentas de pro-vax representadas por puntos azules y las de anti-vax por verdes. El resultado fue un conjunto de puntos muy apretados, como un foto negativo del distintivo sarpullido rojo del sarampión.

Las manchas cambiaron notablemente durante los dos años, cambiando de casi todo verde a mayormente azul. Y mientras que los colores habían sido manchas distintas y separadas en los días anteriores, lo que significa que las cuentas anti-vax solo retuitearon mensajes anti-vax: durante el último año "observamos algunos nodos azules conectados a los grupos verdes", escribieron los autores del estudio. "Lo que sugiere que la información pro-vax está comenzando a penetrar en la comunidad anti-vax".

Aún está por verse si este cambio en el flujo de información resulta en un cambio hacia arriba en las tasas de vacunación.

Los comentaristas políticos lamentan que la información de hoy en día se difunda en silos, lo que refuerza el debate político ya que la gente escucha solo lo que ya cree. Este único estudio inicial sugiere la posibilidad de una polinización cruzada entre silos, una inoculación metafórica de la información.

"Si [este] hallazgo preliminar es confirmado por otra investigación", escribieron los autores, "podría proporcionar evidencia de que los esfuerzos combinados de las plataformas de medios sociales, organizaciones de salud, campañas de política pública y defensa popular eventualmente pueden superar la ciencia basura anti-vax. ”

sábado, 27 de abril de 2019

Nueva ley de potencia explica mejor diversos eventos

Los investigadores encuentran una ley de potencia mejor que predice terremotos, vasos sanguíneos, cuentas bancarias

Phys.org



Debido a que las venas se ramifican en divisiones aproximadamente proporcionales, también se consideran un fractal. Crédito: Imagen de cortesía / Mitchell Newberry.

Los terremotos gigantes y la riqueza extrema pueden parecer no tener mucho en común, pero la frecuencia con la que el "Big One" llegará a San Francisco y la frecuencia con la que alguien ganará tanto dinero como Bill Gates puede predecirse con una medición estadística llamada exponente de la ley de potencia.

Durante el último siglo, los investigadores han utilizado lo que se llama una ley de potencia para predecir ciertos tipos de eventos, incluida la frecuencia con que se producen los terremotos en ciertos puntos de la escala de Richter. Pero un investigador de la Universidad de Michigan notó que esta ley de potencia no se ajusta a todas las circunstancias.

Mitchell Newberry, un compañero y profesor asistente de Michigan en el Centro para el Estudio de Sistemas Complejos de la UM, sugiere un ajuste a la ley de energía que explicaría los eventos que aumentan o disminuyen en proporciones fijas, por ejemplo, cuando un gerente hace aproximadamente el 20 por ciento. más que su empleado.

Estos ajustes afectan la forma de estimar las probabilidades de terremotos, la cantidad de capilares en el cuerpo humano y el tamaño de las megaciudades y las llamaradas solares. Y pueden revisar cuándo esperar el próximo Big One.

Cuando los científicos trazan algo como la probabilidad de riqueza extrema en un gráfico, la curva es una línea suave. Eso es porque las personas pueden tener cualquier cantidad de dinero en sus cuentas bancarias.

"La suavidad de esta curva significa que cualquier valor es posible", dijo Newberry. "Podría ganar un centavo más fácilmente que un centavo menos".

Ese no es exactamente el caso de eventos como los terremotos, debido a la forma en que se registran en la escala de Richter. La magnitud de Richter de los terremotos aumenta o disminuye en incrementos de 0.1, exponencialmente. Un terremoto de magnitud 3.1 es 1.26 veces más poderoso que los terremotos de magnitud 3.0, por lo que no todos los valores son posibles en la escala. La escala de Richter es un ejemplo de un concepto llamado "auto-similitud" o cuando un evento o cosa está hecho de copias proporcionalmente más pequeñas de sí mismo.

Puede ver la auto-similitud en la naturaleza como la ramificación de las venas en una hoja, o en la geometría como triángulos encajados dentro de triángulos más grandes de la misma forma, llamado triángulo de Sierpinski. Entonces, para explicar los eventos que cambian en proporciones exactas, Newberry y su coautor, Van Savage, de la Universidad de California en Los Ángeles, crearon la ley de potencia discreta.


La curva de Koch se repite infinitamente, mostrando auto-semejanza. Crédito: usuario de Wikimedia Leofun01

En estas ecuaciones de ley de potencia, el exponente en la ecuación es la variable que los científicos están resolviendo. En los terremotos, ese exponente, llamado el valor de Gutenberg-Richter b, se midió por primera vez en 1944 e indica con qué frecuencia es probable que ocurra un terremoto de cierta intensidad. La ley de energía discreta de Newberry produjo una corrección del 11.7% sobre las estimaciones basadas en la ley de energía continua, lo que hace que el exponente se acerque más a la frecuencia histórica de los grandes terremotos. Incluso una corrección del 5% se traduce en una diferencia de más de dos veces en cuándo esperar el próximo terremoto gigante.

"Durante 100 años, las personas han estado hablando de aproximadamente un tipo de distribución de la ley de energía. Es la distribución de la ley de poder de la riqueza y los terremotos", dijo Newberry. "Solo ahora, estamos documentando estas escalas discretas. En lugar de una curva suave, nuestra ley de energía parece una escalera infinita".

Newberry notó la falla en la ley de poder continuo en su estudio de la física del sistema circulatorio. El sistema circulatorio comienza con un gran vaso sanguíneo: la aorta. A medida que la aorta se divide en diferentes ramas (las arterias carótida y subclavia), cada nueva rama disminuye de diámetro en aproximadamente dos tercios.

Estaba utilizando la ley de energía continua para estimar los tamaños de los vasos sanguíneos a medida que continúan ramificándose. Pero la ley de poder producía tamaños de vasos sanguíneos que no podían ocurrir. Indicó que un vaso sanguíneo podría ser solo un poco más pequeño que el tronco desde el cual se ramificó en lugar de alrededor de dos tercios del tamaño de ese tronco.

"Al utilizar la ley de energía continua, solo recibíamos respuestas que sabíamos que estaban mal", dijo Newberry. "Al depurar lo que falló, descubrimos que esta distribución supone que cada tamaño de vaso sanguíneo es igualmente plausible. Sabemos que para la vasculatura real, ese no es el caso".

Así que Newberry hizo ingeniería inversa de la ley de potencia. Al observar los vasos sanguíneos, Newberry podría deducir el exponente de la ley de potencia a partir de dos constantes: cuántas ramas en cada unión (dos) y cuánto más pequeña es cada rama en relación con el tronco. Al medir el tamaño de los vasos en cada división, Newberry pudo resolver la distribución de los vasos sanguíneos.

"Hay un punto intermedio entre una ley de energía continua y la ley de energía discreta", dijo Newberry. "En la ley de poder discreta, todo se presenta en proporciones perfectamente rígidas desde la escala más alta hasta el infinitamente pequeño. En la ley de poder continuo, todo se distribuye de manera perfectamente aleatoria. Casi todo lo que se asemeja en realidad es una mezcla de estos dos . "

jueves, 18 de abril de 2019

Métricas para comparar grafos


Métricas para la comparación de grafos: una guía para profesionales

Peter Wills, Francois G. Meyer
Arxiv




La comparación de la estructura del grafo es una tarea ubicua en el análisis de datos y el aprendizaje automático, con diversas aplicaciones en campos como neurociencia, seguridad cibernética, análisis de redes sociales y bioinformática, entre otros. El descubrimiento y la comparación de estructuras como las comunidades modulares, los clubes ricos, los centros y los árboles en los datos de estos campos permite comprender los mecanismos generativos y las propiedades funcionales del grafo.



A menudo, dos grafos se comparan mediante una medida de distancia por pares, con una pequeña distancia que indica similitud estructural y viceversa. Las opciones comunes incluyen distancias espectrales (también conocidas como distancias λ) y distancias basadas en afinidades de nodo. Sin embargo, aún no se ha realizado ningún estudio comparativo de la eficacia de estas medidas de distancia para discernir entre topologías de grafos comunes y diferentes escalas estructurales.
En este trabajo, comparamos las métricas de los grafos y las medidas de distancia de uso común, y demostramos su capacidad para discernir entre las características topológicas comunes que se encuentran tanto en los modelos de grafos aleatorios como en los conjuntos de datos empíricos. Presentamos una imagen a escala múltiple de la estructura del grafo, en la que se considera el efecto de la estructura global y local sobre las medidas de distancia. Hacemos recomendaciones sobre la aplicabilidad de diferentes medidas de distancia al problema de datos de grafos empíricos basados ​​en esta vista de escala múltiple. Finalmente, presentamos la biblioteca NetComp de Python que implementa las distancias de los grafos utilizados en este trabajo.