lunes, 30 de octubre de 2017

Estrategias de visualización de redes históricas

Análisis de redes históricas: estructuras complejas y organizaciones internacionales

Martin Grandjean |



Grandjean Martin,
Analisi e visualizzazioni delle reti in storia : l’esempio della cooperazione intellettuale della Società delle Nazioni,
Memoria e Ricerca, 25, 2, 2017, 371-393.

"Redes" históricas

Confrontada con la masificación de los datos y la aceptación de cuestiones cada vez más globales, la historia de las organizaciones internacionales se ocupa de objetos cada vez más complejos. Y si el término "red" se usa ampliamente en la investigación histórica, es porque parece ser eficaz describir estas estructuras enredadas, evolutivas y de múltiples niveles. Basado en un análisis de decenas de miles de documentos de archivo de la "Cooperación Intelectual" de la Liga de las Naciones en la década de 1920, este artículo cuestiona el valor del análisis formal de redes y la visualización de datos como una herramienta exploratoria. Desde la red utilizada como metáfora hasta la compleja red de metadatos de archivo, a través de la red dibujada sobre la base de informaciones encontradas en fuentes heterogéneas y la red extraída del contenido de los documentos, este artículo establece una tipología que describe cuatro niveles de red formalización y muestra cómo se pueden articular estos niveles.

Una tipología de usos



  Aquí hay una descripción general muy (demasiado) rápida de las 3 categorías principales.


La red reconstituida



La red "reconstituida" (o "dibujada") es una infografía, información traducida en una imagen que tiene las características visuales de una red. Por lo tanto, no se trata de una visualización de datos, ya que no hay un trabajo sistemático sobre los datos y el resultado no es producto de un cálculo, sino un dibujo que será útil para comprender fácil o rápidamente una situación compleja. El resultado es, por tanto, producto de la interpretación de fuentes múltiples, generalmente secundarias y heterogéneas, de las que el historiador obtiene fragmentos de información complementaria: la compilación de estos bits en una única representación gráfica hará más comprensibles las relaciones entre sus elementos. A menudo, es una imagen deliberadamente simplificadora con fines explicativos. En términos de estructura, es probable que la red reconstituida sea una estructura de árbol, un diagrama de flujo donde los elementos jerarquizados tienen más relaciones verticales que horizontales o una red social muy pequeña.
 Nuestro ejemplo aquí es el organigrama de la Liga de las Naciones en 1930 basado en docenas de informes.

La red de las fuentes




La red "de las fuentes" ya no se trata de recolectar información para reconstituir una red poco a poco, sino de dibujar el gráfico directamente desde el contenido de los documentos, a menudo fuentes seriales o corpora homogénea: listas de miembros de movimientos políticos, registros familiares , mesas de bolsa, directorios de empresas, etc. Este enfoque implica un fuerte acto de modelado: una elección en el tipo de relaciones que queremos analizar. Ya no recopilamos todos los tipos posibles de relaciones entre un grupo de individuos, pero nos enfocamos en una relación bien definida que permitirá un análisis formal.
 Nuestro ejemplo aquí es el mapeo de todos los empleados de la Liga de las Naciones según su (s) departamento (es) entre 1919 y 1939.


La red de metadatos




La última etapa de nuestra tipología se refiere a las redes que ya no se derivan del contenido de las fuentes pero que mapean la circulación de las fuentes mismas. Estar interesado en los metadatos de un documento es considerar que es posible suponer que, sea cual sea su contenido, es el testimonio de una relación entre individuos o instituciones. Las redes de metadatos posibilitan, por ejemplo, reemplazar un intercambio de correspondencia entre dos personas en el contexto de todos los intercambios que mantienen con otros corresponsales. Esta "lectura distante" es un medio de comparar la estructura concreta de su intercambio con la estructura aparente y oficial que rige jerárquica o simbólicamente las relaciones entre estos individuos.
 Nuestro ejemplo aquí es la red de co-indexación de todos los actores de los documentos del Comité Internacional de Cooperación Intelectual de la Sociedad de las Naciones entre 1919 y 1927.



Mejorar el análisis combinado de varios tipos




Los tres niveles de formalización presentados anteriormente se pueden aplicar al mismo objeto histórico y así aportar puntos de vista complementarios. Pero también se pueden agrupar en una sola visualización de niveles múltiples. Al analizar una organización internacional compleja, la circulación de documentos se puede comparar con la afiliación formal de las personas afectadas. Estas personas también pueden organizarse de acuerdo con la "geografía institucional" de la institución que permite ver las relaciones entre los diferentes polos de manera más explícita que en una red de "bola de pelo".

sábado, 28 de octubre de 2017

Análisis bibliográfico de las publicaciones de Northampton Computing

Actualización sobre el análisis bibliográfico de la informática

Computing in Northampton

He tenido curiosidad sobre las herramientas para analizar las conexiones sociales por un tiempo.

En este post, estoy buscando un par de maneras de analizar las relaciones bibliográficas. Comenzando con las nubes de palabras más simples, pero luego con una herramienta interesante que VosViewer discutió previamente. Todos los datos son tomados del Depósito de Investigación de la Universidad de Northampton - Nectar, para miembros del equipo académico de Computación.


Nubes de palabras




La imagen anterior se basa en datos de todas las publicaciones enumeradas para el equipo informático desde 2011. Incluye los autores, el título, la conferencia, etc. pero no abstracto Se necesita bastante edición y realmente todo lo que se muestra es el nombre de los autores para la mayoría de los autores publicados y algunos términos clave. Proporciona una buena instantánea, pero es difícil de interpretar.

Análisis del coautor




Aquí están los mismos datos, pero se procesaron utilizando un software que solo mira a los autores y muestra cuántas veces se ha publicado un par en particular. Se pueden ver algunas interconexiones entre los autores. Ahora hay conexiones entre todos los autores principales (miembros del equipo de computación).



Las publicaciones en coautoría con estudiantes de maestría están generando mayores oportunidades para unir investigaciones.


Análisis de texto

Esta es la misma herramienta que la anterior, pero esta vez mirando el texto dentro del título y los resúmenes. Todas las palabras en el título y resumen de los trabajos; pero usando el recuento binario (por lo que un término solo se cuenta una vez por publicación) y permitiendo solo los términos con un 60% de relevancia más alta hasta; puedes obtener un gráfico como el siguiente. Personalmente, creo que el grafo es hermoso, da la sensación de que están sucediendo muchas cosas.





Un área temática interesante que sale; por ejemplo, redes inalámbricas y comunicación de máquina a máquina; junto con investigación pedagógica, cultural y sensores para animales.


Vamos a aplicar este último enfoque a algunos casos individuales

Estudio de caso 1: Carrera académica de Investigación media




Caso de estudio 2: Carrera académica de mitad de carrera 




En ambos casos de estudio 1 y 2, hay varias agrupaciones. Estudio de caso 1 los sujetos en las agrupaciones son más diversos que en el caso de estudio 2, que tiene una mayor especialización.

Caso de estudio 3: Investigador de carrera temprana

Mayor separación en los grupos (aunque tres grupos están relacionados en términos de tema) que en los dos primeros casos. Esto se debe en parte a la menor cantidad de documentos en comparación con los dos primeros estudios de casos (entre cuatro y ocho veces menos).



Caso de estudio 4: Doctor por Candidato a la Publicación



Hay una mayor interrelación entre los grupos, que en otros estudios de casos. Esto, yo diría, es una característica positiva para alguien que busca un doctorado por publicación; sugiriendo una "historia" coherente a sus publicaciones.


Trazando las citas de los trabajos de un autor

Usando GEPHI (https://gephi.org/), se puede visualizar una herramienta gratuita de visibilización de Open Graph y datos de citación de Google Scholar e interconexiones.




El enfoque adoptado aquí fue tomar un documento individual (los blogs más grandes) y hacer una conexión con todos los documentos que lo citaron (los blogs más pequeños donde los documentos no produjeron el autor). Los grupos pueden comenzar a verse, y pueden investigarse más a fondo.

jueves, 26 de octubre de 2017

Nuevo importador de archivos CSV en Gephi

Gephi 0.9.2: un nuevo importador de CSV


Gephi Blog

¡Se ha lanzado una nueva versión de Gephi! Gracias a la implacable resolución de problemas de Eduardo, la estabilidad general de Gephi se ha mejorado. Eduardo es el autor del Laboratorio de Datos, y en esta ocasión renovó su importador CSV para una experiencia de usuario más flexible y directa.

El nuevo importador CSV / hoja de cálculo


¿Sabía que Gephi puede exportar e importar solo la tabla de nodos o la tabla de bordes? Esta característica es útil en muchas situaciones, por ejemplo para producir gráficos en Excel o para limpiar datos en Open Refine. A continuación, mostraremos las nuevas funciones y, en términos más generales, explicaremos cómo importar una hoja de cálculo como una lista de nodos.

Para importar una hoja de cálculo, debe llegar al Laboratorio de datos y hacer clic en Importar hoja de cálculo. En el siguiente ejemplo, una red ya está cargada: más tarde decidiremos si los nodos importados se fusionarán con los existentes o no.



Gephi ahora puede reconocer el tipo de archivo que carga, y se ha agregado la compatibilidad de los archivos de Excel. Elegir el separador correcto es crucial ya que las columnas separadas incorrectamente comprometerían los datos. En el siguiente ejemplo, Gephi reconoció que el separador es la coma (como en un archivo CSV con el formato correcto).



La codificación del archivo es un problema común, especialmente con idiomas que usan acentos y caracteres especiales. Gephi puede adivinar la codificación y puede editarla manualmente si es necesario. En el siguiente ejemplo, Gephi adivinó correctamente la codificación UTF-8.



Seleccionar una codificación diferente produciría errores. Afortunadamente, la tabla Vista previa le permite verlos y corregir la codificación. En la captura de pantalla siguiente, vea cómo la codificación incorrecta produce caracteres exóticos en los datos.



Cuando valida estas configuraciones, Gephi ahora abre exactamente el mismo panel que cuando abre una nueva red. Personalmente, me encanta esta adición ya que aporta más consistencia a la experiencia del usuario. Le permite a Gephi proporcionar una cantidad de información útil, como la cantidad de nodos detectados o los problemas encontrados durante el proceso de importación.



No se pierda una característica importante aquí: en este panel, decide crear un nuevo espacio de trabajo con los datos importados o fusionar los nuevos nodos con los antiguos. Esta característica muy útil ya estaba presente en la apertura de una nueva red, pero muchos usuarios todavía ignoran que existe. Tenga en cuenta que debe seleccionar la opción Agregar si tiene la intención de fusionar los nodos. En ese caso, cuando un nodo importado tiene el mismo Id que uno ya presente, los nuevos datos del nodo anularán el anterior.



Más información


Eche un vistazo a la lista completa de mejoras allí:
https://github.com/gephi/gephi/releases/tag/v0.9.2


¿Cómo obtengo este lanzamiento?


Si tiene un Gephi reciente, la actualización se le propondrá automáticamente
Si tiene una versión anterior (0.8 o anterior), debe descargarla e instalarla manualmente.
Esta actualización se puede descargar de http://gephi.org

domingo, 22 de octubre de 2017

La corbata de moño que nos une a todos

¿Qué tan cerca estás?


Un diagrama de su red social revela la fortaleza de sus relaciones individuales, dicen los científicos de la red.

por Emerging Technology del arXiv

La red de enlaces entre individuos -su red social- ha fascinado a los científicos sociales por mucho tiempo. Estas redes no son aleatorias ni completamente ordenadas. En cambio, ocupan un término medio en el que las personas están estrechamente vinculadas con unas pocas personas que conocen bien, con vínculos más débiles con un grupo más grande de amigos y compañeros de trabajo, además de vínculos extremadamente débiles con una amplia gama de conocidos casuales.

Los científicos sociales miden la fuerza de estos enlaces utilizando una variedad de indicadores, como la frecuencia con que una persona llama a otra, si esa llamada es recíproca, el tiempo que las dos personas pasan hablando, y así sucesivamente. Pero estos indicadores a menudo son difíciles de medir y toman mucho tiempo.

Entonces, a los teóricos de la red les encantaría tener alguna manera de medir la fuerza de los vínculos desde la estructura de la red misma.


La estructura de pajarita en una red social revela la fuerza de las amistades.

Hoy, obtienen su deseo gracias al trabajo de Heather Mattie en la Universidad de Harvard en Massachusetts y algunos amigos, que dicen haber encontrado un patrón especial en los vínculos entre las personas que revela la fuerza de los lazos entre ellos. El patrón forma una estructura topológica que se asemeja a una pajarita.

El método del equipo es directo. Mattie y su equipo estudian la fuerza de los enlaces en dos redes sociales desde entornos muy diferentes.

El primero es la red de enlaces entre casi 70,000 personas en 75 aldeas rurales en India. Los científicos sociales reconstruyeron la red mediante encuestas diseñadas para recopilar información social relevante. Esta encuesta preguntó qué amigos y parientes visitan la casa del demandado, de qué personas tomaría prestado el demandado o recibiría consejo médico o iría al templo, y así sucesivamente.

Esto permitió a los investigadores reconstruir una red social que consta de 37,000 bordes entre 17,000 personas para quienes tenían información completa. Luego usaron el número de enlaces sociales de las encuestas como una medida de fortaleza para los lazos sociales entre las personas. Entonces, si dos personas eran parientes que se visitaban en casa, iban juntos al templo y se prestaban dinero, cada uno de estos factores contribuiría al vínculo entre ellos.

Mattie y compañía también construyeron la red social entre usuarios de teléfonos móviles de un país europeo sin nombre. Debido al tamaño de la red, el equipo eligió a 500,000 personas al azar y luego construyó la red social usando el número y la duración de las llamadas entre ellos. Supusieron que el vínculo era más fuerte si las llamadas eran recíprocas y si la cantidad total de tiempo dedicado a hablar era alta.

Luego, el equipo examinó la estructura de ambas redes. Para cada par de individuos, construyeron la red de amigos que tenían en común y la red de amigos que no tenían en común. Es esta estructura que se parece a una pajarita o corbata de moño (ver diagrama). Luego analizaron estas redes de pajarita.

Los resultados hacen una lectura interesante. El equipo descubrió que el número de amigos que los pares de individuos tienen en común está fuertemente correlacionado con la fuerza del vínculo entre ellos, medido de otras maneras. Eso es independientemente de si las personas están vinculadas por registros de teléfonos móviles o por las relaciones sociales en aldeas rurales de la India.

Este resultado captura los hallazgos de dos de los primeros investigadores que trabajaron en las redes sociales. El primero proviene de Elizabeth Bott, una influyente antropóloga que publicó un libro en 1957 llamado Family and Social Networks.

En este libro, formuló la hipótesis de que el grado de agrupamiento en la red de un individuo podría alejar a la persona de un vínculo con otra persona. En otras palabras, si formas parte de un grupo de amigos o parientes cercanos, eres menos capaz de establecer vínculos fuertes fuera de este grupo.

El segundo proviene de Mark Granovetter, un sociólogo estadounidense que en 1969 escribió un artículo de gran influencia llamado "La fuerza de los lazos débiles". En este documento, sugirió que cuanto más fuerte era el vínculo entre dos personas, mayor era la proporción de amigos que tenían. tener en común.

El marco de bow tie (corbata de moño) de lazos captura ambas ideas. "Ambos conjuntos de datos proporcionan evidencia para apoyar la hipótesis de los vínculos débiles y la hipótesis de Bott", dicen Mattie y compañía.

El nuevo hallazgo tiene implicaciones interesantes. Sugiere que debería ser sencillo medir la fuerza de los enlaces entre individuos, simplemente observando la estructura de su red social. "Esta estructura local permite análisis que son computacionalmente factibles para redes de cualquier tamaño", dicen Mattie y compañía.

Y debería permitir una prueba adecuada de la hipótesis original de Bott, que ella aplicó a las parejas y familias casadas. "Esto permitiría probar la versión original de la hipótesis de Bott, en lugar de una forma generalizada como la presentamos aquí", dicen Mattie y compañía.

El trabajo también muestra cómo las redes sociales pueden revelar más sobre las personas de lo que de otro modo podrían querer hacer público. El trabajo de Mattie implica que la forma de su red social revela no solo con quién es amigo sino qué tan fuertemente está vinculado a ellos. No todos estarán felices con eso.


Ref: arxiv.org/abs/1710.04177 : The Social Bow Tie



miércoles, 18 de octubre de 2017

El cerebro solo puede gestionar cinco mejores amigos

Tu cerebro te limita a solo cinco MAPS


El número de personas con las que podemos tener contacto significativo está limitado por el tamaño de nuestros cerebros. Ahora este grupo parece estar subdividido en capas, dicen los antropólogos.

por Emerging Technology desde el arXiv

En la década de 1990, el antropólogo británico Robin Dunbar notó una notable correlación entre el tamaño del cerebro de los primates y los grupos sociales que formaron. Esta correlación fue simple: cuanto más grande es su cerebro, más grandes son sus grupos sociales. Y la explicación parecía razonable: los animales con cerebros más grandes pueden recordar, y por lo tanto interactuar de manera significativa con, más de sus compañeros.

Eso llevó a Dunbar a una famosa predicción. Al trazar la correlación y extrapolar la curva al tamaño del cerebro humano, predijo que los humanos no podrían tener más de 150 personas en su esfera social.

Él y muchos otros han ido a encontrar mucha evidencia del número de Dunbar en el tamaño de las sociedades de cazadores-recolectores, legiones romanas y negocios efectivos. El número de Dunbar incluso se ha demostrado que se mantiene en las redes sociales modernas. Los humanos realmente parecen tener un límite natural al número de relaciones significativas que pueden tener. Y este número es de unos 150.



En los últimos años, Dunbar ha tomado su idea más lejos teniendo en cuenta la cercanía emocional entre los individuos. Esto le ha llevado a la idea de capas de Dunbar: que el grupo de 150 contactos de un individuo está dividido en capas de acuerdo con la fuerza de los lazos emocionales.

Los individuos, dice, generalmente tienen hasta cinco personas en la capa más cercana. La siguiente capa más cercana contiene un 10 adicional, el más allá que un 35 adicional, y el grupo final otro 100. Por lo tanto, acumulativamente, las capas contienen cinco, 15, 50 y 150 personas.

Sin embargo, la evidencia de este tipo de capas en grupos sociales ha sido difícil de recopilar. Hoy en día, Dunbar, que está en la Universidad de Oxford en Estados Unidos, y algunos amigos, dicen que encontraron pruebas de capas de Dunbar en un conjunto de datos masivo de llamadas de teléfonos móviles. Y los números proporcionan una curiosa idea de la naturaleza del contacto social humano.

El nuevo conjunto de datos consta de unos seis mil millones de llamadas realizadas por 35 millones de personas en un país europeo anónimo a lo largo de 2007. El equipo asume que la frecuencia de las llamadas entre dos individuos es una medida de la fuerza de su relación.

Para eliminar las llamadas comerciales y las llamadas casuales, Dunbar y co incluyen solo a las personas que realizan llamadas recíprocas y se centran en las personas que llaman a al menos otras 100 personas. Eso excluye a las personas que no usan teléfonos móviles con regularidad para llamar a contactos sociales.

Eso deja a unas 27,000 personas que llaman en promedio a otras 130 personas. Cada una de estas personas realiza 3.500 llamadas por año, aproximadamente 10 por día. El equipo dice que la persona que hizo la mayor cantidad de llamadas a otra persona llamó más de 15,000 veces. En promedio, eso es más de 40 llamadas por día durante todo un año. Eso seguramente está cerca de un límite superior.

El equipo también señaló que 2007 es un buen año para buscar capas de Dunbar porque es anterior al uso generalizado de teléfonos inteligentes y redes sociales como Facebook. Estos brindan otras vías de contacto social que habrían hecho mucho más difícil el estudio.

El método del equipo es sencillo. Dunbar y compilar esta información contando el número de llamadas que cada individuo hace a sus contactos y usando algoritmos de agrupación para buscar patrones dentro de los resultados.

Pero los resultados hacen que la lectura sea interesante. Los diferentes métodos de agrupación dan resultados ligeramente diferentes, pero, sin embargo, el equipo dice que la capa acumulativa promedio resulta ser de 4.1, 11.0, 29.8 y 128.9 usuarios.

"Estos números son un poco más pequeños que los números convencionales para las capas de Dunbar, pero dentro de su rango natural de variación", dicen. Los números podrían ser más pequeños porque los datos del teléfono móvil capturan solo una parte de las interacciones sociales totales de una persona.

El equipo también encuentra alguna evidencia de una capa adicional entre algunas personas. "Esto podría, por ejemplo, significar que los introvertidos y los extrovertidos tienen un número diferente de capas de amigos", sugieren. Pero, curiosamente, los extrovertidos, mientras tienen más amigos, todavía tienen un número similar de capas.

En total, el estudio muestra buena evidencia de la existencia de las capas más internas y externas, pero con cierta variabilidad para el tamaño de las capas intermedias. "La agrupación produce resultados que coinciden bien con los estudios previos para las capas más internas y externas, pero para las capas intermedias observamos una gran variabilidad", dicen.

Cosas interesantes. Quizás lo próximo que vean será si la evidencia similar surge del estudio de redes sociales en línea como Facebook, Instagram, etc., que podría permitir estudios más matizados.


Ref: arxiv.org/abs/1604.02400 : Calling Dunbar’s Numbers

lunes, 16 de octubre de 2017

Antiguos evitaron incesto mediante redes de citas

Para evitar la endogamia, nuestros antepasados ​​pueden haber tenido sus propias antiguas redes de citas 


Por W. Harry Fortuna  |  Quartz



Aunque hay notables excepciones -el Egipto romano, por ejemplo- el incesto ha sido muy elevado en la escala humana de censura moral a través de la mayor parte de la historia humana registrada. ¿Pero qué hay antes de eso?
Cuando nuestros antepasados ​​lejanos vagaron por África para diseminarse en el mundo hace alrededor de 50,000 años, lo hicieron en pequeñas bandas de tribus nómadas separadas por cientos, si no miles, de millas. Las grandes distancias entre ellos han llevado a los eruditos a creer que la endogamia era inevitable. Pero una investigación publicada la semana pasada en la revista Science apunta a la posibilidad de que nuestros antiguos antepasados ​​no solo hayan comprendido los peligros de la endogamia sino que también hayan implementado sistemas complejos de intercambio de apareamientos entre redes más grandes de tribus para evitarlo.
Eske Willerslev, de las universidades de Cambridge y Copenhague, y el más cercano al estudio de la genómica antigua, llega a ser una estrella de rock de buena fe (paywall), fue el autor principal del estudio. Él y un equipo de expertos internacionales extrajeron ADN de las tumbas de cuatro ancianos, un hombre, una mujer, un niño y una niña que se encuentran en el sitio Sunghir en Rusia, que data de alrededor de 34,000 años atrás. Los investigadores se sorprendieron al descubrir que, genéticamente hablando, ninguno de los restos analizados mostraba una relación con ninguno de los otros en el sitio más cercano que el de los segundos primos; Esto incluye a los dos niños que fueron enterrados cabeza a cabeza en la misma tumba, que durante mucho tiempo se pensó que eran hermanos.
La secuenciación genética de un neandertal de hace 50,000 años que se encontró en las montañas de Altai en 2008 sugiere que la endogamia no se evitó en ese grupo, y la falta de variación genética se ha considerado como un posible factor en su extinción. Pero se necesitan más pruebas para determinar si los neandertales no se preocuparon lo suficiente como para evitar la práctica, o fueron forzados a ello por las circunstancias.
Por lo tanto, es posible que nuestra ancestral comprensión de la endogamia sea la razón por la cual nuestra especie sobrevivió y otras especies de homínidos desaparecieron.
La variedad de objetos rituales encontrados enterrados con cada uno de los cuerpos -lo que Willerslev llamó "increíble" y "a diferencia de todo lo encontrado con otros humanos arcaicos" -sugiere alguna forma de colectivismo, lo que puede significar diferentes afiliaciones tribales, o a quién evitar como compañero , o incluso la existencia de rituales matrimoniales tempranos; esto implica la variedad que los investigadores encontraron en el código genético de los enterrados no fue accidental.
Willerslev cree que estos primeros humanos "deben haber desarrollado un sistema para este propósito", dijo en un comunicado publicado con el estudio. "Si las pequeñas bandas de cazadores-recolectores se mezclaran al azar, veríamos mucha más evidencia de endogamia que nosotros". Y en la competencia mundial por la supervivencia, un rechazo temprano del incesto puede haber marcado la diferencia.

sábado, 14 de octubre de 2017

Matemáticas del contagio

Modelos de contagio: Matemáticas contra la desigualdad


Jesús Gómez Gardeñes
University of Zaragoza
Open Mind



El modelado del proceso de contagio es un campo de estudio que abarca disciplinas como la matemática aplicada y la epidemiología. Estos procesos consideran poblaciones de agentes que interactúan donde un agente patógeno se propaga a través de los contactos entre estos agentes. Los modelos habituales para tratar estos tipos de procesos se denominan modelos compartimentales, ya que asumen que cada individuo puede adoptar un conjunto de estados (por ejemplo, sano, infectado y recuperado). De esta manera, en cualquier punto en el tiempo, un individuo estará en uno de estos estados, mientras que los cambios de estado están dados por reglas muy simples. Por ejemplo: un individuo en estado sano se infectará al interactuar con otro individuo en estado infectado. Estos modelos también pueden reflejar la propagación de información en una población. En este caso, los diferentes compartimentos reflejarían el estado de un individuo con respecto a su conocimiento de esta información (por ejemplo, ignorante y experto), de modo que el paso del ignorante a experto también se produce a través del "contagio" de un experto a un ignorante.


Matemáticas para cazar el virus

Las matemáticas que permiten conceptualizar y estructurar estos modelos de contagio se basan en la teoría de redes y el análisis de sistemas complejos. Gracias a las técnicas que permiten describir la dinámica de los sistemas distribuidos, es posible determinar las condiciones bajo las cuales se produce un fenómeno de información epidémica o viral. Para dar realismo a este tipo de modelos, debemos incorporar la forma en que los individuos interactúan entre sí y aquí es donde la teoría de red resulta ser muy útil: la estructura de las redes contiene los vínculos entre individuos. Estas redes reflejan el esqueleto a través del cual fluye la información con Twitter, por ejemplo, siendo un caso de este tipo de arquitectura de interacción social.


Viajes y comunicaciones globales registradas en Twitter. La API de transmisión de datos de Twitter al 1 de septiembre de 2011 / Eric Fischer, Flickr

Un paso más en la modelización de los procesos de contagio en sistemas reales (poblaciones) requiere el uso de modelos de metapoblación. En estos modelos, hay una red disponible donde los nodos tienen en cuenta las ubicaciones (vecindarios, ciudades, regiones o países) en los que viven los agentes. A su vez, la unión entre dos nodos refleja la posibilidad de viajar entre los dos que tienen sus habitantes. De esta manera simple, podemos hacer uso de datos reales sobre movilidad ciudadana para incorporarlos en modelos epidémicos realistas.

Contagio selectivo: desigualdad económica

Una vez que hemos introducido los dos ingredientes clave identificados, el modelado de los procesos de contagio y las redes de movilidad, llegamos al tercer ingrediente: la desigualdad socioeconómica. Uno de los problemas que enfrentamos en la sociedad actual es el aumento de la desigualdad entre ricos y pobres, tanto a nivel humano (entre los habitantes de las ciudades y países) como entre países. Se puede encontrar un claro ejemplo de una sociedad desigual en Colombia donde los ingresos del 10% más pobre representan solo el 1,1% del ingreso total, mientras que el 10% más rico es el 42%. Esta desigualdad se refleja en el sistema impositivo del país con 6 categorías (o estratos) de contribución, 1 son los más pobres y 6 son los más ricos. Estas categorías se basan en el lugar de residencia de las familias y, por lo tanto, tienen un fuerte componente espacial que también se refleja en la forma de moverse por las ciudades (se puede ver en la imagen con los mapas de movilidad de cada uno de los estratos en el ciudad de Bogotá, Colombia).


El resultado de este tipo de estudios nos permite saber, en el caso particular que se muestra, cómo una sociedad altamente fragmentada es donde cada estrato tiene, predominantemente, contactos con estratos cercanos. Sin embargo, se observa cómo la movilidad reduce el grado de segregación a través del cual es posible elevar, a partir de estos hallazgos, medidas para reducir la distancia social dentro de las ciudades. De la ciencia a la política, podemos concluir cómo las herramientas matemáticas basadas en la teoría de redes nos permiten determinar cuáles son las acciones políticas más efectivas en la lucha contra la desigualdad.


Referencias


  • Lotero, R. G. Hurtado, Luis Miguel Floría Gimeno, Jesús Gómez Gardeñes (2016). Rich do not rise early: Spatio-temporal patterns in the mobility networks of different socio-economic classes. The Royal Society, Online ISSN 2054-5703. 12 October 2016.DOI: 10.1098/rsos.150654
  • Jesús Gómez Gardeñes, L. Lotero, S. N. Taraskin, F. J. Pérez Reche. (2016). Explosive Contagion in Networks. Nature Publishing Group, Scientific Reports, (6), p. 19767.
  • De Montis A, Caschili S, Chessa A. 2013 Commuter networks and community detection: a method for planning sub regional areas. Eur. Phys. J. Spec. Top. 215, 75–91.
  • Lotero L, Cardillo A, Hurtado R, Gómez-Gardeñes J. 2016 Several multiplexes in the same city: the role of socioeconomic differences in urban mobility. In Interconnected Networks, ch. 9 (ed. Garas), pp. 149–164. Series on Understanding Complex Systems. Berlin, Germany: Springer.

miércoles, 11 de octubre de 2017

Saltando sobre los agujeros estructurales: Integración social vía Tinder

Primera evidencia de que la citas en línea está cambiando la naturaleza de la sociedad

Los sitios web de citas han cambiado la forma en que las parejas se encuentran. Ahora está emergiendo evidencia de que este cambio está influyendo en los niveles de matrimonio interracial e incluso en la estabilidad del matrimonio mismo.

por Emerging Technology from the arXiv

No hace mucho tiempo, nadie conoció a un compañero en línea. Luego, en la década de 1990, llegaron los primeros sitios web de citas.

Match.com se puso en marcha en 1995. Una nueva ola de sitios web de citas, como OKCupid, surgió a principios de los años 2000. Y la llegada de 2012 de Tinder cambió aún más. Hoy en día, más de un tercio de los matrimonios comienzan en línea.

Es evidente que estos sitios han tenido un enorme impacto en el comportamiento de las citas. Pero ahora está emergiendo la primera evidencia de que su efecto es mucho más profundo.


La forma en que la gente conoce a sus parejas ha cambiado drásticamente en los últimos años

Durante más de 50 años, los investigadores han estudiado la naturaleza de las redes que unen a las personas entre sí. Estas redes sociales resultan tener una propiedad peculiar.

Un tipo obvio de la red liga cada nodo con sus vecinos más cercanos, en un patrón como tablero de ajedrez o alambre de gallinero. Otro tipo obvio de enlaces de red nodos al azar (random network). Pero las redes sociales reales no son como ninguno de estos. En su lugar, las personas están fuertemente conectadas a un grupo relativamente pequeño de vecinos y ligeramente conectados a personas mucho más distantes.

Estas conexiones sueltas resultan ser extremadamente importantes. "Esos lazos débiles sirven de puentes entre nuestro grupo de amigos cercanos y otros grupos agrupados, permitiéndonos conectarnos con la comunidad global", dicen Josue Ortega de la Universidad de Essex en U.K. y Philipp Hergovich en la Universidad de Viena en Austria.

Tradicionalmente, los lazos sueltos han desempeñado un papel clave en el encuentro con los compañeros. Aunque la mayoría de la gente era poco probable de ir a una cita con uno de sus mejores amigos, era muy probable de citar a personas que estaban vinculados con su grupo de amigos, un amigo de un amigo, por ejemplo. En el lenguaje de la teoría de la red, los socios de citas estaban embebidos en las redes de los demás.

De hecho, esto se ha reflejado durante mucho tiempo en encuestas sobre la forma en que las personas se encuentran con sus parejas: a través de amigos comunes, en bares, en el trabajo, en instituciones educativas, en la iglesia, a través de sus familias, etc.

Las citas en línea ha cambiado eso. Hoy en día, las citas en línea son la segunda forma más común de conocer a las parejas heterosexuales. Para las parejas homosexuales, es de lejos el más popular.

Eso tiene implicaciones significativas. "Las personas que se reúnen en línea tienden a ser completos extraños", dicen Ortega y Hergovich. Y cuando la gente se reúne de esta manera, establece vínculos sociales que antes eran inexistentes.

La pregunta que Ortega y Hergovich investigan es cómo esto cambia la diversidad racial de la sociedad. "Comprender la evolución del matrimonio interracial es un problema importante, ya que el matrimonio mixto es ampliamente considerado como una medida de la distancia social en nuestras sociedades", dicen.

Los investigadores comienzan simulando lo que sucede cuando se introducen enlaces adicionales en una red social. Su red se compone de hombres y mujeres de diferentes razas que se distribuyen al azar. En este modelo, todo el mundo quiere casarse con una persona del sexo opuesto, pero sólo puede casarse con alguien con quien existe una conexión. Esto conduce a una sociedad con un nivel relativamente bajo de matrimonio interracial.

Pero si los investigadores añaden vínculos aleatorios entre personas de diferentes grupos étnicos, el nivel de matrimonio interracial cambia drásticamente. "Nuestro modelo predice una integración racial casi completa sobre la aparición de las citas en línea, aunque el número de parejas que los individuos encuentren de los lazos recién formados sea pequeño", dicen Ortega y Hergovich.

Y hay otro efecto sorprendente. El equipo de medir la fuerza de los matrimonios mediante la medición de la distancia media entre los socios antes y después de la introducción de citas en línea. "Nuestro modelo también predice que los matrimonios creados en una sociedad con citas en línea tienden a ser más fuertes", dicen.

A continuación, los investigadores comparan los resultados de sus modelos con las tasas observadas de matrimonios interraciales en los Estados Unidos. Esto ha ido en aumento por algún tiempo, pero las tasas siguen siendo bajas, sobre todo porque el matrimonio interracial fue prohibido en algunas partes del país hasta 1967.

Pero la tasa de aumento cambió en el momento en que la cita en línea se popularizan. "Es intrigante que poco después de la introducción de los primeros sitios web de citas en 1995, como Match.com, el porcentaje de nuevos matrimonios creados por parejas interraciales aumentó rápidamente", dicen los investigadores.

El aumento se hizo más pronunciado en los años 2000, cuando las citas en línea se hicieron aún más populares. Entonces, en 2014, la proporción de matrimonios interraciales saltó de nuevo. "Es interesante que este aumento se produce poco después de la creación de Tinder, considerada la aplicación de citas en línea más popular", dicen.

Tinder tiene unos 50 millones de usuarios y produce más de 12 millones de encuentros al día.

Por supuesto, estos datos no demuestran que las citas en línea causaron el aumento de los matrimonios interraciales. Pero es consistente con la hipótesis de que lo hace.

Mientras tanto, la investigación sobre la fuerza del matrimonio ha encontrado alguna evidencia de que las parejas casadas que se reúnen en línea tienen menores tasas de ruptura matrimonial que las que se reúnen tradicionalmente. Eso tiene el potencial de beneficiar significativamente a la sociedad. Y es exactamente lo que predice el modelo de Ortega y Hergovich.

Por supuesto, hay otros factores que podrían contribuir al aumento del matrimonio interracial. Una es que la tendencia es el resultado de una reducción en el porcentaje de estadounidenses que son blancos. Si los matrimonios son aleatorios, esto debería aumentar el número de matrimonios interraciales, pero no por la cantidad observada. "El cambio en la composición de la población en los Estados Unidos no puede explicar el enorme aumento en el matrimonio mixto que observamos", dicen Ortega y Hergovich.

Eso deja a las citas en línea como el principal impulsor de este cambio. Y si ese es el caso, el modelo implica que este cambio está en curso.

Esa es una profunda revelación. Estos cambios están programados para continuar y beneficiar a la sociedad como resultado.


Ref: arxiv.org/abs/1709.10478 : The Strength of Absent Ties: Social Integration via Online Dating



martes, 10 de octubre de 2017

Análisis del hashtag #FirstSevenJobs en Facebook


Los #FirstSevenJobs que tuvimos

Lada Adamic - Facebook Research·


En agosto de 2016 muchas personas participaron en la lista de sus primeros siete puestos de trabajo en Facebook usando los hashtags #firstsevenjobs o #first7jobs. Como sucede a veces con las tendencias de Internet, ésta se extendió desigualmente por todo el mundo, ofreciendo una visión tanto de la universalidad de los primeros empleos, como también interesantes diferencias entre los diferentes países.
Como mucha gente fijó sus metas profesionales para el Año Nuevo por delante, pensamos que era un buen momento para recordar a todos la similitud de nuestros primeros caminos de carrera.
Para procesar los trabajos de forma automatizada, procesamos el conjunto de actualizaciones de estado des-identificado mediante agrupación de texto para identificar los trabajos más comunes y colocarlos juntos en clústeres. Nuestro método de agrupamiento fue una similitud de coseno textual muy simple basada en secuencias solapadas de 3 caracteres. Por ejemplo, "consejero de campamento", "consejero de campamento de verano", "consejero de campamento de día", "consejero de campamento de YMCA", "consejero de campamento de niñas exploradoras", todos se colocan en el mismo grupo de consejeros de campamentos, "Camarera", etc.
Usando esta técnica pudimos hacer coincidir automáticamente un promedio de 3.3 puestos de trabajo por persona en actualizaciones de estado en inglés incluyendo #firstsevenjobs o #first7jobs. .
Los 20 empleos más citados fueron:

rank job 1 babysitter 2 cashier 3 lab assistant 4 newspaper delivery 5 teacher 6 camp counselor 7 retail 8 dishwasher 9 receptionist 10 manager 11 waiter/server 12 hostess 13 intern 14 mcdonald's 15 student 16 barista 17 store clerk 18 pizza delivery 19 lifeguard 20 research assistant


Para las listas numeradas, desde el primer trabajo hasta el séptimo, analizamos aún más el número que precedía al trabajo, de modo que pudiéramos clasificar los trabajos por su orden promedio en la lista. El cuidado de niños y la entrega de periódicos fueron algunos de los primeros empleos para puestos en inglés.

               job   order          babysitter  1.42
 newspaper delivery 1.76
         mcdonald's 2.59
         dishwasher 2.83
          lifeguard 3.18
            cashier 3.22
     camp counselor 3.43
            hostess 3.55
        store clerk 3.64
             retail 3.77
     pizza delivery 3.86
      waiter/server 4.08
            barista 4.18
      lab assistant 4.29
       receptionist 4.34
             intern 4.56
            student 4.64
            teacher 4.93
 research assistant 5.17
            manager 5.20
También podemos comparar los primeros siete empleos con categorías amplias de ocupación para las ocupaciones actuales. Aunque muchos primeros trabajos comenzaron en ventas y servicios de alimento, mucha gente que fijaba los memes había movido a otras ocupaciones. Aquí están las industrias más importantes de todo el mundo:

Percent Occupation 17.4 Arts, Design, Entertainment, Sports, and Media 13.0 Education, Training, and Library 12.9 Management 8.7 Sales and Related 8.0 Office and Administrative Support 5.5 Computer and Mathematical 5.3 Production 4.2 Food Preparation and Serving Related 3.7 Life, Physical, and Social Science 3.2 Personal Care and Service


Como se mencionó anteriormente, el meme también apareció en finlandés. Aplicando el mismo agrupamiento automatizado, encontramos la siguiente lista:


rank order job 1 3.83 kahvilatyöntekijä (coffee shop worker) 2 3.43 siivooja (cleaner) 3 3.16 lastenhoitaja (nanny) 4 3.46 toimistoapulainen (office assistant) 5 1.77 mansikanpoimija (strawberry picker) 6 3.76 myyjä (sales person) 7 5.26 toimittaja (journalist) 8 5.40 toimistosihteeri (secretary) 9 3.19 sairaala-apulainen (hospital assistant) 10 5.22 opettajan sijainen (substitute teacher) 11 4.91 tarjoilija (waiter/waitress) 12 3.89 kirjakaupan myyjä (book store sales person) 13 3.95 kaupan kassa (grocery store cashier) 14 3.49 kerhonohjaaja (instructor at a club - likely for kids' activities) 15 1.66 mainostenjakaja (paperboy for ads) 16 5.05 lastentarhanopettaja (kindergarten teacher) 17 4.06 puhelinmyyjä (phone sales person) 18 4.19 kouluavustaja (school assistant) 19 3.24 lähetti (delivery person) 20 3.76 r-kioskin myyjä (clerk at R_kioski - similar to Seven Eleven stores)


Mientras que muchos de los primeros siete trabajos se superponen, hay por lo menos una diferencia interesante: cosecha de la fresa. Es el quinto trabajo más comúnmente mencionado en la variante finlandesa del meme, donde la recolección de fresas en campos y bosques es una fuente común de empleo estacional. Para muchos es el primer trabajo en la lista (posición media es 1,7).
Finalmente, también agrupamos las respuestas en los mensajes en vietnamita.

rank order job 1 4.48 nhân viên văn phòng (office staff) 2 3.65 gia sư (tutor) 3 3.57 bồi bàn (waiter/waitress) 4 3.78 bán hàng online (online seller) 5 3.92 bán hàng (sales person) 6 1.50 nhổ tóc bạc (plucking white hair, something kids do for older people like grandparents for money or candies) 7 3.21 phát tờ rơi (flyer distributor) 8 4.63 chụp ảnh dạo (photographer) 9 3.08 bán đồ handmade (handmade crafts seller) 10 4.44 phiên dịch (translator) 11 3.67 đi học (studying) 12 4.96 kế toán (accountant) 13 4.75 freelancer (freelancer) 14 4.55 trợ giảng (teaching assistant) 15 4.65 lễ tân (receptionist) 16 4.27 shipper (shipper) 17 4.33 thu ngân (cashier) 18 3.81 viết báo (journalist)


Aquí, junto con muchas respuestas que mencionaban trabajos similares, también hubo algunas interpretaciones ligeras de los primeros "empleos": pedir a los padres dinero (xin tiền bố mẹ), la pereza (làm biếng) o estar desempleado (thất nghiệp).
Así que ahí está, la gente habla tres idiomas diferentes, compartiendo el mismo hashtag en su actualización de estado, mencionando los mismos primeros trabajos que ellos tenían, y revelando un poco de lo que es entrar en la fuerza de trabajo donde viven.

Esta nota fue preparada por Lada Adamic y Viet-An Nguyen. Damos las gracias a Tuomas Pelkonen por traducir la lista de trabajos más comúnmente mencionados en finés.

domingo, 8 de octubre de 2017

Visualización: Claves para destacar la información

Visualización gráfica 101: Apoyo perceptual de visualización


Linkurious


Estamos lanzando Graph Viz 101, una serie de publicaciones para enseñar los fundamentos de la visualización gráfica, escrito por Sébastien Heymann en colaboración con Bénédicte Le Grand de la Université de Paris 1. Este es nuestro segundo post, por favor discuta abajo!

La visualización de la información se ha utilizado para apoyar el análisis de redes sociales desde la década de 1930 con el "sociograma" de J. Moreno (Moreno 1937), que es una representación gráfica de los lazos sociales entre un grupo de personas. A pesar del comienzo temprano de las imágenes de la red, tuvimos que esperar hasta los años 90 y la democratización de la computación gráfica para ver el desarrollo del software de visualización interactiva, que ha hecho posible la exploración interactiva de redes complejas. Pajek (Batagelj 1998) es la herramienta más notable, ya que proporciona algoritmos estadísticos y representaciones visuales de las redes sociales. Su libro metodológico titulado "Exploratory Social Network Analysis with Pajek" fue publicado en 2005. La contribución de Information Visualization a la ciencia se expresa en (Fekete 2008):

La visualización de la información está destinada a generar nuevas ideas e ideas que son las semillas de las teorías mediante el uso de la percepción humana como un filtro muy rápido: si la visión percibe algún patrón, podría haber un patrón en los datos que revela una estructura. [...] Por lo tanto, desempeña un papel especial en las ciencias como un método generador de percepción.
De manera más general, la Visualización de Información es una forma de revelar propiedades de datos que no serían trivialmente detectadas de otra manera, para arrojar luz sobre los avances y para compartir la experiencia conmovedora de "Ajá, Ya veo!" (Few 2006) gracias a su aspecto intuitivo. Este campo de investigación contribuye a la aparición de nuevas teorías científicas mejorando la explotación de la cognición humana. Según Card, Mackinlay y Shneiderman (Card 1999), el objetivo principal de la visualización es, de hecho, amplificar la cognición. Los autores enumeraron una serie de maneras clave de hacerlo, mostrando las ventajas de utilizar técnicas de visualización durante la exploración de datos:

  • Reduciendo el tiempo dedicado a buscar información,
  • Mejorando el reconocimiento de patrones,
  • Habilitando las operaciones de inferencia perceptiva,
  • Utilizando mecanismos de atención perceptiva para tareas de monitoreo,
  • Codificando la información en un medio accionable.

En esta entrada del blog ofrecemos una breve introducción al soporte perceptual de la visualización.

La visualización de la información se basa en las propiedades y las capacidades de percepción del sistema visual humano. De acuerdo con la Teoría de la Información, la visión es el sentido que tiene el mayor ancho de banda (100 Mbits / s), lo que lo convierte en el canal más adecuado para transmitir información al cerebro (en contraste, la audición tiene sólo alrededor de 100 bits / s). (Ware 2004). La visualización requiere, por tanto, la construcción y aplicación de un lenguaje visual para codificar la información que se puede leer e interpretar correctamente. Esta operación se denomina mapeo entre variables de datos y variables visuales. Este lenguaje se basa en características visuales como primitivas geométricas, colores y tamaños, y fue teorizado en (Bertin 1967) y (Cleveland 1984), y ampliado en (Mackinlay 1986).

Sin embargo, seleccionar características visuales para transmitir información no es trivial. Uno realmente desea seleccionar los más eficaces, pero evitando malentendidos e interpretaciones excesivas. Las directrices bien establecidas distinguen dos tipos de variables de datos: variables cuantitativas y cualitativas (véase el cuadro siguiente). Las características visuales se pueden seleccionar según el tipo de datos, pero las dificultades permanecen mezclando diversas variables visuales en la misma imagen.


Ejemplo de pautas para el mapeo de variables de datos a variables visuales (Stolte 2002).
Dos teorías psicológicas principales explican cómo la visión se puede utilizar eficientemente para percibir rasgos y formas, según (Ware 2004): la teoría preattentive del proceso, y la teoría de Gestalt.

Algunas características visuales son particularmente eficientes como se demuestra en (Triesman 1985) y (Healey 1995), un efecto llamado procesamiento preatentivo. Las saliencias visuales, es decir, elementos y patrones que se destacan perceptivamente del resto del cuadro y capturan la atención del observador (Itti 2001), pueden percibirse muy rápidamente (en un orden de menos de 250 milisegundos) y pueden reconocerse "al una mirada "sin ningún esfuerzo cognitivo, incluso si se ha encontrado que el nivel de atención juega un papel crítico. Un ejemplo se ilustra en la siguiente figura, donde localizamos las letras rojas entre varias letras oscuras (imagen izquierda), así como localizamos la T entre líneas muy rápidamente (imagen derecha).



Ilustración del impacto del tratamiento preatentivo en la detección de elementos periféricos (Wong 2010). (a) Algunos elementos se pueden ver en una sola mirada, mientras que otros son difíciles de encontrar. (b) Ejemplos de características visuales que hacen que los objetos sean distintos.

Pero mezclar colores y formas nos obliga a prestar una atención específica a cada artículo, como vemos en esta ilustración:




Ilustración del impacto de mezclar características visuales en el efecto de procesamiento preatentivo (Wong 2010): (a) El uso simultáneo de muchas características gráficas puede impedir el ensamblaje visual de los datos. (b) Múltiples vistas de los mismos datos con parámetros limitados trazados pueden comunicar mejor las relaciones específicas.

La teoría de la Gestalt, establecida en (Koffka 1935), explica los principales principios que conducen a la interpretación de las imágenes. (Ware 2004) los resume de la siguiente manera:

  • Proximidad: Las cosas que están muy juntas se agrupan perceptualmente;
  • Similitud: Elementos similares tienden a agruparse;
  • Cercanía: Un contorno cerrado tiende a ser visto como un objeto;
  • Continuidad: Los elementos visuales que están suavemente conectados o continuos tienden a agruparse;
  • Simetría: Dos elementos visuales dispuestos simétricamente tienen más probabilidades de ser percibidos como un todo;

Ilustramos estas leyes en la siguiente tabla (fuente desconocida):


Ley de agrupamientoEstructuraPercepciónIlustración
Proximidad2 componentes cercanos1 componente seimple
SimilaridadComponentes similares Componentes agrupados
CercaníaLímites cercanos Límites unificados
ContinuidadÍtemes vecinosÍtemes agrupados
SimetríaÍtemes simétricosÍtem global
I