jueves, 28 de septiembre de 2017

¿Las familias influyen en la decisión de trabajo?

¿Las familias influencian la elección de trabajo?

Por: Lada Adamic, Ismail Onur Filiz | Facebook Research



¿Qué parte de nuestra elección de profesión depende de quiénes son nuestros padres? Los padres transmiten sus genes, dan un ejemplo, ofrecen oportunidades y dan consejos para apuntar o alejarse de sus propias líneas de trabajo. Al final, ¿sus hijos terminan en el mismo tipo de trabajo? ¿Los hermanos eligen la misma ocupación? ¿Y esto es más o menos cierto para las diferentes profesiones?

Para estudiar estas preguntas, analizamos en conjunto dos conjuntos relacionados de datos de Facebook identificados: una muestra de las elecciones de profesión de los hermanos y la otra de las elecciones entre padres e hijos. La muestra incluyó a aquellos pares de individuos en locaciones de habla inglesa que especificaron una relación de hermano o padre-hijo en Facebook, junto con el relleno de sus ocupaciones. Las ocupaciones se asignaron a las principales categorías de ocupación 1. La categoría de ocupación militar está sobrerrepresentada porque está cartografiada en función de la ocupación del empleador y de la ocupación declarada y del servicio militar anterior, mientras que otras categorías de puestos se asignaron basándose únicamente en la ocupación declarada. Dado que los datos excluyen aquellos que no especifican una ocupación en Facebook, puede que no sea representativo de la población en general, pero es interesante estudiar, no obstante.





¿Los niños comparten las ocupaciones de sus padres?


La visualización muestra que la probabilidad de que la ocupación de un niño caiga dentro de una categoría determinada varía según la ocupación. Utilizando una muestra de pares de padres e hijos de 5,6 millones de los lugares de habla inglesa que enumeran una ocupación, primero calculamos la probabilidad de que un niño tenga una ocupación, dada la ocupación de su padre, p. un abogado-padre con un doctor-hijo (5%). También calculamos entonces cuán elevada esta probabilidad es relativa a la proporción total de médicos entre los hijos. En este caso, un hijo de alguien en la profesión legal es 4,6 veces más probabilidades de practicar la medicina que los hijos en general.



En esta visualización de red, cada nodo representa un par de ocupación-género, p. mujeres científicas. Las etiquetas están abreviadas. Los enlaces indican cuánto más probable es que un hijo de un padre en una profesión escoja otra profesión contra alguien de la población general. Sólo se muestran enlaces con un multiplicador de al menos 2,5.

Otra forma de ver las conexiones entre las ocupaciones de padres e hijos es a través de una visualización de red, mostrada arriba. Por ejemplo, los padres en el ejército tienen más probabilidades que el promedio de tener un hijo en el servicio de protección, y se muestra una línea que muestra esa relación entre las ocupaciones de los padres y el niño. Mediante el establecimiento de la red de tales conexiones, utilizando un algoritmo de distribución de la red dirigida por la fuerza para situar las ocupaciones con inusualmente altos vínculos entre generaciones más cerca, vemos profesiones agrupando ligeramente en los que requieren un título secundario (superior y superior) o no.

Aunque relativamente hablando, un niño puede ser mucho más propenso a seguir los pasos de sus padres, el porcentaje absoluto puede ser todavía bastante bajo. Un hijo que tiene un padre en el ejército tiene 5 veces más probabilidades de entrar en el ejército, pero sólo uno de cada cuatro hijos de un militar lo hace. Para los padres en el conjunto de datos que trabajan en la agricultura, la pesca y la silvicultura, sólo el 3% de sus hijos permanecen en la profesión, pero esta probabilidad es 7,6 veces la tasa global. El 20% de las hijas de las madres que trabajan en la oficina y el apoyo administrativo eligen la misma carrera, pero ésta es solamente 2x la tarifa generalmente. Por otro lado el 8,5% de las hijas de madres en enfermería también elige una carrera en enfermería, y esto es 3,75 veces la tasa global. También vemos una "herencia" de ocupación sustancial de género cruzado, p. los padres de científicos tienen hijas científicas a 3.9 la tasa global, mientras que las madres que trabajan en la ley tienen hijos eligiendo una profesión legal a 6.6 veces la tasa general. Tenga en cuenta que una relación negativa, en la que el niño tiene menos probabilidades de ingresar a una profesión debido a su origen familiar, suele ser muy pequeña. Por ejemplo, para los abogados-padres, la probabilidad de que sus hijos entren en la construcción o mantenimiento o reparación es de alrededor del 85% de la probabilidad general.

A continuación vemos si los hermanos eligen la misma ocupación. Los hermanos no sólo comparten el mismo padre, sino que a veces, como en el caso de gemelos idénticos, comparten los mismos genes (los gemelos idénticos son genéticamente idénticos, los gemelos fraternales son genéticamente tan diferentes como los hermanos). Ya sean idénticos o fraternales 2, los gemelos también son más propensos a ser criados en un entorno similar - los estilos de crianza pueden diferir a medida que los padres agregan más hijos a su cría, pero los gemelos probablemente estarán expuestos a un estilo similar de crianza.

Para el análisis de ocupaciones de hermanos consideramos una muestra de 2.37 millones de hermanos del mismo-género en los EEUU que habían llenado sus ocupaciones en sus perfiles. Comparamos las tasas en las que los gemelos del mismo sexo compartían una ocupación con los hermanos del mismo sexo no más de dos años de diferencia, y luego dos personas del mismo sexo en nuestra muestra que no tenían más de dos años de diferencia en la edad.

El 15% de los hermanos comparten una ocupación, que es superior a la tasa del 8,6% para dos personas del mismo género de la misma edad de la población. La tendencia de los gemelos a elegir la misma ocupación, con un 24,7%, es aún más sorprendente.







Las gráficas anteriores muestran un desglose de este efecto por ocupación y género (púrpura para las mujeres y azul para los pares masculinos). Para cada triplete de barras, la barra más opaca es la base de referencia de ocupación superpuesta. La barra más ligera es la superposición observada entre hermanos no gemelos del mismo sexo. La barra más ligera es la superposición observada entre gemelos del mismo género. Por defecto, las ocupaciones se ordenan de arriba hacia abajo según la superposición gemela observada para cada sexo por separado.

Para concluir, vemos que las personas dentro de una familia son proporcionalmente más propensas a finalmente también elegir la misma ocupación, y esto es especialmente cierto de los gemelos. Sin embargo, en términos absolutos, la inmensa mayoría de los chicos huelga su propio camino y elegir una profesión diferente de la de sus padres o sus hermanos.


  1. Consulte http://www.bls.gov/soc/major_groups.htm para saber cómo se definen.
  2. Debido al aumento en el uso de tratamientos de fertilidad, lo que provoca la liberación y / o implantación de múltiples huevos, el número de gemelos fraternos nacidos ha aumentado de ser aproximadamente igual al número de nacimientos gemelos idénticos a superar en número a 2: 1.

martes, 26 de septiembre de 2017

Redes de amistad de Facebook en Europa

Amistades de Facebook en Europa

Por: Ismail Onur Filiz, Lada Adamic, Bogdan State | Facebook Research



Sitios como Facebook nos dan la capacidad sin precedentes de formar y mantener relaciones con personas de todo el mundo. En este post exploramos parte de este paisaje conectado: Europa. En cuanto a los datos agregados y anónimos, hemos descubierto que sólo en el continente europeo existen cerca de 5.000 millones de amistades entre países de Facebook.


Figura 1: Facebook amigos a través de las ciudades. Los colores fueron seleccionados aleatoriamente por país para los enlaces dentro del país, y el blanco fue elegido para los lazos entre los países.

La Figura 1 muestra, en conjunto, las relaciones de amistad entre las ciudades, tanto dentro de las fronteras como a través de ellas. Al visualizar la hermosa red de conexiones de amistad de ciudad a ciudad, encontramos una interesante tendencia: año tras año, la proporción de nuevas amistades que son internacionales ha ido creciendo. No sólo eso, cada agosto, cuando los europeos viajan de vacaciones, las amistades internacionales reciben un impulso adicional.

Por último, se calcula, para las personas que viven actualmente en un país, independientemente de su país de origen o de sus amigos, el número de amigos que viven en un país europeo diferente. Observamos que la proporción agregada de amistades internacionales dentro de Europa es mayor en los estados con poblaciones pequeñas, con un 85% en San Marino y Mónaco. Suiza, Moldavia, Albania y Chipre, tienen entre un 25 y un 30%. Alemania, Bélgica e Islandia tienen alrededor del 15%, y Gran Bretaña, Francia, España, Dinamarca y Noruega tienen entre 10-11%. Uno de los porcentajes más bajos es para Italia (6%), aunque con muchos más Agostos (día del amigo) por venir, esto puede cambiar en el tiempo.

domingo, 24 de septiembre de 2017

Clusters bibliométricos sobre el Antropoceno

Mapeando una controversia de nuestro tiempo: El Antropoceno

Simone Belli | Lo Sguardo




Ofrecemos un análisis bibliométrico de la literatura y autores de la polémica disciplina antropocénica. Gracias a las herramientas digitales, comprendemos esta complejidad aprovechando la literatura existente y las redes digitales. Con el fin de apreciar el carácter interdisciplinario de la controversia, se muestran agrupamientos de co-citado publicaciones, co-autores, y co-occurrencia detérminos en los campos de las ciencias sociales, la agricultura y la biología, la ciencia ambiental y la Tierra y la ciencia planetaria. El carácter multidisciplinario de la investigación antropocénica se refleja en el análisis de la co-citación y en el análisis del término co-ocurrencia. Encontramos dos grupos de términos coexistentes, que representan acuerdo y desacuerdo con Antropoceno, y ofrecen una comparación de las obras emblemáticas presentadas en la red.



viernes, 22 de septiembre de 2017

Percolación y crecimiento explosivo detrás de la viralidad

Las nuevas leyes de las redes explosivas


Los investigadores están descubriendo las leyes ocultas que revelan cómo crece Internet, cómo se propagan los virus y cómo estallan las burbujas financieras.

Jennifer Ouellette | Quanta Magazine


Las redes crecen a medida que los nodos individuales se conectan entre sí. Al modificar las reglas que rigen cuando los nodos se conectan, los investigadores pueden configurar las propiedades de la red.
Paolo Čerić / PATAKK


La semana pasada, United Airlines mantuvo en tierra cerca de 5.000 vuelos cuando su sistema informático se cayó. El culpable: un enrutador de red defectuoso. Más tarde, la misma mañana, otro fallo de la computadora interrumpió la negociación en la Bolsa de Nueva York durante más de tres horas.

Algunos vieron la mano siniestra de un hacker en estas interrupciones, pero son mucho más probables ser una coincidencia, una característica intrínseca del sistema algo que un insecto. Las redes bajan todo el tiempo, consecuencia de niveles de interconexión sin precedentes. Las interrupciones pueden ocurrir incluso en las redes más robustas, ya sean redes eléctricas, mercados financieros globales o su red social favorita. Como señaló el ex reportero del Atlantic, Alexis Madrigal, cuando un error informático cerró la bolsa de valores Nasdaq en 2013, "Cuando las cosas funcionan de nuevas maneras, se rompen de nuevas maneras".

Una nueva comprensión de estos sistemas - la forma en que crecen, y cómo se rompen - ha surgido de la física del café.

Los investigadores suelen pensar en la conectividad de red como sucediendo de una manera lenta y continua, similar a la forma en que el agua se mueve a través de granos de café recién molido, saturando lentamente todos los gránulos para convertirse en café en el contenedor de abajo. Sin embargo, en los últimos años, los investigadores han descubierto que en casos especiales, la conectividad podría surgir con una explosión, no un gemido, a través de un fenómeno que han denominado "percolación explosiva".







Clusters cultivados por percolación explosiva

Esta nueva comprensión de cómo surge la über-conectividad, que fue descrita a principios de este mes en la revista Nature Physics, es el primer paso hacia la identificación de señales de advertencia que pueden ocurrir cuando tales sistemas fallan -por ejemplo, cuando las redes eléctricas comienzan a fallar o cuando una enfermedad infecciosa comienza a convertirse en una pandemia mundial. La percolación explosiva puede ayudar a crear estrategias eficaces de intervención para controlar ese comportamiento y, quizás, evitar consecuencias catastróficas.

Un giro explosivo

Los modelos matemáticos tradicionales de percolación, que datan de la década de 1940, ven el proceso como una transición suave y continua. "Pensamos en la percolación como el agua que fluye por el suelo", dijo Robert Ziff, físico de la Universidad de Michigan, que ha estado estudiando transiciones de fase durante los últimos 30 años. "Es una formación de conectividad de largo alcance en el sistema".

La formación de conectividad puede entenderse como una transición de fase, el proceso por el cual el agua se congela en hielo o se separa en vapor.

Las transiciones de fase son omnipresentes por naturaleza, y también proporcionan un modelo práctico de cómo los nodos individuales en una red aleatoria se unen gradualmente, uno por uno, a través de conexiones de corto alcance a lo largo del tiempo. Cuando el número de conexiones alcanza un umbral crítico, un cambio de fase hace que el mayor clúster de nodos crezca rápidamente y resultados de über-conectividad. (Visto de esta manera, el proceso de percolación que da lugar a su taza de mañana de Joe es un ejemplo de una transición de fase.La agua caliente pasa a través de frijoles tostados y cambia a un nuevo estado - café.)

Raissa D'Souza, física de la Universidad de California, Davis, 
está explorando cómo las intervenciones a pequeña escala
pueden alterar una red grande y compleja

.

La percolación explosiva funciona un poco diferente. La noción surgió durante un taller en 2000 en el Instituto Fields para la Investigación en Ciencias Matemáticas en Toronto. Dimitris Achlioptas, científico de computación de la Universidad de California en Santa Cruz, propuso un posible medio para retrasar la transición de fase a una red densamente conectada, fusionando la noción tradicional de percolación con una estrategia de optimización conocida como el poder de dos opciones. En lugar de dejar que dos nodos aleatorios se conecten (o no), considere dos pares de nodos aleatorios y decida qué par prefiere conectar. Su elección se basa en criterios predeterminados; por ejemplo, puede seleccionar el par que tenga menos conexiones preexistentes con otros nodos.

Debido a que un sistema aleatorio normalmente favorecería a los nodos con las conexiones más preexistentes, esta elección forzada introduce un sesgo en la red, una intervención que altera su comportamiento típico. En 2009, Achlioptas, Raissa D'Souza, físico de la Universidad de California, Davis, y Joel Spencer, matemático del Instituto Courant de Ciencias Matemáticas de la Universidad de Nueva York, encontraron que modificar el modelo de percolación tradicional de esta manera cambia dramáticamente la naturaleza de la transición de fase resultante. En lugar de surgir de una marcha lenta y continua hacia una conectividad cada vez mayor, las conexiones emergen globalmente de una vez por todas en todo el sistema en una especie de explosión, de ahí el apodo de "percolación explosiva".

El concepto ha explotado por derecho propio, generando innumerables documentos en los últimos seis años. Muchos de los trabajos discuten si este nuevo modelo constituye una transición de fase verdaderamente discontinua. De hecho, en 2011 los investigadores mostraron que para el modelo particular analizado en el estudio original de 2009, las transiciones explosivas sólo ocurren si la red es finita. Mientras que las redes como Internet tienen como máximo alrededor de mil millones de nodos, las transiciones de fase se asocian más comúnmente con los materiales, que son redes intrincadas de tantas moléculas (aproximadamente 1023 o más) que los sistemas son efectivamente infinitos. Una vez extendidas a un sistema verdaderamente infinito, las percolaciones explosivas parecen perder parte de su boom.

Sin embargo, D'Souza y sus cohortes tampoco han estado ociosos. Han descubierto muchos otros modelos de percolación que producen transiciones realmente abruptas. Estos nuevos modelos comparten una característica clave, según D'Souza. En la percolación tradicional, los nodos y pares de nodos se eligen al azar para formar conexiones, pero la probabilidad de que dos grupos se fusionen es proporcional a su tamaño. Una vez que un gran grupo se ha formado, domina el sistema, absorbiendo cualquier racimo más pequeño que podría fusionarse y crecer.

Sin embargo, en los modelos explosivos, la red crece, pero el crecimiento del gran grupo se suprime. Esto permite que muchos clústeres grandes pero desconectados crezcan, hasta que el sistema alcance el umbral crítico en el que agregar sólo uno o dos enlaces adicionales desencadena un cambio instantáneo a la über-conectividad. Todos los grandes clusters se combinan a la vez en una sola fusión violenta.

Un nuevo paradigma para el control

D'Souza quiere aprender a controlar mejor las redes complejas. La conectividad es una espada de doble filo, según ella. "Para sistemas operativos normales (como Internet, las redes aéreas o la bolsa de valores), queremos que estén fuertemente conectados", dijo. "Pero cuando pensamos en la propagación de epidemias, queremos reducir el alcance de la conectividad". Incluso cuando la conectividad es deseable, a veces puede ser contraproducente, causando un colapso potencialmente catastrófico del sistema. "Nos gustaría ser capaces de intervenir en el sistema fácilmente para mejorar o retrasar su conectividad", dependiendo de la situación, dijo.

La percolación explosiva es un primer paso en el pensamiento sobre el control, según D'Souza, ya que proporciona un medio de manipular el inicio de la conectividad de largo alcance a través de interacciones a pequeña escala. Una serie de intervenciones a pequeña escala puede tener consecuencias dramáticas - para bien o para mal.

Los profesionales de las relaciones públicas a menudo se preguntan cómo el trabajo de D'Souza podría ayudar a sus productos ir viral. Ella responde típicamente señalando que sus modelos suprimen realmente comportamiento viral, por lo menos en el corto plazo. "¿Quieres ganar todas las ganancias tan rápido como puedas, o quieres suprimir el crecimiento, así que cuando sucede, más gente aprende de inmediato?", Dijo. Lo mismo ocurre con las campañas políticas, según Ziff. Siguiendo este modelo, pasarán gran parte de su tiempo a principios de la campaña en los esfuerzos locales de base, creando grupos localizados de conexiones y suprimiendo la aparición de conexiones de largo alcance hasta que la campaña esté lista para ir nacional con un gran chapoteo mediático.

En otros sistemas, como los mercados financieros o las redes de energía eléctrica, cuando ocurre un colapso, es probable que sea catastrófico, y este enfoque de mosaico podría ser utilizado para invertir el proceso, rompiendo el sistema conectado en una colección de agrupamientos disjuntos, o "islas", para evitar catastróficas fallas en cascada. Idealmente, uno esperaría encontrar un "punto dulce" para el nivel óptimo de intervención.


En las redes eléctricas, las empresas de servicios públicos pierden dinero cada vez que una línea baja, por lo que idealmente uno debe tratar de evitar cualquier tiempo de inactividad. Sin embargo, actuar para evitar cualquier interrupción en absoluto puede conducir inadvertidamente a interrupciones muy grandes que son mucho más costosas. Por lo tanto, el fomento de pequeños "fallos" en cascada puede disipar los desequilibrios energéticos que de otro modo habrían causado fracasos masivos más adelante, una estrategia potencialmente inteligente a pesar de que come en los márgenes de beneficio. "Si suelen desencadenar pequeñas cascadas, nunca se obtienen eventos realmente masivos, pero sacrifican todo ese beneficio a corto plazo", explicó D'Souza. "Si se evitan las cascadas a toda costa, se puede obtener una gran ganancia, pero eventualmente se producirá una cascada, y será tan masiva que [podría] borrar todo su beneficio".

El siguiente paso es identificar los signos que pueden indicar cuando un sistema está a punto de ser crítico. Los investigadores entienden las transiciones de fase como las que suceden cuando el agua se convierte en hielo y pueden identificar señales de un cambio inminente. Lo mismo no puede decirse de la percolación explosiva. "Una vez que tengamos una mejor comprensión, podremos ver cómo nuestras intervenciones de control están impactando el sistema", dijo D'Souza. "Vamos a tener estos datos que podemos analizar en tiempo real para ver si estamos viendo la firma de las señales de alerta temprana de muchas clases diferentes de transiciones".

Las transiciones de fase han fascinado físicos y matemáticos por décadas, así que ¿por qué se ha encontrado este comportamiento explosivo sólo ahora? D'Souza piensa que es porque el descubrimiento requirió la fusión de ideas de varios campos, sobre todo la idea de Achlioptas de mezclar algoritmos y física estadística, creando así un emocionante nuevo fenómeno de modelado. "Realmente es un nuevo paradigma de percolación", dijo Ziff.

miércoles, 20 de septiembre de 2017

Extremistas de derecha dominan el Twitter alemán

La AfD de la derechista populista domina el Twitter alemán, según un nuevo estudio


Partido nacionalista mantiene una influencia desmesurada en las redes sociales cuando la elección se acerca

Financial Times



La investigación publicada hoy por un grupo en la universidad de Oxford demuestra que la alternativa populista de la derecha Alternative für Deutschland (AfD) conduce más tráfico de Twitter que cualquier partido alemán importante, y más uniforme que la discusión no partidista de las próximas elecciones generales sí mismo.

El estudio realizado por el Oxford Computational Propaganda encontró que, de casi 1m tweets recolectados entre el 1 y el 10 de septiembre, las hashtags asociadas específicamente con la AfD aparecieron en más del 30 por ciento.

El AfD, que espera ganar sus primeros escaños en el parlamento alemán el domingo, es "muy destacado en la esfera alemana de Twitter", concluye el estudio. La investigadora principal Lisa-Maria Neudert dijo al FT que la AfD "domina absolutamente" el tráfico político alemán de Twitter.

AfD domina el tráfico del Twitter político alemán

Miles de tweets por categoría de hashtags usados, 1-10 de Septiembre de 2017


Neudert dijo: "AfD es muy ruidoso en los medios sociales. Tienen un gran seguimiento y una buena estrategia de comunicación, una estrategia de medios sociales primero ". El estudio no distingue entre el tráfico de Twitter que apoya a la AfD y que se opone a ella.

El estudio también encontró que la proporción total de tráfico generada por cuentas altamente automatizadas, conocidas como bots, era "no sustancial", aunque el nivel de automatización era mayor para el tráfico usando hashtags relacionados con AfD.

La AfD es el partido populista derechista más exitoso en Alemania desde la segunda guerra mundial. Su objetivo declarado es "la autopreservación no la autodestrucción de nuestro estado y nuestro pueblo" y sus políticas incluyen el "cierre de todas las fronteras alemanas". Se espera que el partido gane 50 o más escaños en las elecciones del domingo.

La publicación del estudio llega después de una semana en la que las empresas de medios sociales dominantes se enfrentan a un escrutinio renovado sobre su papel, en gran medida opaco, en la formación del discurso político. Facebook entregó información a la investigación del abogado especial Robert Mueller sobre la interferencia rusa en las elecciones de 2016 en Estados Unidos después de revelar que los usuarios vinculados a Rusia habían comprado por lo menos $ 100,000 de publicidad en el sitio.

Los análisis originales de FT de los datos de Twitter y Facebook muestran cómo la posición de los medios de comunicación social de la AfD tiene el potencial de proporcionar el punto de apoyo para un cambio en el discurso político alemán hacia la extrema derecha y que tal cambio ya esté en marcha.




El mapeo de las relaciones de Twitter entre más de 700 candidatos del Bundestag identificados como usuarios de la plataforma de medios sociales por el grupo de campaña de transparencia Abgeordnetenwatch.de muestra hasta qué punto la AfD es distinta de la corriente política. Los candidatos a los partidos principales tienen más probabilidades de seguirse unos a otros, mientras que pocos candidatos al AfD siguen a los de otros partidos y viceversa.

Ms Neudert, el investigador de Oxford, puso el número de usuarios de Twitter en Alemania en 1m - una fracción de los más de 30m usuarios alemanes de Facebook. Sin embargo, señaló, Twitter es considerado importante por "líderes de opinión e influenciadores" y sirve como un canal para la comunicación abierta entre políticos y periodistas.

Con más de 350.000 gustos - más de dos de los partidos más grandes, CDU y SPD, juntos - el AfD tiene una presencia formidable Facebook similar. Mientras que la participación de los usuarios con el partido en Facebook creció constantemente a lo largo de la crisis de refugiados del verano de 2015, su mayor impulso llegó después de una protesta por una serie de agresiones sexuales en Colonia y otras ciudades alemanas en la víspera de Año Nuevo 2015. Los mensajes de la AfD se triplicaron a más de 380.000 en un mes. Muchos de los perpetradores de los asaltos eran solicitantes de asilo o inmigrantes ilegales, y el episodio ayudó a empujar el nivel de AfD de compromiso de Facebook a nuevas alturas.

El momento definitorio en el cambio de las páginas de Facebook de AfD

Compromiso del usuario por posteo realizado luego del Año Nuevo



No fue sólo el nivel de compromiso con el partido que se elevó tras los ataques de fin de año. El tono de la página Facebook de AfD cambió: las palabras y frases que, en Alemania, están más estrechamente asociadas con la era nazi comenzaron a aparecer con más frecuencia en los comentarios que los usuarios estaban publicando en la página.

Basado en investigaciones académicas y entrevistas con dos investigadores de lengua política alemanes, el FT compiló una lista de 25 términos asociados con la era nazi y / u otras ideologías nacionalistas alemanas. A continuación, utilizamos el software original para determinar la frecuencia con que aparecen estos términos en los comentarios de los usuarios en la página de AfD en Facebook.

En mayo de 2015, se utilizó un promedio de 2,6 de los términos en todos los comentarios por puesto de AfD. Un año más tarde, esta cifra había aumentado a 29,6 - un aumento del 1,100 por ciento. Entre los términos más frecuentemente utilizados se encuentran "Volksverräter" (traidor al pueblo) y "Altparteien" (partidos de establecimiento), ambos con fuertes connotaciones nazis.

Y también cambiaron las palabras que usan en su página de Facebook

Frecuencia de vocabulario del Tercer Reich en el comentario de cada post


Términos tales como "nacional" y "patriota" también han visto aumentos en la frecuencia. Aunque son ostensiblemente incontrovertibles, estos son algunos de los términos con una historia más problemática en Alemania.

El número de usuarios distintos de Facebook para utilizar dichos términos en los comentarios también aumentó, y aunque el uso de este lenguaje ha caído desde su pico a principios de 2016, sigue siendo significativamente mayor que para gran parte de la existencia de la página.

lunes, 18 de septiembre de 2017

Software: Visone

Visone (visual social network)

par Laurent Beauguitte | groupe fmr

Visone es un software desarrollado desde 2001 en la Universidad de Konstanz y el Instituto de Tecnología de Karlsruhe. La versión probada aquí es el 2.6.5 (Java jar, 18 MB) del 5 de marzo de 2012. Gratuito, el software es multiplataforma (Linux, OSX y Windows) pero no es de código abierto. La instalación supone que tiene instalado un entorno Java en su computadora (consulte el siguiente tutorial.).

La GUI se ve muy similar a otro software (Tulip, Gephi, etc), pero tiene la ventaja de ofrecer todas las opciones posibles en la misma página.


Interfaz de software de Visone

Los algoritmos de visualización propuestos son pocos y a menudo clásicos (circle, random o MDS en particular). Las herramientas de análisis son pocas, pero variadas y se basan tanto en aportes desde el lado de los físicos como en los sociólogos (especialmente para agrupación). Permiten estudiar grafos booleanos y valuados. Los resultados, así como los grafos abiertos (o directamente dibujados por el lápiz) se almacenan en la carpeta denominada gestor de atributos. Es posible obtener los resultados y aplicar un algoritmo de visualización simultáneamente a todos los grafos abiertos.



El formato de los archivos es, para los grafos, son archivos .graphml y los atributos de vértices y / o enlaces, archivos .csv. Es posible importar y exportar en los formatos más comunes (Ucinet, Pajek o .gml) y la exportación de las visualizaciones es posible en formato de imagen como en formato vectorial.

Curiosamente, el software se puede conectar a R (ver aquí), que permite lanzar modelos de Siena (ver la síntesis fmr n ° 13 dedicada al modelado estadístico de redes - en francés). También hace posible crear animaciones de una manera relativamente simple: simplemente crea un gestor de colecciones de red y selecciona los grafos que se van a insertar en la animación y luego haz clic en el carrete para generarlo.

Por otro lado, no encontré ninguna indicación acerca de los tamaños límite de los grafos soportados por el software (pero aún no lo he leído todo).


viernes, 15 de septiembre de 2017

Detección de comunidades con Pajek (1)

Detección de comunidades con Pajek 3.6

por Marion Maisonobe | groupe fmr


La nueva versión de Pajek ofrece buenas sorpresas para los exploradores de grafos complejos.

Las nuevas características discutidas aquí se agregaron al software entre mayo de 2012 y septiembre de 2012.

Se han implementado dos algoritmos de detección de comunidades:

Network/Create Partition/Communities


-Louvain method



El primer algoritmo se basa en el método de Louvain [1]. Este método se adapta bien a los grafos ponderados, incluso si están firmados (signed graphs). Al igual que con muchos algoritmos de agrupación, la calidad de la partición se optimiza mediante la maximización de la función de modularidad [2]. El índice de modularidad mide la diferencia entre la densidad de un grafo (o subgrafo) dado y la densidad de un grafo aleatorio que tiene las mismas características (número y peso de los enlaces).


Principio

Maximizar la función de modularidad para particionar un grafo es como asegurarse de que el número y el peso de los enlaces sean mayores dentro de las particiones que entre las particiones. Para expresarlo de manera diferente, la densidad intra-comunitaria debe exceder la densidad intercomunitaria.

El método de Louvain es "de abajo hacia arriba" y multi-nivel. Al inicio del algoritmo, todos los vértices pertenecen a una partición diferente. Se agrupan, por iteración, en particiones de modularidad óptima. En la primera situación óptima, el proceso continúa en el nivel superior: cada partición se trata como un vértice y así sucesivamente. La operación continúa hasta que no hay más ganancia de modularidad posible.

Ventaja

Este enfoque evita la falta de modularidad conocida como el "límite de resolución" [3]. Si asociar una partición del primer nivel con otro resultaría en una pérdida de modularidad, esta asociación no se realizaría por el método de Louvain. Como resultado, no es probable que estructuras pequeñas con buena modularidad estén incrustadas en estructuras mayores y menos significativas. Esto es lo que sucedería con un algoritmo "top-down" aplicado a un grafo grande.

Desventaja

El defecto conocido del método proviene de la sensibilidad del resultado al orden de tratamiento de los vértices. El orden en que los vértices son considerados tiene una influencia sobre la partición. Por lo tanto, puede ser útil realizar permutaciones para asegurar la robustez del resultado [4]. La otra forma es imponer un orden que tenga en cuenta las características de la red [5].

Además del algoritmo convencional de Louvain, Pajek ofrece una variante (con el refinamiento de niveles múltiples) que tiende a dar mejores resultados para grandes grafos. [6] El método de Louvain también está disponible en los software Gephi y NetworkX, así como en la biblioteca de software de I igraph, el algoritmo es más rápido en Pajek que en Gephi.

-VOS Clustering


El método de detección de la comunidad VOS optimiza otra función de calidad que la función de modularidad: la denominada función de agrupación VOS [7]. Esta es una variante ponderada de la modularidad que se ha pensado para el procesamiento de datos bibliométricos. Esta técnica da menos peso que un método clásico con un grado muy alto. A diferencia del método de Louvain, depende de un algoritmo "de arriba hacia abajo". Por esta razón, la única manera de escapar al problema de limitar la resolución es variar el parámetro de resolución.

Este método es adecuado para grafos para los cuales el valor de los enlaces explica la importancia de la similitud entre los vértices. Sus diseñadores querían ser asociados con el algoritmo de agrupación un algoritmo de visualización usando el mismo principio matemático. Este enfoque unificado hace posible evitar inconsistencias entre el resultado del proceso de agrupación y la representación gráfica de este resultado.

Naturalmente, Pajek también ofrece el algoritmo de visualización VOS. Funciona sobre el principio de la optimización de la función de calidad denominada mapeo VOS. Dada la proximidad de los dos métodos de detección, no es ciertamente impensable utilizar la asignación VOS para representar un grafo particionado de acuerdo con el método de Louvain.

Ir más lejos

Se puede encontrar una comparación de los dos métodos de detección en:
http://mrvar.fdv.uni-lj.si/pajek/community/LouvainVOS.htm

Los detalles sobre el uso de estos métodos con Pajek también se pueden encontrar en el sitio: parametrización, evaluación de la calidad de la partición, representación gráfica del resultado.

Desde la interfaz gráfica de Pajek, un acceso directo al software VOSviewer ofrece la posibilidad de obtener rápidamente una representación elegante de la partición.

A continuación se muestra un ejemplo de los datos de colaboración científica holandesa (Fuente: Web of Science 2006-2008):




Referencias


  1. V. Blondel, J.-L. Guillaume, R. Lambiotte, et E. Lefebvre, « Fast unfolding of communities in large networks », Journal of Statistical Mechanics, vol. 2008, no 10, sept. 2008.
  2. Hay muchos otros métodos para detectar comunidades. Para obtener una visión general de las: S. Fortunato, « Community detections in graphs », Physics and Society, vol. 2010, no 486, p. 75-174.
  3. S. Fortunato et M. Barthélemy, « Resolution limit in community detection », Proceedings of the National Academy of Sciences of the United States of America, vol. 104, no 1, p. 36-41, janv. 2007.
  4. V. Blondel, G. Krings, et I. Thomas, « Régions et frontières de téléphonie mobile en Belgique et dans l’aire métropolitaine bruxelloise », Brussels studies, no 42, oct. 2010.
  5. P. De Meo, E. Ferrara, G. Fiumara, et A. Provetti, « Generalized Louvain method for community detection in large networks », under review, 2011. URL: http://www.emilio.ferrara.name/wp-content/uploads/2011/07/isda2011-k-path.pdf}
  6. R. Rotta et A. Noack, « Multilevel local search algorithms for modularity clustering », Journal of Experimental Algorithmics, vol. 16, no 2.3, 2011.
  7. L. Waltman, N. J. van Eck, et E. C. M. Noyons, « A unified approach to mapping and clustering of bibliometric networks », Journal of Infometrics, vol. 4, no 4, p. 629-635, oct. 2010.