miércoles, 30 de agosto de 2017

Una exploración muy simple a las comunidades personales en Facebook

Visualizaciones de redes sociales personales en Facebook y estructura de la comunidad: un estudio exploratorio

Christina Gkini Alexios Brailas - SOC ARXIV



Estudiamos el patrón de estructura de la comunidad en las visualizaciones de diez redes sociales personales en Facebook en un solo punto en el tiempo. Parece ser una fuerte tendencia hacia la formación de la comunidad en las redes personales, sociales en línea: los amigos de alguien son generalmente también amigos entre ellos, formando subgrupos de nodos más densamente conectados. La investigación sobre la estructura de la comunidad en las redes sociales suele centrarse en las propiedades estadísticas de las redes. Existe la necesidad de estudios cualitativos que superen la brecha entre las topologías de la red y sus implicaciones sociológicas. En esta dirección, las representaciones visuales de las redes personales en los medios sociales podrían ser una valiosa fuente de datos empíricos para la interpretación cualitativa. La mayoría de las visualizaciones de las redes sociales personales en el presente estudio están muy agrupadas con subgrupos de amigos que se solapan densamente y se interconectan entre ellos a través de puentes anchos. Este patrón de topología de red parece ser bastante eficiente, permitiendo una rápida difusión y difusión de información a través de toda la red social.








miércoles, 23 de agosto de 2017

Dinámica y construcción de grupos de colaboración en Wikipedia

Minería del grafo de Wikipedia: La estructura dinámica de la memoria colectiva

De Volodymyr Miz


Este es el blog que acompaña a nuestro próximo trabajo de investigación (pronto en arXiv); Trabajo conjunto con Kirell Benzi, Benjamin Ricaud y Pierre Vandergheynst (EPFL, LTS2). Aquí, nos centramos en los resultados, omitiendo los detalles del algoritmo y la implementación.

Introducción

Wikipedia es una gran fuente de análisis de datos debido a su destacada escala y la estructura del grafo. Decenas de millones de visitantes lo navegan a diario, dejando su huella en la Web. La combinación de la estructura del grafo de Wikipedia y la actividad del visitante en las páginas nos da el grafo dinámico - el grafo con señales de la serie de tiempo en los nodos. La naturaleza dinámica del grafo hace que el problema de análisis a gran escala sea bastante complicado.

En el artículo original analizamos el grafo de Wikipedia. El objetivo es detectar eventos y recuerdos colectivos utilizando la actividad de los visitantes de Wikipedia. Utilizamos un enfoque basado en grafos para construir nuestro modelo. El modelo computacional se inspira en la plasticidad sináptica y en la teoría de Hebbian.

No es sorprendente que no pudiéramos incluir todos los resultados en el trabajo. Aparte de eso, PDF es un formato bastante pobre para comunicar los hallazgos de la investigación. El objetivo de este post es mostrar los resultados de manera interactiva. Al leer el artículo y esta publicación, le recomendamos que abra los grafos, que aparezcan en todas partes en esta publicación y que juegue con ellos: haga clic con el botón de zoom, haga clic, mueva, busque y seleccione. Esta es de lejos la forma más divertida de sumergirnos en los principales resultados de nuestro trabajo.

Los grafos son interactivos


  1. Haga clic en cualquier grafo de este post para abrirlo en una nueva ventana.
  2. Haga zoom, haga clic en los nodos, busque las páginas por nombre, resalte los grupos por color.
    • Al hacer clic en un nodo, se seleccionan todos los vecinos.
    • Cuando selecciona un clúster, selecciona todos los nodos de este clúster.
    • La lista de nodos seleccionados aparece a la derecha.

Funciona mejor en la última versión de Chrome. NO intente abrir los grafos en un smartphone. Los grafos son demasiado grandes y puede tardar una eternidad en renderizarlos.


Conjunto de datos

Los conjuntos de datos originales están disponibles públicamente en el sitio web de Wikimedia. Tomamos los volcados SQL de los artículos de Wikipedia en inglés para crear el grafo. La actividad visitante es el número de visitas por página por hora. Consideramos el período de 02:00, 23 de septiembre de 2014 hasta las 23:00, 30 de abril de 2015. Los detalles de pre-procesamiento se describen en nuestro artículo en la sección Dataset.

Dinámica de la red Wikipedia




7 meses de dinámica Wikipedia graph

En el trabajo se supone que la dinámica del grafo puede afectar su estructura. Aplicamos la regla de actualización, basada en la señal en los nodos, para observar este efecto. Aquí mostramos que el grafo de Wikipedia puede auto-organizarse en los conjuntos de comunidades significativas de los nodos, si tenemos en cuenta la dinámica de actividad de los visitantes de la gráfica. Haga clic en el grafo de la derecha y explore el resultado por sí mismo.

Este grafo es el resultado de la dinámica de 7 meses de actividad de los visitantes en Wikipedia. Aquí puede encontrar los principales eventos que se han llevado a cabo durante el período considerado. Los eventos estables o programados, como torneos, ceremonias de premios, concursos y festividades más populares forman grandes grupos. Los eventos inestables o inesperados, como incidentes y accidentes, se agrupan en pequeños grupos. A pesar de que, este grafo proporciona un buen resumen de los patrones dinámicos, sólo podemos ver el resultado final. Lo que es más importante, es obtener información sobre la dinámica del grafo en el tiempo. ¿Cómo emergen los agrupamientos, evolucionan y desaparecen? Para responder a esta pregunta, elegimos un evento en particular y observamos su dinámica en detalles.


Dinámica de un evento: campeonato de la NFL

Con el fin de comprender la dinámica de la evolución del grafo, elegimos uno de los eventos más populares, destacado en la Wikipedia en inglés - el campeonato de la NFL. Consideramos la temporada 2014-2015. La parcela está a la derecha (haga clic para ampliar). Para la interpretabilidad de la trama extraímos 30 equipos de la NFL de 485 páginas en el grupo original. La línea de tiempo muestra la actividad general del grupo durante el período de 7 meses. La línea de tiempo de la dinámica del grafo y la evolución del cluster NFL se ilustra en la fila superior. Refleja el interés de los fanáticos de la NFL en el campeonato. El grupo es pequeño y escaso al principio del campeonato y se vuelve más denso y más grande, acercándose a la fecha final del juego. El comportamiento de los visitantes de Wikipedia durante el día del juego final Super Bowl es excepcional. La actividad de los aficionados de la NFL es mucho mayor, en comparación con la actividad de otros usuarios de Wikipedia. Hace una analogía con la vida real, cuando durante las finales los fans se convierten en la gente más activa en las calles.



El campeonato de la NFL es sólo un ejemplo de un evento detectado y su evolución. Puede explorar los grafos de la actividad mensual y consultar otros clústeres de eventos detectados. El número total de eventos detectados es 172. Haga clic en los grafos siguientes para abrir una versión interactiva y explorar por sí mismo.

      Octubre       Noviembre      Diciembre         Enero               Febrero           Marzo           Abril

El clúster NFL es un buen ejemplo de un evento estable, representado como uno de los clusters más grandes en el grafo resultante. ¿Qué pasa con los eventos no programados, como ataques y otros accidentes?


Memoria colectiva

Los eventos traumáticos, como ataques terroristas, accidentes aéreos, guerras y conflictos, a menudo nos recuerdan el pasado. Estos recuerdos son a menudo comunes para un grupo de personas en una comunidad social. Esa es la razón por la que se llaman recuerdos colectivos. Nuestro enfoque permite detectar estos recuerdos y sirve como un modelo general para la emergencia de la memoria colectiva. Proporcionamos los ejemplos de 3 eventos, detectados entre los demás.

Ejemplos de memorias colectivas se presentan en la siguiente tabla. Para mostrar los detalles de las memorias colectivas detectadas, seleccionamos 3 eventos particulares entre los otros detectados: Ferguson disturbio (segunda ola - 24 de noviembre de 2014), Charlie Hebdo ataque (07 de enero 2015), vuelo de Germanwings 9525 accidente de avión (24 de marzo , 2015). La fila superior contiene los grupos extraídos de memorias colectivas para cada uno de los eventos discutidos. La fila inferior muestra la actividad detallada de cada página en los clústeres.

Disturbios en FergusonAtaque a Charlie Hebdo Caída del Germanwings 9525

Vemos que los eventos centrales desencadenan recuerdos relevantes. Los disturbios de Ferguson nos recuerdan otros disturbios, disparos de gente inocente, e incluso nos lleva de regreso a la esclavitud en los Estados Unidos. Charlie Hebdo tiroteo tiene vínculos con otros ataques terroristas, derramamiento de sangre, y las agencias de aplicación de la ley. El accidente de Germanwings está rodeado por el denso grupo de los otros accidentes aéreos, lo que indica que los accidentes de vuelo están completamente estructurados en Wikipedia.

Aunque, podemos ver un poco de ruido en los racimos. El ruido es relevante para los temas principales de los conglomerados y no afecta la formación del conglomerado. Normalmente, la fuente principal del ruido es un nodo, que es relevante para varios grupos de eventos. Por ejemplo, el grupo de disturbios de Ferguson contiene el grupo nodo anónimo. Este nodo enlaza otro gran grupo de empresas líderes en tecnología y comercio electrónico. En este caso, el primer aumento constante de la actividad es causado por la página de compras en línea, ya que el día más rentable para las tiendas en línea se detectó el 11/11/2014. Otro ejemplo del ruido está en el racimo de Germanwings. La causa principal del ruido es la página del día - 24 de marzo - que contiene la mayoría de los acontecimientos históricos notables.

A pesar de que el ruido es causado por páginas bastante populares, el algoritmo sigue siendo capaz de localizar los eventos más pequeños y crear clusters relevantes. Para detectar eventos más pequeños, como los presentados en los ejemplos, se utilizó una ventana de tiempo menor de una semana. Los pequeños eventos aún se pueden encontrar en los grafos dinámicos mensuales, presentados en la sección anterior de la tabla de línea de tiempo. Revise los grafos y busque los eventos de su interés.

Conclusiones

Wikipedia puede decirnos más de lo que está escrito en sus páginas. Es una gran fuente de datos para la investigación colectiva del comportamiento humano. Sin embargo, la naturaleza dinámica de los datos estructurados por grafos genera nuevos retos para la ciencia de los datos y el aprendizaje automático. En el artículo propusimos un nuevo método para la detección de patrones en grafos dinámicos a gran escala. Aplicamos el método a los conjuntos de datos de Wikipedia. Hemos logrado detectar patrones dinámicos en términos de eventos y recuerdos colectivos en Wikipedia usando la combinación del grafo de hipervínculos y la actividad de los visitantes en el sitio web. El siguiente paso es mejorar la parte de filtrado del algoritmo para disminuir la cantidad de ruido, descrita en la sección de memoria colectiva de este post.

Herramientas y código

Hacemos todos los experimentos utilizando Apache Spark GraphX. El código está escrito en Scala y disponible en GitHub. El pre-procesamiento de datos se puede hacer usando el código Python, disponible en otro repositorio de GitHub.

Expresiones de gratitud

Me gustaría dar las gracias a Michaël Defferrard por fructíferas discusiones y sugerencias útiles.

lunes, 21 de agosto de 2017

Visualización del financiamiento interdisciplinario en Suiza (con Gephi)

Visualización de red compleja de la historia de la interdisciplinariedad: Mapeo de la financiación de la investigación en Suiza

Martin Grandjean
       


Introducción

En Suiza, el panorama de la investigación científica se considera profundamente afectado por las barreras idiomáticas y las fuertes identidades académicas locales. ¿Es esta impresión confirmada por los datos de los proyectos de investigación? ¿Cuáles son los factores que mejor explican la estructura de las colaboraciones científicas en los últimos cuarenta años? ¿Las regiones lingüísticas o las lógicas académicas locales tienen realmente un impacto en el mapeo de las colaboraciones de investigación y en qué medida están incrustadas en las lógicas disciplinarias, históricas y generacionales?

Nos centramos en la gran base de datos de la Fundación Nacional de Ciencias de Suiza (FNS), la principal agencia de financiación de la investigación en Suiza, que enumera todos los 62.000 proyectos financiados entre 1975 y 2015. Aunque los estudios cientométricos generalmente se centran en la medición del desempeño laboral y financiero , Pretendemos crear conciencia sobre la búsqueda de un análisis sociohistórico de los círculos académicos suizos mediante el cruce de datos del FNS con una base de datos prosopográfica de todos los profesores universitarios suizos del siglo XX aportada por el Observatorio Suizo de Elite (OBELIS).

Análisis

Aquí, estamos interesados ​​en el periodo 2006-2015, diez años durante los cuales 25.000 proyectos que involucran a 45.000 personas producen un grafo de 2 modos con más de 63.000 aristas. Para centrarse en proyectos y disciplinas, la red se proyecta en un grafo de un solo modo de proyectos. Así, el grafo que se muestra a continuación contiene más de 15.000 proyectos que se financiaron entre 2006 y 2015. Los restantes 10.000 son proyectos aislados que no se muestran para evitar sobrecargar el grafo, pero se tienen en cuenta en el análisis de las relaciones entre disciplinas siguiente grafo).


15.000 proyectos financiados por el FNS entre 2006 y 2015. Dos proyectos están conectados si comparten uno o más investigadores comunes. 

El grafo es muy escaso en algunos lugares, particularmente en disciplinas donde los investigadores trabajan solos o en pequeños grupos (derecho, economía, humanidades). En las ciencias naturales o la medicina, los proyectos a menudo involucran laboratorios más grandes y, por lo tanto, crean clusters más densos. Para decir más sobre la interdisciplinariedad de estos campos, es obvio que es necesario desarrollar las categorías y calcular las medidas individuales, pero las disciplinas en las que se producen las colaboraciones ya son claramente visibles.

Mapeo de disciplinas

Reducido a las disciplinas (abajo), la macro-red es más legible y permitirá la comparación con el tiempo. El grafo de las disciplinas muestra que las tres divisiones principales de la agencia financiadora ya no encajan perfectamente con la realidad del siglo XXI: muchos sub-campos de la biología (división 3, con la medicina) y la química (división 2, matemáticas e ingeniería Ciencias) están más unidas que con los otros sub-campos de sus divisiones oficiales (ver los nodos rosados, afiliados a la división 3 pero muy cerca de la división 2). Comprender la evolución de esta situación es, por supuesto, uno de nuestros principales objetivos.


El mapa de las disciplinas, extraído del grafo anterior. Dos disciplinas están conectadas si sus proyectos involucran a investigadores entre sí.

Perspectivas

Con la información contenida en la lista de proyectos, vemos que es posible asignar a los individuos una categoría disciplinaria extraída de los proyectos que los involucran. Como sucede que un investigador está participando en proyectos etiquetados en diferentes disciplinas, este enfoque conducirá a una reflexión sobre la medición de la interdisciplinariedad dentro de un estudio comparativo entre una selección de disciplinas "abiertas" y "cerradas". Esto se compara entonces con la disciplina de su departamento, para mostrar la diferencia entre la afiliación oficial y la actividad científica real.
Todavía hay mucho que hacer, estamos trabajando en ello!

Póster

sábado, 19 de agosto de 2017

Modelando el sistema de transporte del DF como una red compleja

Simulación-Optimización de la Red de Transporte Público de la Ciudad de México: Un Análisis de Redes Complejas

Idalia Flores De La Mota y Aída Huerta-Barrientos


Resumen

La movilidad del transporte urbano es uno de los problemas más importantes para las ciudades, e implica muchos aspectos que conciernen a los ciudadanos, los gobiernos y el crecimiento económico de los países. La movilidad en la Ciudad de México también es un problema enorme ya que el tamaño de la ciudad lo hace insoluble y los ciudadanos prefieren usar el transporte privado en lugar de la red de transporte público porque ofrece una cobertura pobre y una falta de centros de transferencia modal. El objetivo de este capítulo es modelar y simular la red de transporte público desde la perspectiva de redes compleja de vulnerabilidad estructural y resistencia de la red, considerando aspectos de movilidad y accesibilidad. En primer lugar, analizamos la infraestructura de transporte urbano en la Ciudad de México teniendo en cuenta el proceso de planificación y los criterios de sostenibilidad. En segundo lugar, modelamos y simulamos la red de transporte público de la Ciudad de México como una red compleja. En tercer lugar, caracterizamos la topología de red compleja de la red de transporte público de la Ciudad de México y, finalmente, presentamos los principales resultados.






martes, 15 de agosto de 2017

GNP: Gephi, NodeXL y Pajek

Descripción de las herramientas de análisis de redes sociales GNP (Gephi, NodeXL, Pajek) 

Por M. Thangaraj, S. Amutha

Este documento explica las importantes herramientas útiles en el Análisis de Redes Sociales y describe acerca de las herramientas de extracción y comodidad para los usuarios de WWW. Explica detalladamente los detalles sobre las herramientas de ARS como Gephi, NodeXL y Pajek. Las herramientas de ARS como características, métricas, aplicaciones, arquitectura, formato de entrada / salida, y la motivación de las herramientas seleccionadas.




domingo, 13 de agosto de 2017

Asortatividad en algas y redes políticas

Lo que las algas pueden decirnos sobre estrategia política





En la estructura disasortativa (izquierda), ambos competidores pueden coexistir mientras que la estructura asortativa (derecha) conduce a un escenario de ganador-toma-todo. (Imagen: Libby et al, 2017, Scientific Reports)

Santa Fe Institute

Mientras que los organismos unicelulares normalmente sólo se meten en discusión política a través de insultos, resulta que modelar su comportamiento puede dar a los investigadores un mejor manejo de cómo los movimientos políticos sobreviven y se propagan.

En un nuevo artículo publicado en Nature Scientific Reports, los investigadores modelaron sistemas en los que las estrategias o las ideologías compiten por los miembros. Al variar la medida en que los miembros de un determinado sistema trabajaron ofensivamente o defensivamente, tratando de convertir a los individuos para que estén de su "lado" o tratando de mantener a personas similares, encontraron algunos principios generales que pueden comenzar a explicar cómo se desarrollan las diferentes estrategias.

"El ángulo original para esta investigación esto provenía de una inclinación política. En realidad era de las algas ", dijo el autor del estudio Eric Libby, un miembro de SFI Omidyar que estudia las comunidades de microbios unicelulares. Pero, señaló, "creo que el control político sobre esto es probablemente más intuitivo".

Inicialmente, Libby y el investigador de SFI Laurent Hébert-Dufresne estaban analizando cómo las algas evolucionan en diferentes ciclos de vida complejos, tales como qué nutrientes absorber. Después de un grupo de trabajo con sus colaboradores, vieron que podría ayudar a explicar la dinámica en una población donde dos grupos compiten por recursos - en este caso, los votantes.

En el modelo de simulación original desarrollado, que incluyó sólo dos grupos distintos, los individuos que exhiben una ideología podrían adoptar el otro si estuvieran en torno a suficientes personas con las creencias opuestas que buscan influenciarlas.

Con el tiempo, los investigadores descubrieron que cuando dos ideologías competitivas se alineaban con estrategias (predominantemente) ofensivas, muchas personas se convertirían de un lado al otro, y ambas partes persistirían. Mientras tanto, cuando ambas ideologías eran más defensivas, en lugar de conducir a un estancamiento, el grupo menos defensivo desapareció por completo, ya que una pequeña pérdida inicial se amplificaría en última instancia. Se encontró que una combinación de defensa y ofensiva de cincuenta y cinco era la mejor estrategia.

Pero cuando un tercero fue agregado a la mezcla, la estrategia ganadora era aquella que usaba un nivel de ofensa superior a un oponente pero inferior al otro. No había una sola mejor estrategia. "Si usted tiene varias estrategias en competencia, no parece ser una solución óptima", explicó Libby. "Realmente depende contra quién compites más".

Lea el trabajo:, "Strategic tradeoffs in competitor dynamics on adaptive networks," en Nature Scientific Reports (August 8, 2017)

jueves, 10 de agosto de 2017

Matemática: Una prueba gráfica del teorema de Ramsey

Una prueba visual simple de una idea poderosa

El teorema de Ramsey predice una sorprendente (y útil) consistencia en la organización de grafos. Aquí hay una simple prueba visual de cómo funciona.



Lucy Reading-Ikkanda / Quanta Magazine; Fuente: Jonathan Jedwab, Universidad Simon Fraser

Kevin Hartnett | Quanta Magazine


Un avance reciente en la geometría hace un uso intensivo del teorema de Ramsey, una idea importante en otra teoría del campo-gráfico. El teorema de Ramsey indica que en cualquier gráfico donde todos los puntos están conectados por líneas rojas o líneas azules, se garantiza que tiene un gran subconjunto del gráfico que es completamente uniforme, es decir, todo rojo o todo azul.

Equivalentemente, puedes ir por el otro lado: selecciona el tamaño que deseas que tu subconjunto uniforme sea. El teorema de Ramsey indica que en algún lugar hay un grafo en el que debe surgir un subconjunto de ese tamaño.

No es obvio por qué esto es cierto. ¿Por qué no puede haber un grafo en el que las líneas de diferentes colores queden completamente mezcladas entre sí?

Le hice esta pregunta a Jonathan Jedwab, matemático de la Universidad Simon Fraser en la Columbia Británica. Él respondió con este ejemplo, que proporciona una intuición gráfica de por qué el teorema es verdadero.

Tomemos un caso simple en el que usted está buscando un subconjunto de al menos tres líneas que son completamente uniformes. Un grafo hexagonal está garantizado para darle ese subconjunto. ¿Cómo?

Comience con seis puntos que representan a seis personas en una fiesta. Cualquier persona en la fiesta se conoce o no se conoce. Si se conocen, colorea la línea roja. Si no se conocen, colorea la línea entre ellos azul. Cada punto tendrá entonces cinco líneas que salen de él; Al menos tres de esas cinco líneas deben ser de color rojo o azul.

Una demostración del teorema de Ramsey significaría demostrar que no importa cómo se conecte a la gente, se garantiza que termina con un triángulo (un subconjunto uniforme con tres líneas) que es todo azul o todo rojo.



Pensemos en la Persona 1. Al menos tres de sus cinco líneas van a ser de color rojo o azul. Dado que, imagine que conoce a las personas en las posiciones 2, 4 y 5, y el color de las líneas de color rojo.



Ahora, piense en la Persona 2 y la Persona 5. Si se conocen, colorearemos el enlace en rojo y tendremos un triángulo de todo un color, que estamos tratando de evitar. Así que colorea ese enlace azul.



Luego piense en la relación entre la Persona 4 y la Persona 5. Una vez más, para evitar un triángulo rojo, tenemos que colorear ese enlace azul.



Por último, tenemos la relación entre la Persona 2 y la Persona 4. O bien se conocen o no lo hacen, haciendo que el enlace entre ellos sea rojo o azul. De cualquier manera, estamos obligados a crear un triángulo que es todo un color, y el teorema de Ramsey se confirma.



En los grafos más grandes - casos con un millón de personas, o miles de millones - el teorema de Ramsey garantiza que todos los puntos de un gran subconjunto del grafo estarán conectados con líneas del mismo color. Pero, ¿cuán vasto es "vasto"? Los matemáticos no están seguros. En particular, no conocen el tamaño mínimo que puede tener un grafo antes de que se garantice un subconjunto de un tamaño determinado (para todos los tamaños posibles). De esta manera, el teorema de Ramsey es como muchas herramientas que usamos todos los días - es útil, incluso si no entendemos todo acerca de cómo funciona.

martes, 8 de agosto de 2017

Bots sociales juegan rol crucial en difundir noticias falsas

Primera evidencia de que los robots sociales desempeñan un papel importante en la difusión de noticias falsas


Las cuentas automatizadas están siendo programadas para difundir noticias falsas, de acuerdo con el primer estudio sistemático de la forma en que se despliega la desinformación en línea

Por Emerging Technology de la arXiv

Las noticias falsas y la forma en que se extiende en las redes sociales está emergiendo como una de las grandes amenazas para la sociedad moderna. En los últimos tiempos, las noticias falsas se han utilizado para manipular los mercados de valores, hacer que la gente elija opciones de salud peligrosas, y manipular las elecciones, incluyendo las elecciones presidenciales del año pasado en los EE.UU.

Claramente, existe una necesidad urgente de una manera de limitar la difusión de noticias falsas. Y eso plantea una pregunta importante: ¿cómo se difunde la falsa noticia en primer lugar?

Hoy recibimos una respuesta de las clases gracias al trabajo de Chengcheng Shao y amigos en la Universidad de Indiana en Bloomington. Por primera vez, estos chicos han estudiado sistemáticamente cómo una falsa noticia se extiende en Twitter y proporcionan una ventana única en este mundo turbio. Su trabajo sugiere estrategias claras para controlar esta epidemia.



Red de difusión para el artículo titulado "Spirit cooking: Clinton campaign chairman practices bizarre occult ritual,", publicado por el sitio de conspiración Infowars.com cuatro días antes de las elecciones estadounidenses de 2016.

Se trata de la publicación de noticias falsas o engañosas. Tan generalizado se ha convertido en que un número de organizaciones independientes de verificación de hechos han surgido para establecer la veracidad de la información en línea. Estos incluyen snopes.com, politifact.com, y factcheck.org.

Estos sitios enumeran 122 Web site que rutinariamente publican noticias falsas. Estos falsos sitios de noticias incluyen infowars.com, breitbart.com, politicususa.com, y theonion.com. "No excluimos la sátira porque muchas fuentes de noticias falsas etiquetan su contenido como satírico, haciendo la distinción problemática", dicen Shao y coautores.

Shao y coautores supervisaron cerca de 400.000 reclamaciones hechas por estos sitios web y estudiaron la forma en que se propagan a través de Twitter. Lo hicieron recolectando unos 14 millones de publicaciones en Twitter que mencionaban estas afirmaciones.

Al mismo tiempo, el equipo supervisó unas 15.000 historias escritas por las organizaciones de verificación de hechos y más de un millón de publicaciones de Twitter que las mencionan.

Después, Shao y sus coautores miraron las cuentas de Twitter que difundieron esta noticia, recogiendo hasta 200 de los tweets más recientes de cada cuenta. De esta manera, el equipo podría estudiar el comportamiento de Twitter y averiguar si las cuentas eran más probablemente ejecutadas por seres humanos o por bots.

Habiendo hecho un juicio sobre la propiedad de cada cuenta, el equipo finalmente miró la forma en que los humanos y los bots difunden falsas noticias y noticias comprobadas.

Para hacer todo esto, el equipo desarrolló dos plataformas en línea. El primero, llamado Hoaxy, rastrea afirmaciones de falsas noticias, y el segundo, Bolometer, determina si un conteo de Twitter es más probable que sea ejecutado por un humano o un bot.

Los resultados de este trabajo hacen interesante la lectura. "Las cuentas que propagan activamente la desinformación son significativamente más propensas a ser bots", dicen Shao y coautores. "Los bots sociales juegan un papel clave en la difusión de noticias falsas".

Shad y co dicen que los bots juegan un papel particularmente significativo en la difusión de noticias falsas poco después de su publicación. Es más, estos robots están programados para dirigir sus tweets a usuarios influyentes. "Las cuentas automatizadas son particularmente activas en las primeras fases de propagación de las reclamaciones virales, y tienden a dirigirse a los usuarios influyentes", dicen Shao y coautores.

Es una estrategia inteligente. Es mucho más probable que la información se vuelva viral cuando pasa a través de nodos altamente conectados en una red social. Así que la orientación de estos usuarios influyentes es clave. Los seres humanos pueden ser fácilmente engañados por cuentas automatizadas y sin querer pueden sembrar la difusión de noticias falsas (algunos humanos lo hacen con acierto, por supuesto).

"Estos resultados sugieren que la contención de los bots sociales puede ser una estrategia eficaz para mitigar la propagación de la desinformación en línea", dicen Shao y coautores.

Esa es una conclusión interesante, pero la forma en que se puede hacer no está clara.

Una forma sería prohibir ciertos tipos de bots sociales. Pero esta es una ruta llena de dificultades. Hay muchos bots sociales que desempeñan un papel importante en la difusión de información legítima.

Y la legislación no supera las fronteras internacionales. Dada la forma en que las potencias extranjeras han manipulado la difusión de noticias falsas, es difícil ver cómo funcionaría.

Sin embargo, la difusión de noticias falsas es una fuente legítima e importante de preocupación pública. Comprender cómo se propaga es la primera etapa para abordarlo.

Ref: arxiv.org/abs/1707.07592: The Spread of Fake News by Social Bots´


jueves, 3 de agosto de 2017

Redes sociales prehistóricas balcánicas deducidas de composición química de metalurgia

Algoritmos identifican la dinámica de las redes sociales prehistóricas en los Balcanes

Eureka Alert



El análisis de modularidad revela tres módulos densamente conectados / comunidades que produjeron e intercambiaron cobre en los Balcanes entre c. 6200 aC y c. 3200 aC. También están significativamente correlacionados con la distribución de las culturas arqueológicas de la época, proporcionando a los arqueólogos el método revolucionario para modelar matemáticamente fenómenos arqueológicos.


En el primer estudio arqueológico de este tipo, dos investigadores han combinado los análisis químicos de docenas de artefactos de cobre más antiguos del mundo y el enfoque modular para identificar redes prehistóricas de cooperación durante el desarrollo temprano de la metalurgia europea. Este estudio les ha llevado un paso más: las comunidades que más cooperaron pertenecían a la misma cultura arqueológica, revelando así un nuevo método para una evaluación independiente del registro arqueológico.

La sistemática arqueológica, especialmente en la prehistoria, utiliza la acumulación de rasgos materiales o formas de vivienda similares en sitios arqueológicos para designar "culturas arqueológicas" distintivas; Sin embargo, lo que estas expresiones de similitud representan y en qué resolución siguen siendo un problema importante en el campo de la arqueología.

El estudio, publicado esta semana en el Journal of Complex Networks, adopta un enfoque alternativo midiendo la fuerza de los enlaces entre sitios arqueológicos y produce modelos pioneros de interacción y cooperación humanas que pueden evaluarse independientemente de la sistemática arqueológica establecida. Se centra en una base de datos arqueológica amplia de artefactos de cobre de los Balcanes, fechado a partir de c. 6200 aC a 3200 aC - los primeros 3000 años de uso conocido de minerales y metales de cobre en Europa.

La composición química de estos artefactos es la única información utilizada para el análisis de la modularidad, por lo tanto aislada de cualquier información arqueológica y espaciotemporal. Sin embargo, los resultados son arqueológicamente y spatiotemporalmente significativos para la evolución de la red de suministro de cobre más antigua del mundo.

La Dra. Jelena Gruji, físico de la Universidad de Vrije en Bruselas, explica la novedad de este método para la investigación arqueológica: "Aunque existen algunos enfoques que los arqueólogos usan para inferir modelos de circulación de metales en el pasado, y por lo tanto indican la prehistoria económica y Sociales, el análisis de modularidad ofrece por primera vez una opción para probar la significación de nuestros resultados, y por lo tanto un método que sea matemáticamente confiable y replicable ".

La Dra. Miljana Radivojevi,  autora principal e investigadora del Instituto McDonald de Investigaciones Arqueológicas de la Universidad de Cambridge, comentó: "Ser capaz de inferir grupos sociales con una fuerte importancia espacial y temporal en los datos arqueológicos utilizando esta propiedad de la red es un verdadero cambio de juego. Es un paso importante hacia la evaluación de los fenómenos tecnológicos, económicos y sociales en el pasado humano - en cualquier lugar ".

martes, 1 de agosto de 2017

Viralidad: Gangnam Style se parece a la peste negra

En qué se parecen Gangnam Style y la peste negra

Un estudio científico analizó la viralización del videoclip del surcoreano Psy en todo el mundo en cuestión de meses. Cómo se establecieron similitudes con la enfermedad que se propagó en el siglo XIV
Infobae



Un estudio comparó la viralidad del video con la enfermedad

En algún momento, no hace tanto, después de la irrupción de las redes sociales, surgieron los fenómenos virales. Videos de gatitos, memes de Chuck Norris, bloopers, errores inolvidables y un largo etcétera. No obstante, la viralidad explotó el 15 de julio de 2012 con el lanzamiento del videoclip de Gangnam Style, de Psy, un músico anónimo salvo para un nicho surcoreano.

El video traspasó cualquier frontera imaginada. Para el 21 de diciembre de 2012, ya se había convertido en el más visto en la historia de Youtube con mil millones de reproducciones en todo el mundo. "En 2012, el récord de Gangnam Style marcó la aparición de un nuevo tipo de meme online. Alcanzó un nivel sin precedentes de fama a pesar de su pequeña audiencia original", dijo Zsofia Kallus, líder del estudio que buscó comprender el fenómeno.

El equipo, procedente de la Universidad Eotvos de Budapest, Hungría, se propuso averiguar cómo se generó el boom imparable. Para ello, se valieron de distintas herramientas como Google Trends y el archivo de tweets geolocalizados. Así podrían conocer el momento de la recepción del video.

Los resultados, publicados en arXiv, son llamativos. Al contrario de lo esperado, Corea del Sur no desató el fenómeno. Sí manifestó su primer brote, pero la viralidad inició cuando llegó a Filipinas. De allí se esparció hacia el resto del mundo. "Eso es probablemente porque Filipinas está relativamente cerca de Corea del Sur, pero tiene vínculos más fuertes con el resto del mundo. Además, también tiene enlaces más fuertes con la lengua inglesa", explicó

Los investigadores no dudaron en comparar al efecto de contagio de Gangnam Style con la peste negra que, durante el siglo XIV, se propagó con una dinámica "con forma de ola". A partir de varios casos que confluían, de acuerdo a las redes comerciales, el virus se expandía en forma rápida y multidireccional, a razón de dos kilómetros por día.


El fenómeno viral se inició en Filipinas

Como la peste bubónica, Gangnam Style siguió un esquema de "cercanía sociodigital", en la que la distancia geográfica no funcionó como un factor clave, sino que se detectaron ciertas áreas de influencia que enlazaba a otras, y esas áreas a otras hasta ocupar todo el globo.

La velocidad de los comunicaciones permitieron una propagación incluso más rápida que la de la enfermedad. Mientras más lazos de influencia tenía un territorio, más posibilidades de crear un efecto amplificado. En cuestión de meses, Gangnam Style se entronizó como el fenómeno viral paradigmático.