jueves, 30 de julio de 2015

Análisis de texto de charlas de una conferencia

Perfiles de contenido en charlas de una conferencia usando análisis de redes de texto

Nodus Lab



Cualquier conferencia consiste en múltiples conversaciones. A veces es difícil hacer un seguimiento de todos los temas tratados como la mayoría de las conferencias sólo ofrecen una breve descripción de cada sesión separada. Además, la mayoría de las conversaciones se clasifican en hilos temáticos, pero rara vez es un intento de mostrar cómo las diferentes conversaciones se relacionan entre sí, ¿cuáles son los temas más destacados que unifican todos ellos, ¿cuáles son las diferencias entre ellos.

Análisis de redes texto puede ser muy útil para resolver estos problemas.
Ofrece una forma de mostrar las palabras clave más importantes de cada sesión a través de enfatizar los conc Central <pts y sus relaciones (por lo que no sólo las palabras clave más importantes, sino también la forma en que se relacionan entre sí - es decir, el contexto).
Además, también se puede utilizar para mostrar las relaciones entre las diferentes sesiones y charlas, lo que demuestra la forma en que se relacionan entre sí.

Hicimos un estudio de caso en la Conferencia duracional que tuvo lugar en Berlín en junio de 2015.


1. Identificando los principales temas de las conversaciones de las conferencias

Durante la conferencia les pedimos a los participantes que escriban las palabras clave relevantes para cada charla usando un betabook pizarra portátil de colaboración. Luego hicimos una captura de pantalla de cada resumen de conversación y ponemos en InfraNodus software de visualización de la red de texto para obtener una imagen general de cómo se conectan las conversaciones y cuáles fueron los principales clusters de actualidad percibidos por la audiencia.

Un proceso similar se podría hacer uso de los canales establecidos de Twitter con un hashtag para cada charla o conferencia - los Tweets también podrían ser importados en InfraNodus para visualizar la imagen más grande.

A los efectos del análisis de redes texto, las palabras (hashtags, palabras clave) presentados están representados como nodos y sus co-ocurrencias se representan como las conexiones entre ellos. Las palabras que tienden a co-ocurrir con más frecuencia en conjunto están organizados en grupos, las palabras clave que aparecen más a menudo se muestran más grande en el gráfico. Cuanto más central de los nodos están colocados, más integrada que están en relación con el resto de la red (ver más en técnicas de interpretación gráfica).
Como resultado, el texto visualización de la red de todos los discursos de la conferencia es la siguiente:

Sesiones de la conferencia de visualización de la red texto

Como se puede ver en la visualización anterior, según los participantes los principales temas tratados durante la conferencia tuvieron que ver con

- Pública
- mecanismos de exclusión / inclusión de poder
- Régimen

Estos fueron los temas que eran la más céntrica de la conferencia, lo que significaba que varias sesiones tratados con ellos)

- El dinero
- Máscara y la fama
- La saturación, el espacio, la reflexión
- Representación y memoria
- la política
- Exceso

Los anteriores son los temas que son más específicos para determinadas sesiones.

También es interesante observar que la estructura gráfica es significado muy interconectado que la mayoría de las conversaciones se relacionaban a través de los temas principales. Sin embargo, esta estructura gráfico también tiene grupos tópicos distintos, lo que significa que algunas conversaciones estaban tratando con diferentes problemas que el resto, con lo que la diversidad en la conferencia, lo que es más interdisciplinaria.



2. Encontrando que habla de conferencias están relacionados

Análisis de redes texto no sólo ayuda a descubrir los principales temas de los discursos de la conferencia. También se puede demostrar que las conversaciones están estrechamente relacionados entre sí.

La naturaleza del algoritmo de diseño gráfico que se alinea nodos que están estrechamente relacionadas o que están conectados a través de otros nodos cerca uno del otro. Por lo tanto, si sumamos las sesiones reales de conferencias en el gráfico anterior, podemos ver que eran de las sesiones fueron más estrechamente relacionados y - también - que temas esas sesiones se trataba de:


El análisis de redes de temas de la conferencia

Como se puede ver arriba, las dos sesiones sobre la "culpa" y "financiación pública" estaban estrechamente relacionados (principalmente porque suscitó pensamientos similares en la audiencia, probablemente porque uno ocurrió después de la otra,).

Además, las sesiones sobre "adivinanzas" y "régimen arte" se conectan a través de su interés común en los procesos de inclusión / exclusión en relación con el poder (a pesar de que tratan diferentes temas).

La sesión sobre "enigmas" también estaba conectado a la sesión sobre "oficina sin pantalla" a través de las nociones de memoria y la representación.

Las sesiones de "cinismo" y "blancura" se encuentran en la periferia de la gráfica lo que significa que propusieron algunos temas que eran únicas al discurso general de esa conferencia. Un hecho interesante es que esas dos conversaciones también están conectados a través de la noción de "exceso", lo que sugiere un punto potencialmente interesante de mayor discusión entre los dos altavoces.

La sesión sobre el "colonialismo" era bastante central para todo el discurso sobre todo porque se refirió a diferentes temas presentes en otras conversaciones.

La sesión sobre "conflicto" pertenece a su propio grupo y no está muy bien integrado en el resto del discurso de la conferencia.

Usted puede navegar a través de la gráfica interactiva de la conferencia utilizando el widget de abajo. Al hacer clic en nodos mostrará las partes de los discursos de la conferencia que mencionan esos conceptos. Al hacer clic en nodos "contexto" se mostrará la visualización gráfica de la charla real:









3. Colaboraciones sugeridos

Visualización de la red El texto también puede mostrar que los hablantes podrían beneficiarse de la colaboración.

La estrategia más obvia sería la de conectar las sesiones en función de su proximidad tópica y similitud. Las sesiones sobre "culpabilidad" y "financiación pública" parecen estar muy relacionados anteriormente. Tanto los ponentes y los participantes podrían encontrar interesante explorar esos dos temas juntos.

Una estrategia menos obvia sería identificar las conversaciones que tienen el mayor centralidad de intermediación - que conecta los diferentes grupos juntos. Por ejemplo, la charla sobre "enigmas" se relaciona con las charlas sobre "régimen arte" y en "la oficina sin pantalla", pero los dos no están relacionados directamente. Así que posiblemente la persona que entregó la charla sobre "enigmas" podría ser un enlace interesante para conectar "régimen arte" y "oficina sin pantalla" (estrategia de resistencia?).

Por último, una estrategia menos común, pero muy ingenioso es identificar las brechas estructurales en el gráfico - las áreas entre las agrupaciones que están escasamente conectados o no conectados en absoluto. Aquellos indican un alto potencial de nuevas ideas y descubrimientos (leer más en nuestro artículo sobre el uso de las brechas estructurales para generar ideas).
En el gráfico anterior es claramente el área entre la "blancura" y "cinismo". Esas dos sesiones solamente se conectan a través de la noción de exceso pero potencialmente podrían conectarse a través de muchos más conceptos - tales como la profesionalidad, el cinismo, el contexto del arte, galerías, etc.
Otra la sesión sobre "conflicto" no está muy bien integrado con el resto de las sesiones de la conferencia, lo que significa que hay un encuentro potencialmente interesante con cada uno de ellos.

miércoles, 29 de julio de 2015

Hive Plot: Una interesante propuesta para visualizar redes complejas



Publicado en Briefings in Bionformatics
Krzywinski M, Birol I, Jones S, Marra M (2011). Hive Plots — Rational Approach to Visualizing Networks. Briefings in Bioinformatics (early access 9 December 2011, doi: 10.1093/bib/bbr069). (download citation)

Hive Plots - Para los impacientes
La trama de la colmena es un método de visualización racional para la elaboración de redes. Los nodos se asignan a y colocados en los ejes lineales distribuidas radialmente - esta asignación se basa en las propiedades estructurales de la red. Los bordes se dibujan como enlaces curvas. Sencillo e interpretable.

El propósito del Hive Plot es establecer una nueva línea de base para la visualización de grandes redes - un método que es a la vez general y sintonizable y útil como punto de partida para explorar visualmente la estructura de red.


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Hive Plots dan al lector la oportunidad de pasar a entender cuantitativamente los aspectos importantes de la estructura de una red. A diferencia Hairballs (visualizaciones de red: cómo domar la complejidad Paweł Widera describe puede layout opciones), las parcelas de la colmena son excelentes en el manejo de la complejidad visual resultante de gran número de bordes y la exposición de ambas tendencias y patrones atípicos en la estructura de la red.


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Varias Hive Plots se presentan juntos en un Hive Panels.

Software

Varias implementaciones de Hive Plots están disponibles. Una buena manera de empezar es con nuestra aplicación Java jhive.

jhive - aplicación Java Hive Plot



Hive Plots - Una introducción más larga

Visualizaciones de red son notoriamente difíciles de interpretar. Su representación canónica en una forma visual se ha ganado el apodo de bolas de pelo, y probablemente puede adivinar por qué. Si no está familiarizado con la bola de pelo, o dudar de su prevalencia en sicences biológicos, explorar lo que siempre es una buena fuente de las bolas de pelo de la red: estudio de la levadura y la biología de sistemas.


Bolas de pelo de red en el pasado, presente y futuro. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Usted ya puede adivinar que nada con el nombre bola de pelo puede ser realmente útil. En general, no lo son. Estos puntos de vista son, en el mejor accidentalmente informativo, y no se puede confiar en revelar constantemente patrones significativos.

Interpretación de las bolas de pelo se hace difícil por varias deficiencias significativas

  • su forma es determinada por algoritmos de diseño, que normalmente no se pueden ajustar para abordar cuestiones específicas de un usuario.
  • muchos algoritmos de diseño son estocásticos y pueden producir muchos diseños diferentes de la misma red
  • diseños de la misma red creado por diferentes algoritmos no se pueden comparar fácilmente
  • el diseño es frágil - puede ser desproporcionadamente afectada por cambios muy pequeños en una red
  • diseños de diferentes redes creadas por el mismo algoritmo no se pueden comparar fácilmente


Una visualización de la red convencional - una bola de pelo - a alguien que deje. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Para visualizar de forma racional las redes, introducimos la trama colmena. La trama de la colmena se basa en las propiedades de red significativas, que se pueden seleccionar para hacer frente a una pregunta específica.

Los nodos están asignados a uno de tres (o más) ejes, que pueden dividirse en segmentos. Los nodos se ordenan en un segmento basado en propiedades tales como la conectividad, la densidad, centralidad o anotación cuantitativa (por ejemplo, la expresión de genes). El usuario es libre de elegir lo que se ajuste a sus normas de datos y requisitos de visualización. Los bordes se dibujan como curvas Bezier, que pueden ser anotados con el color, grosor o etiqueta para comunicar información adicional.

Hive Plots permiten evaluar la estructura de la red, ya que se basan en las propiedades de red, no en el diseño estético. Las visualizaciones de dos redes son directamente comparables. Es importante destacar que las parcelas de la colmena son uniformes perceptualmente - diferencias en las parcelas de la colmena son proporcionales a las diferencias en las redes subyacentes. Esto hace que sea posible el uso de parcelas de la colmena para evaluar la similitud de red.


Una visualización de la red convencional - una bola de pelo - a alguien que deje. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski] Una visualización red convencional - una bola de pelo - alguien hacer que se detenga. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Cualquier red se puede representar como un complot de la colmena (por ejemplo, la regulación de genes, la interacción proteína-proteína, el tráfico de Internet, el espacio de usuario en una red social, etc). Cuando los segmentos de eje se interpretan como secuencia, la trama se puede mostrar de tres vías alineación y conservación (por ejemplo, la Figura 3 en Fusobacterium infección nucleatum es frecuente en el carcinoma colorrectal humano).

Si las conexiones se dibujan como cintas, la trama de la colmena puede demostrar relaciones entre los elementos de cantidades normalizadas (por ejemplo, la comparación de tamaños de las categorías de anotación en diferentes genomas).

EL PROBLEMA

Visualización de la red convencional no es adecuado para el análisis visual de las grandes redes. Los llamados bolas de pelo ganan su apodo al convertirse impenetrable complejo como su red crece. Son menos eficaces cuando la visualización es más necesario - para redes grandes.


Visualizaciones de red convencionales - Hairballs - no escalan bien. Se convierten
impresentables para redes grandes. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski] PARA COMPRENDER REDES VISUALES, NECESITAMOS PARA VER SU ESTRUCTURA DIRECTAMENTE, NO POR PODER DE UN ALGORITMO DISEÑO BASADO EN ESTÉTICA.

Las bolas de pelo convierten datos complejos en las visualizaciones que son tan complejos, o incluso más. Las bolas de pelo incluso nos pueden seducir a creer que tienen un alto valor de la información. Pero, simplemente porque se ven compleja no significa que se puedan comunicar información compleja. Bolas de pelo son la comida chatarra de visualización de la red - que tienen muy poco valor nutricional, dejando al usuario con hambre.

En una bola de pelo, los datos está subordinado a disposición - posiciones y longitudes de nodo de borde y dependen tanto de la algoritmo de diseño (de los cuales hay muchos), como en los datos. El efecto de las reglas de diseño es difícil de predecir, por lo que las comparaciones directas de estas visualizaciones imposible. Por ejemplo, imagine tratar de comparar dos gráficos de dispersión en el que se altera la ordinalidad de las escalas (por ejemplo, x = 1, 2, 3, ... en una y x = 3, 1, 2, ... en el otro) .

Como resultado, una gran cantidad de detalles sobre la estructura de una red se pierde irremediablemente en una bola de pelo y cualquier patrones emergentes puede ser ya sea real (que se refleja en los datos) o accidental (artefacto de la disposición). Si usted duda de que tales objetos pueden aparecer en la literatura, considere la siguiente figura de Rual JF, Venkatesan K, Hao T, et al. Hacia un mapa proteoma escala de la red de interacción proteína-proteína humana. Naturaleza 2005; 437 (7062): 1173-8. Como se indica en la leyenda de la figura, todas las características notables de la visualización de la red son los artefactos del algoritmo de diseño.


Figura 2b de Rual JF, Venkatesan K, Hao T, et al. Hacia un mapa proteoma escala de la red de interacción proteína-proteína humana. Naturaleza 2005; 437 (7062): 1173-8. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

El inconveniente central de visualización basada en bola de pelo es que no se pueden sintonizar para abordar cuestiones específicas de un usuario. Implícito en el enfoque bola de pelo es la suposición de que todas las preguntas que el usuario desea responder son direccionables por el algoritmo de diseño. Cuando esta suposición es errónea (ya que normalmente es), el usuario se deja de construir otra bola de pelo, basado en otro algoritmo de diseño, para tratar de responder a las preguntas sin respuesta. Por desgracia, es muy difícil determinar el conjunto de preguntas y respuestas relacionadas por una bola de pelo - no existe tal lista debido a la compleja interacción de los datos y el diseño.

¿Qué se puede decir de la bola de pelo de abajo? (Por ejemplo graphminator, 18 de marzo 2010). Les puedo decir esto: las bolas de pelo nos han defraudado.



Una visualización de la red convencional - una bola de pelo. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Vamos a mantener la técnica, pero mejorar la visualización cuantitativa

No estoy tratando de persuadirlo a desprenderse de las bolas de pelo siempre. Algunas visualizaciones de red bola de pelo son increíblemente hermoso y el campo de la infografía no serían lo mismo sin ellos.


El arte de la red Hermosa es ... hermoso. Vamos a mantenerlo. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

y.layout.router Clase OrganicEdgeRouter / Grande Graph Layout (LGL) / Hoy por Cada / Mapping the Disseaseome Humano (Bloch / Corum NYT 2009)

La preparación de la clase de las visualizaciones que se muestran arriba es un esfuerzo de la mano de obra y el amor. Diseños específicos trabajan para una red, pero no son eficaces en general. Hay excepciones, sin embargo. Algunas familias de la red son ideales para un algoritmo de diseño (egylayout.router en primer panel superior).

Antes de describir el método parcela colmena en detalle, para asegurarle que me encanta el arte de la red me he tomado las bolas de pelo de una variedad de comunidades en red y ha generado un "perfil de salpicaduras".

¿Informativo? Algo. ¿Jugoso? Absolutamente.


La visualización de una variedad de redes de diferentes comunidades.

UNA SOLUCIÓN - HIVE PLOT

El intento de complot colmena para hacer frente a las deficiencias del diseño de bola de pelo convencional. Debido a que las parcelas de la colmena se pueden sintonizar, pueden identificar los componentes estructurales significativos de una red.

Hive Plots SON IDEALES PARA LA DETECCIÓN DE PATRONES EMERGENTES EN SU ESTRUCTURA DE LA RED - EL MÉTODO QUE MUESTRA LA RED COMPLETA E INSTALACIONES DE CONCORDANCIA DE PATRÓN DE SU CEREBRO haga el resto.

La trama de la colmena está en sí fundada en un algoritmo de diseño. Sin embargo, su salida no se basa en la estética, pero la estructura de red. En este sentido, el diseño es racional - que depende de las características de la red que le interesan (por ejemplo, la conectividad).

En una parcela de la colmena, los nodos están limitados a los ejes lineales y los bordes se dibujan como curvas. Asignación de nodos a eje y la posición de nodos en el eje están determinados únicamente por la estructura de la red, nodo, anotación de borde, o cualesquiera otras propiedades significativas de la red. En otras palabras, las reglas de diseño se definen por usted, basado en las propiedades que sean significativas para ti. Estas normas forman un mapeo entre la estructura y el diseño puede ser tan simple o complejo como usted desea.


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Es importante destacar que no hay salsa de magia estético añadido a la disposición. Si el diseño muestra un patrón, usted puede estar seguro de que es debido a la estructura de los datos subyacentes y no en la interpretación que el algoritmo de diseño de cómo se deben mostrar los datos.

El mapeo eje y el nodo es arbitraria, y esto puede sonar muy abstracto en este punto. Para hacer las cosas concretas, hay ciertas recetas simples que son de gran utilidad en la mayoría de los casos (ver Krzywinski et al.).

Asignación al eje (A, en la figura de abajo), la posición (B) y color (C) puede ser una función del estado del fregadero / fuente (para redes tripartitas, esta categorización eje es natural), el grado de nodo, el grado vecino, la centralización, la densidad , la heterogeneidad, superposición topológica (hay numerosas propiedades para elegir), o anotación nodo / EDGE (por ejemplo, un nodo podría ser asociado con una clasificación, o un borde pueden tener un peso).


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Interpretación de la visualización lineal es fácil (una vez que el cuelgue de ella). Comparación visual directa de las parcelas de la colmena es posible - una característica valiosa y distintiva de las parcelas de la colmena. Por ejemplo, considere las siguientes ocho bolas de pelo - son diseños de la misma red. No es posible decir que este es de hecho la misma red.


Diferentes algoritmos de diseño de red producen visualizaciones diferentes, e incomparables,. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Si esto le causa ninguna preocupación, considere que una simple rotación y / o voltear la misma bola de pelo puede aparecer indistinguible de cambiar los datos subyacentes.


Simplemente girando y / o lanzar una bola de pelo puede producir un resultado que parece diferente. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Comunicando las reglas de Hive Plots a tu audiencia

Considere la posibilidad de una bola de pelo típico. Ahora piensa en cómo te describes a alguien que el método utilizado para crearlo. Es probable que, aunque usted no sabe los detalles completos del algoritmo de diseño. E incluso si lo hiciera, podría no necesariamente relacionarse how específico estructuras de red se traduciría en la salida.

Incluso si lo hizo describir cómo se creó la bola de pelo (lo que probablemente nombre al algoritmo de diseño), sería muy probable que la descripción no contendría todas las frases que se relacionan con la estructura de la red (que es, después de todo, lo que su público está muy interesado en).

Por otra parte, es fácil de describir cómo se creó una parcela colmena, y del mismo modo fácil para su audiencia a entender, porque se puede utilizar términos relevantes a las preguntas que su visualización está diseñado para hacer frente. En lugar de decir "he usado un método de fuerza dirigida para colocar los nodos.", Lo que no ayuda a su público se relacionan con la estructura de la red, puede decir: "Yo pongo todos los nodos del fregadero en este eje y les pedí por la conectividad absoluta. ", que es inmediatamente significativa.


Hive Plots para redes no dirigidas

Hive Plots funcionan igualmente bien en ambas redes dirigidos y no dirigidos. En las redes no dirigidas, bordes no tienen una dirección y por lo tanto no hay ninguna distinción entre los sumideros (nodos con bordes en) y fuentes (nodos con bordes fuera). En el siguiente ejemplo, el grado de nodo (número de aristas) se utiliza para asignar a los nodos de ejes.


Aplicación de la disposición lineal para visualización de la red a una red no dirigida (gráfico). [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Ejemplo

Un reciente documento PNAS [1], Yan et al. en comparación red de regulación del gen E. coli con el de la función llama en el kernel de Linux. Como se puede ver, las bolas de pelo de estas redes no muestran información estructural. Otros que la red de Linux es más grande, las bolas de pelo no ofrecen ninguna otra información. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]


[1] Yan KK, Fang G, N Bhardwaj, Alejandro RP, Gerstein M. 2010. La comparación de los genomas de los sistemas operativos de los ordenadores en términos de la topología y la evolución de sus redes de control reglamentario. Proc Natl Acad Sci USA S A 107 (20): 9.186-9.191.

Visualización original

Yan et al. mostró las redes con una disposición lineal paralelo, se muestra a continuación.


Yan KK, Fang G, N Bhardwaj, Alejandro RP, Gerstein M. 2010. La comparación de los genomas de los sistemas operativos de los ordenadores en términos de la topología y la evolución de sus redes de control reglamentario. Proc Natl Acad Sci USA S A 107 (20): 9.186-9.191.

Los nodos en los ejes no se les ordenó. Los enlaces de red entre la capa superior e inferior se cruzan el eje capa media y complican la vista. Por ejemplo, no es inmediatamente evidente que casi no hay comunicación en las dos primeras capas de la red E. coli.

Hive Plots

Los diseños lineales demuestran claramente las diferencias entre estas redes. Para obtener más información acerca de los diseños lineales de estas dos redes, consulte las diapositivas en la introducción general.


Red llamada de función kernel Linux visualiza con la disposición lineal. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

APLICACIONES

HIVE PANELS

Las redes son estructuras de datos complejas y es raro que puedan presentarse efectivamente como una sola imagen. El concepto de parcela colmena se puede extender a los Hive Panels -

Hive panel - Una matriz de Hive Plots que se comunican independientemente diferentes propiedades estructurales de una red 
firmas visuales de una red, cada uno basado en una combinación diferente de propiedades estructurales para interrogar diferentes aspectos de estructura de la red.

Hairballs no se pueden utilizar para este propósito porque no son sensibles a los patrones en atributos estructurales, no se pueden comparar directamente, y la escala de mal.


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

En la figura anterior, las interacciones fundamentales de la configuración humana humano a partir de la base de datos de interacción de proteínas (DIP) se representan como un Hive Panel utilizando las siguientes propiedades: nodo coeficiente de agrupamiento (cc), al lado del vecino coeficiente de clustering (CCNN), conectividad nodo (deg), número de próximos-vecinos (nn), y Page Rank (PR). Para demostrar cómo el panel puede centrar la atención, se destacan vínculos con el nodo más conectado.

Una sola parcela colmena (grados vs cc) de los Hive Panels de cuatro organismos y una red aleatoria se muestran debajo del panel humana de demostrar diferencias en la conectividad y el coeficiente de agrupamiento. Se muestran también los diseños orgánicos de la configuración regional del nodo más conectado formado por sus vecinos y próximos-vecinos más cercanos, la región de la red destaca en las parcelas de la colmena. Aunque no es posible concluir con seguridad nada de los diseños orgánicos, las parcelas de la colmena se comunican claramente diferencias de una manera cuantitativa. Por ejemplo, el nodo más conectado en el conjunto humano (A) es más cliquey (grande cc) de E. coli (C) y levadura (D) y está conectado a los nodos que por sí mismos son uniformemente cliquey (B). Estos y otros patrones se pueden identificar rápidamente dentro del panel.

COMPARACIÓN de REDES MULTI-EJES

Hive Plots se pueden utilizar para comparar múltiples redes. En esta aplicación, los nodos de cada red se asignan a diferentes ejes y enlaces conectan los nodos que son compartidos entre las redes (o el uso de algunos otros criterios de similitud nodo).


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Comparando cuatro redes requiere 6 ejes, si el área de trazado se va a utilizar plenamente.

RED DE CAPAS

Considere una red que contiene múltiples e independientes capas de conexiones. ¿Cómo las capas de conectividad se relacionan?


La aplicación de la visualización de la red diseño lineal para redes en capas. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

Mediante la creación de una parcela colmena en la que el eje de mapeo / posición se realiza mediante una capa, con bordes de otra capa dibujada, la correlación se puede evaluar visualmente.

Aplicación de Hive Panels (visualización lineal red layout) a las redes en capas. [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski]

¿SÓLO PARA REDES?

No.

Hive Plots para alineaciones

Hive Plots se pueden aplicar a otras estructuras de datos de redes. El método requiere que sus datos serán mapeables en un conjunto de relaciones de pares. Para las redes, esta relación de pares es el borde entre dos nodos. En otras circunstancias, se puede relacionar dos posiciones espaciales (donde el eje corresponde a un objeto con una escala de longitud física) o dos intervalos (dos segmentos de eje están relacionados, creando de este modo una comparación ratio).

Por ejemplo, el genoma alineaciones de tres vías se muestran lúcidamente con parcelas de la colmena como en la figura siguiente, adaptado de la Figura 3 en Castellarin et al. Infección nucleatum Fusobacterium es frecuente en el carcinoma colorrectal humano Genome Research (2011).



Circos es un metod común para mostrar las diferencias del genoma, sintenia y alineaciones. Por ejemplo, a continuación se muestran tres comparaciones del genoma ancestral de Arabidopsis thaliana con cada uno de tres genomas modernos del plan (SN, SL y BA) (Figura 3 de Mandakova T, Joly S, M Krzywinski, Mummenhoff K, MA (Lysak . 2010) diploidization rápido en parientes cercanos mesopolyploid de Arabidopsis la célula vegetal. 22: 2277-2290).



Hive Plots hacen una excelente herramienta para demostrar de tres vías alineaciones. A continuación se muestra un gráfico de la colmena de las tres alineaciones muestran arriba. En esta representación, cargos en los genomas modernos que se alinean con el mismo segmento de genoma ancestral están conectados.



Hive Plots para visualizar RATIOS - EVALUACIÓN DE LA CALIDAD DE MONTAJE

Una variación de la trama de la colmena es una forma circular compuesta apilados barra de trama, como se muestra a continuación. En este ejemplo (contrataciones, PDF), cada uno de los tres ejes soportan dos parcelas de barras (en ambos lados). Cintas conectan dos intervalos de la misma categoría. Para otro ejemplo, consulte nuestro cartel VIZBI 2011.


 [Hive Plots - Visualización Red Racional - Un simple, informativo y Pretty lineal diseño de red Analytics - Martin Krzywinski] - Evaluación de la calidad del conjunto del genoma con una parcela colmena, que compara lee, de reunión y de referencia.

Esta parcela colmena proporciona una receta visual para evaluar la calidad de un conjunto genómico. Un conjunto se compone de lecturas (eje inferior), que están ensamblados en contigs (eje derecho). Independientemente, puede existir un conjunto de referencia (eje izquierdo) y actuar como un comparador. Entre otros, esta parcela colmena responde a las siguientes preguntas:

  • ¿qué fracción de lecturas son sin montar? 20%
  • ¿qué fracción de lecturas son alineados para hacer referencia? 30%
  • qué fracción de referencia no tiene cobertura de lectura? 2%
  • qué fracción de referencia no tiene cobertura en alquiler? 15%
  • qué fracción de referencia se construye por contigs <200kb? 60%
  • hay contigs> 200kb? no.
  • qué fracción de contigs están alineados a la referencia? 20%
  • qué fracción de la asamblea general se deriva de k = 27 asamblea? 80%

El beneficio de este diseño de la barra trama apilados es que la disposición circular es a la vez periódica y tiene peso visual. Este enfoque es similar a un paralelo coordinar trama, excepto que aquí la trama envuelve.

Hive Plots para visualización de ratios




Hive Plot

martes, 28 de julio de 2015

Mapeando una comunidad política con NodeXL

Cómo usar los mapas de red para entender una muchedumbre

 POR: Asher Novek - Civic Hall


"Cuando las multitudes llenan un espacio público que puede cambiar la historia", observa Marc Smith, director de la Fundación de Investigación de Medios de Comunicación Social, al Personal Democracy Forum de este año. "Y sin embargo, ¿dónde están las fotos de la multitud cibernética?"

Nos preocupamos por nuestras redes-sociales que nos sigue, que estamos siguiendo, ¿cuántos gustos estoy recibiendo, ¿cuántos retweets tenía que llegar, pero ¿estamos haciendo las preguntas correctas?

El proyecto NodeXL de la Fundación de Investigación de Medios de Comunicación Social muestra mapas de conexiones en Twitter de una manera única. Al tomar un tema o una frase y de definición de las conexiones en un enfoque de red, podemos ver algo más que quien está hablando con quién; podemos ver las comunidades que se están formando en torno a cuestiones particulares. Cuando damos un paso atrás y no vemos simplemente que la comunidad es, pero cómo se formaron y qué forma toma, podemos empezar a hacer preguntas más profundas: ¿Estoy llegando a quién quiero llegar? ¿Cómo puedo llegar a ese grupo de gente de allí? ¿Quiero llegar a ese grupo de personas aisladas? El foco se vuelve menos acerca de los números y más acerca de la calidad de las conexiones que se hizo.

En el contexto de la marca o la comercialización, hay un valor obvio para esto: ¿Estoy creciendo mi marca en el sentido de que necesita? ¿Estoy haciendo mi marca para las comunidades correctas, y que los líderes de línea Qué necesito para participar con el fin de hacerlo? Sin embargo, en el contexto de un movimiento social, el valor es sin duda más crucial. Los movimientos sociales viven y respiran en línea, pero que analiza el movimiento? Sin la visión amplia de cómo se forma un movimiento, se deja crecer o vacilar pasivamente por su cuenta.

NodeXL proporciona una herramienta para organizadores y activistas para ver un movimiento, ver que participó, y luego ver qué tipo de comunidad se ha formado. Una vez que sepas qué tipo de comunidad que tiene, se puede ver en la forma de ampliar, darle forma, crecer, mientras que las tendencias de mapeo de la comunidad a través del tiempo. La acción colectiva es difícil de cultivar y mantener; NodeXL ofrece un espacio para apoyar la acción haciendo preguntas como: ¿Quiénes son nuestros principales centros? ¿Qué comunidades están hablando de nuestros problemas, pero no conectados con el movimiento? ¿Cómo podemos llegar? ¿Tenemos una comunidad activa o simplemente una audiencia pasiva?

Al contestar estas preguntas, podemos agilizar los procesos de participación y se centran en el movimiento, no sólo los números.

He aquí un ejemplo de un mapa de la red NodeXL, la comparación de la comunidad en torno a "civictech" en mayo a la comunidad en junio. "A medida que las personas responden y mencionan entre sí, forman enlaces o vínculos que se forman comunidades", explicó Smith. "La red de tecnología cívica es predominantemente un patrón 'hub-and-spoke", con un cubo que se repite (o retweeted) por muchos otros. Un gran volumen de personas completamente desconectados son una parte importante de la población. Estos 'aislados' faltan en su mayoría de estas redes, pero todavía contribuyen a la conversación. Algunas áreas de las redes son 'densa', que representa a una comunidad de personas conectadas, sin centro 'hub', y muchos líderes de tema. "


Civictech, mayo 2015

Civictech, junio 2015

En general, mayo vemos muchos cúmulos hub-and-spoke, tales como los grupos en G2, G5, G6 y. Esto significa un público de gente twitteando y retweeting de los grupos centrales de los organismos de radiodifusión, o alcaldes. Pero cuando nos fijamos en junio, los grupos se hacen más densos. Esto significa el público que conectan entre sí, en lugar de a través de los alcaldes centrales, la construcción de una comunidad más dinámica. También podemos ver las líneas verdes claras (que muestran una conexión directa) en mayo, y en junio vemos una más extendidas serie de líneas, lo que demuestra que se formaron más conexiones a través de las comunidades.

Este cambio se puede atribuir a la Personal Democracy Forum que se celebra, y es un buen ejemplo de lo que es un gran evento, centralizado puede hacer por una comunidad dispersa, en términos de la construcción de relaciones. Usando NodeXL, pudimos ver que se convirtió en más conectado con la comunidad debido a la conferencia, rastrear cualquier persona que pasó de un aislado a una parte de la comunidad y viceversa. También podemos ver que las nuevas cepas entraron en la conversación, y con el tiempo con gráficos comparativos más, pudimos ver su crecimiento en la comunidad también. Esto nos da la capacidad de saber que para comunicarse con, y que "los alcaldes" atraer a más miembros de la comunidad.

Tener seguidores y retweets es importante, pero es sólo el paso de nivel de la superficie. Los números sólo consiguen que hasta el momento, con el fin de entender cómo, por qué y dónde necesita para crecer requiere una perspectiva de red. NodeXL, y el trabajo de Marc y el resto de la SMRF están haciendo, proporciona la herramienta para obtener y analizar esa red.

lunes, 27 de julio de 2015

ARS 101: Para qué sirve el análisis de redes

Todo lo que usted debería saber sobre redes

Anxo Sánchez - Investigación y ciencia

El concepto de "red" (o, más matemáticamente, "grafo") se ha convertido en los últimos 15 años en imprescindible para entender todo tipo de problemas, desde la estructura de las relaciones sociales a la estabilidad de los ecosistemas. De hecho, las llamadas "redes complejas" son un ingrediente esencial de las matemáticas de la complejidad, de las que me vengo ocupando en este blog. Un grupo de investigadores del campo, que lleva tiempo trabajando en la divulgación de estos conceptos, acaba de producir un interesante documento titulado Network Literacy: Essential Concepts and Core Ideas (Conocimiento sobre Redes: Conceptos Esenciales e Ideas Fundamentales). En esta entrada repaso algunas de esas ideas así como la importancia de tener un conocimiento básico de esta materia.


El grupo al que me refiero se autodenomina NetSciEd, de Network Science in Education, y se describe como una iniciativa internacional cuya meta central es elevar el nivel de conocimiento sobre redes para todo el mundo introduciendo la ciencia de redes en la enseñanza y el aprendizaje. El primer párrafo del documento que citaba antes resume la importancia de las redes y la correspondiente necesidad de conocerlas (la traducción es mía):

En un momento en el que nuestro mundo está cada vez más conectado a través de redes que permiten la comunicación instantánea y la difusión de información, el grado de entendimiento que la gente tenga sobre cómo funcionan estas redes desempeñará un papel fundamental en la realización de los beneficios que nuestra sociedad pueda obtener de una tal conectividad aumentada. En breve, una sociedad en red requiere familiaridad con las redes: un conocimiento básico sobre cómo pueden usarse como herramienta para facilitar descubrimientos y toma de decisiones, y sus potenciales beneficios y problemas, accesible para todo el mundo conectado de hoy. Más aún, dado que incluso los jóvenes interaccionan con redes continuamente, es importante que esta familiarización comience a edades tempranas, y dado que las redes están presentes en todos los aspectos de la vida contemporánea, la consideración de las redes debería reflejarse en la enseñanza de una manera interdisciplinar. Sin embargo, pese a la importancia y la ubicuidad de las redes, su estudio está prácticamente ausente  del sistema educativo actual.




El documento comienza presentando distintos aspectos donde podemos encontrarnos con las redes, que van desde sistemas de comunicaciones o redes eléctricas a las llamadas redes sociales (Facebook, Twitter,...) pasando por redes económicas, ecológicas o biológicas, que existen y se desarrollan en distintas escalas espaciales y temporales. El concepto matemático subyacente a la idea de red es el de grafo, que no es más que la abstracción de lo que entendemos intuitivamente por red: un conjunto de "puntos" o "entidades" genéricos (llamados nodos o vértices), unidos por "enlaces" (llamados arcos). Esta abstracción nos permite describir cómo las cosas están conectadas, interaccionan, o ambos. Así, los nodos pueden ser, por ejemplo, especies de animales o plantas que viven en un ecosistema, en cuyo caso los arcos conectan a cada especie con las que la comen (por ejemplo, el conejo estaría conectado con el lobo).

¿Cuál es la ventaja de esta imagen? Fundamentalmente, que nos permite descubrir patrones que de otra manera no veríamos. Por continuar con el ejemplo del ecosistema, podemos ver nodos que tienen muchos enlaces, especies que comen a muchas otras o son comidas por muchas otras (en jerga matemática, que tienen grado alto, ya que se llama grado al número de enlaces de un nodo) y que por tanto pueden cumplir una función especial. La gráfica inferior representa la red trófica del Atlántico norte, y aunque dada su complejidad los nombres quedan algo pequeños (además de estar en inglés; aquí, el original) se puede ver el papel importante que representa el bacalao (cod, en inglés):



Otros patrones que podemos detectar en las redes son, tal y como indica el colectivo NetSciEd, las conexiones más importantes (por ejemplo, aquellas que si desaparecen rompen la red en dos partes desconectadas), o la distancia entre nodos (en el caso de las relaciones sociales, los famosos seis grados de separación). También es posible detectar grupos de nodos que están muy conectados entre sí, formando comunidades o agregados, que normalmente responden a un papel funcional en el sistema representado por la red. Un caso dramático que pone de manifiesto la importancia de entender las redes y sus patrones es el de los factores que intervienen en la guerra de Afganistán, de la que el general Stanley McChrystal dijo que "una vez que se entienda, se habrá ganado la guerra":



Si usted lee inglés y no sabe nada de redes, amigo lector, le animo encarecidamente a que lea el documento de NetSciEd. Verá cómo realmente necesita tener algunas ideas sobre este asunto, y la web de NetSciEd le dará muchas más pistas y material para enterarse en profundidad de lo que más le guste o afecte. Y si no sabe inglés... me temo que no hay mucho material disponible. En España tenemos una comunidad de investigadores dedicados al estudio de las redes de primer nivel mundial (y no menciono a ninguno porque la mayoría son buenos amigos míos y no quiero dejarme a nadie), y sería deseable que esta comunidad hiciera un esfuerzo parecido para poner al alcance del público hispanohablante este conocimiento que cada vez será más necesario.

En este sentido, me parece interesante darme algo de autobombo y mencionar que, partiendo del primer material que produjo el embrión de NetSciEd (en concreto, este artículo, titulado Enseñar ciencia de redes a adolescentes), y con la colaboración de Cristina Brändle, preparamos un taller sobre redes que hemos ensayado con éxito con alumnos de 4º de la ESO (aquí se recoge la experiencia). Y es que, pese a que las redes complejas son algo complejo, valga la redundancia, hay muchos conceptos que se pueden explicar (e incluso practicar en ejemplos concretos) sabiendo poco más que sumar, y que resultan muy atractivos a un público adolescente. Citaré tan sólo el ejemplo de la paradoja de la amistad, referida al hecho de que en general y en media, nuestros amigos tienen más amigos que nosotros. Este tipo de resultados permiten además conectar con otras ideas de las matemáticas, como la de los promedios pesados, además de abrir la puerta a aplicaciones importantes como la del diseño de protocolos de vacunación que maximicen la población protegida. Nuestro taller (que en ediciones posteriores he realizado con José A. Cuesta) tuvo una gran acogida, como ya he dicho, y lo repito porque me siento orgulloso, pero también porque me deja claro que cuando se explica a los jóvenes conceptos matemáticos relevantes para el mundo de hoy y de una manera accesible, no salen huyendo de la matemática ni mucho menos.

En este blog nos encontraremos con las redes muchas otras veces, y revisando las entradas que he publicado hasta la fecha me sorprende que no hayan aparecido hasta ahora. Lo que me gustaría que se llevara como mensaje, amigo lector, es que las redes no son un artefacto matemático inútil, sino que están en su vida, que le interesa entenderlas, y que poco a poco irá habiendo más materiales para facilitarle la vida en este sentido. La labor de NetSciEd en este sentido es verdaderamente encomiable.

domingo, 26 de julio de 2015

Twitter y la primavera árabe

Minería de datos de Twitter: La primavera árabe
Por: Rob Schroeder, Sean Everton, y Russell Shepherd
Global

En este artículo nos basamos en la teoría de los movimientos sociales para ayudar a explicar cómo se alimenta el uso de los medios sociales, especialmente Twitter, puede haber jugado un papel en la aparición de la revolución primavera árabe egipcio. Más precisamente, se sugiere que los usos de Twitter activistas pueden haber facilitado la formulación de las quejas de manera que resonaron con su público objetivo. En un examen de un subgrupo de principalmente de habla árabe usuarios de Twitter, encontramos que no sólo hicieron los medios de comunicación y activistas tradicionales parecen jugar un papel importante en la elaboración de los acontecimientos en Egipto, pero también lo hicimos una cuenta de Twitter falsa haciéndose pasar por el presidente egipcio, Hosni Mubarak. Los Tweets de este cuenta atrajeron a una gran audiencia, y pueden haber ayudado a difundir un retrato de Mubarak como un líder corrupto que debe renunciar, ambos de los cuales eran los objetivos de la revolución egipcia.

Las personas a menudo asumen que todo lo que se necesita para que un movimiento social, una insurgencia, u otra forma de acción colectiva a surgir es de suficientes individuos para convertirse en lo suficientemente enojado por una condición social particular. Mientras que las quejas son sin duda necesarios para la acción colectiva sostenida, que por sí solos no son suficientes. Como han dicho los estudiosos de los movimientos sociales, en la mayoría de las sociedades hay un montón de personas que están enojados con el status quo, pero pocos se convierten en activistas o se involucran en politics.1 contencioso Para un movimiento social o insurgencia para ganar tracción, otros factores deben caer en place.2 En particular, no sólo los individuos necesitan para albergar quejas de algún tipo, pero:
  1. las quejas tienen que ser enmarcado de tal manera que la gente reconozca que ellos comparten con los demás y creen que juntos pueden hacer algo al respecto (es decir, la conciencia insurgente);
  2. la población agraviada debe tener acceso y ser capaz de apropiarse de los recursos suficientes para que no tengan que depender de la ayuda externa (es decir, los recursos de movilización suficientes); y
  3. que necesitan para percibir (ya sea correcta o incorrectamente) que el entorno socio-político más amplio es ya sea vulnerable a la acción colectiva, o que representa una amenaza significativa para los intereses del grupo o de supervivencia (es decir, las oportunidades de expansión o aumento de las amenazas). En el aislamiento, ninguno de estos factores es suficiente para generar y sostener una insurgencia. Cuando convergen e interactúan, sin embargo, la acción colectiva se convierte en una posibilidad aunque, hay que destacar, no una certeza.
En este trabajo se explora cómo el uso de las redes sociales, en especial Twitter, puede haber jugado un papel clave durante la primavera árabe egipcia de 2011. Nos centramos en el papel de Twitter en la formulación de quejas, pero en el camino también observamos cómo puede haber sido utilizado para atacar algunas de las vulnerabilidades del gobierno egipcio y como una red de comunicación entre los activistas. Comenzamos con una visión general de la teoría de los movimientos sociales, y explicamos el proceso de framing.3 A continuación consideramos cómo funciona Twitter, y como activistas y otros usamos durante la primavera árabe egipcio. Luego examinamos los datos de Twitter recogidos de la primavera árabe y lo que posiblemente cortometraje nos cuenta sobre su papel en el proceso de enmarcar. Concluimos con algunas reflexiones sobre el papel que los medios sociales pueden desempeñar para facilitar el desarrollo de los movimientos sociales, las insurgencias y otras formas de acción colectiva.

TEORÍA DEL MOVIMIENTO SOCIAL 

La cuestión de por qué las poblaciones que habían aparecido en reposo repentinamente levantarse contra sus líderes en protesta, disturbios y la rebelión en toda regla ha intrigado y confundido gobernantes y los investigadores por igual desde mucho antes de Nicolás Maquiavelo escribió sus tratados sobre la tiranía benévola en el siglo 16 . Teoría de los movimientos sociales sugiere tres causas interrelacionadas, cada una de las cuales es insuficiente por sí misma, pero que en combinación pueden fan ardiente resentimiento en la revuelta de masas: una amenaza percibida y la oportunidad de actuar, el acceso a los recursos, y un mensaje unificador. Cuando esta sección notas, el acceso a los nuevos medios sociales puede ayudar a traer estos tres factores juntos más rápida y eficiente que nunca.

OPORTUNIDAD Y AMENAZA

Poblaciones descontentos en general se enfrentan a numerosos obstáculos en el intento de movilizar, mientras que las oportunidades para superar esos obstáculos son raros y tienden a fluctuar con el tiempo. Doug McAdam ha sugerido que el entorno socio-político se vuelve vulnerable a la acción colectiva de tres maneras diferentes e interrelacionados:
  1. inestabilidad política;
  2. una posición político reforzado para la población agraviada; y
  3. apertura ideológica (4)
La inestabilidad política se produce cuando el control de la élite del status quo político se debilita por eventos tales como las crisis económicas, los conflictos armados, los desastres naturales a gran escala, y así sucesivamente. Un aumento en la posición política (es decir, potencia) de las poblaciones perjudicadas puede ser resultado de amplios cambios sociales que se producen durante períodos prolongados. Por último, el cambio social puede conducir a la población en general a tolerar ideas alternativas y, a veces, incluso subversivas defiende la población.5 agraviada Más recientemente, los estudiosos han señalado que la expansión de las oportunidades políticas son más propensos a ser un factor en las sociedades democráticas, mientras que en las sociedades autocráticas que es a menudo amenazas sustanciales a los intereses o la supervivencia de un grupo que matter.6 Dibujo sobre Daniel Kahneman y Amos Tversky la observación de que las personas son especialmente adversa a la pérdida, 7 muchos estudiosos sostienen que los grupos se arriesgarán mucho más para conservar lo que tienen que en lo que podría gain.8

Ya sea por la expansión de las oportunidades o un aumento en las amenazas, ni dará lugar a la acción colectiva a menos que los grupos las perciben como such.9 Una orden político establecido puede tambaleaba, pero si no se da cuenta de este grupo, es poco probable que cualquier aprovecharán la situación para lograr un cambio. Del mismo modo, si un grupo no reconoce que sus intereses o su propia existencia se ven amenazados, entonces no puede actuar a tiempo para evitar su propia destrucción.

La movilización de recursos

Cambios favorables y / o amenazantes en el entorno político sólo aumentan la probabilidad de que las insurgencias nacientes movilizarán. Ya sea que realmente hacen también depende de si tienen acceso y son capaces de apropiarse de los recursos necesarios para movilizar y sostener su cause.10 Otro factor favorable es el acceso a una red de organizaciones preexistentes (formal e informal) que puede proporcionar el base institucional sobre la que construir un movimiento. Estos también ayudan a vincular a las personas a los activistas, la forma y sostienen la indignación moral que alimenta la insurgencia, y facilitar la movilización y el despliegue de activities.11 insurgente Junto con fomentar un sentido de solidaridad, las redes también pueden contribuir otros recursos clave, tales como la capacidad de controlar participantes (este último es especialmente importante cuando la deserción plantea serios problemas de seguridad a los insurgentes), líderes y communications.12 Uno otro recurso que los movimientos incipientes menudo necesitan es "espacios libres" (por ejemplo, casas de café, instituciones religiosas, bares de barrio, espacios sin gobierno ) que están más allá de la vigilancia y el control de las autoridades, y en donde los grupos pueden enmarcar las narrativas (por ejemplo, "Venceremos.") que acompañan a la exitosa movilización efforts.13

CONCIENCIA INSURGENTE

Como se señaló al comienzo, el descontento por sí mismo no produce los movimientos sociales y las insurgencias; es necesario que haya lo que Christian Smith llama "el desarrollo de una conciencia insurgente", que se produce cuando la situación social se enmarca de una manera tal que las personas se sienten obligados a mobilize.14 Un movimiento social en ciernes, sin embargo, no se puede esperar que todos los miembros potenciales será capaz de comprender plenamente la ideología del grupo. Por lo tanto, las élites del movimiento general enmarcan mensaje central de su grupo en fragmentos ideológicos generalizadas, al igual parachoques 15 que son fácilmente comunicados a su audience.16 objetivo Dada la limitación de 140 caracteres de los mensajes de Twitter (véase más adelante), Twitter parece ser una herramienta ideal para la difusión de fragmentos ideológicos y enmarcando las quejas para su entrega al público objetivo de un movimiento social.

TWITTER Y LA PRIMAVERA ÁRABE

Twitter es una herramienta de micro-blogging que permite a los usuarios enviar y recibir mensajes de texto basados, públicamente puestos disponibles de hasta 140 caracteres conocidos como "tweets", que pueden contener mensajes, imágenes y enlaces a sitios de Internet. Además de transmitir los tweets a los demás, los usuarios pueden optar por seguir a otros usuarios, a fin de que se actualizan constantemente con nueva información cuando aquellos que siguen "tweet." También pueden describir el tema de su tuit colocando un "#" antes de una palabra. Si ellos quieren transmitir el mensaje de otra persona, pueden "Retweet" ese mensaje a sus propios seguidores u otros usuarios. Retweets contienen el mensaje original junto con el nombre del tweeter original, pero que pueden ser transmitidos a otros usuarios con contenido adicional si el usuario así lo desea retweeting.

Durante las protestas de Egipto 2011, muchos usuarios publican mensajes, imágenes y enlaces a otras páginas web sobre lo que estaba ocurriendo a través de Twitter. Estos ayudaron a crear una conversación global sobre los acontecimientos en Egipto. Algunos tocó la fibra sensible y se retweeted miles de veces, mientras que otros no llegaron a grandes audiencias.


A fin de comprender los que los usuarios eran conductos importantes de información durante este tiempo, se analizaron más de un millón de tweets sobre Egipto desde dos días, el 28 de enero y 4 de febrero del 2011, que hemos descargado usando una herramienta de investigación en la API de Twitter (Interfaz de programación de aplicaciones) 0.17 La API de Twitter ofrece diversas herramientas que permiten a otros programas para recibir datos desde y envían datos a Twitter. Se utilizó un programa para solicitar a Twitter todos los datos a disposición del público que podría encontrar en lo que respecta a los usuarios de Twitter acerca de Egipto; El programa entonces organiza y almacena esos datos. Los aspectos clave de los datos que estaban almacenados incluyen el nombre del usuario de Twitter, el contenido de cada tweet, y una descripción de cada usuario (de perfil público del usuario). Utilizando estos datos, hemos generado una red de usuario por usuario, donde se elaboró ​​un lazo directo entre dos usuarios si uno de los usuarios enviaron un mensaje a la otra, o un usuario retweeted el mensaje de otro. En el caso de este último, dibujamos un empate por parte del autor del mensaje original al usuario que "retweeted" el mensaje. Al final, nuestra red de usuario por usuario incluye 196.670 usuarios con 526.976 lazos entre ellos. La Figura 1 presenta una visualización de la red.

El tamaño de la red nos trazamos hace que la aplicación de algunos algoritmos sociales de la red de análisis estándar difíciles de implementar (porque muchos son equipo intensivo) y los resultados de otros potencialmente abierto a interpretaciones erróneas. Por ejemplo, en términos de centralidad de grado, que es un recuento de los vínculos de cada usuario, el cantante celebridad Katy Perry se ubica entre los diez primeros en nuestra base de datos. Si bien es posible que los tweets de Perry ayudó a enmarcar las quejas de los egipcios, es poco probable que lo hicieron.

Con el fin de filtrar el ruido como este, hemos utilizado un algoritmo desarrollado por un grupo de estadísticos para identificar distintos grupos (o comunidades) dentro del network.19 Este algoritmo asigna usuarios a diferentes grupos con base en una partición de usuarios que proporciona el más alto puntuación de modularidad. La modularidad es una medida de ajuste que compara las relaciones dentro y entre grupos a lo que uno esperaría en un gráfico al azar del mismo tamaño y con el mismo número de ties.20 Formalmente, es la fracción de las relaciones internas en cada grupo menos el espera fracción si se distribuyeron al azar en toda la red. Cuanto mayor sea la fracción neta, mejor será el ajuste. El algoritmo identificó una serie de grupos distintos en nuestros datos. Aquí, nos centramos en el clúster que incluyó Al Arabiya y Al-Jazeera en árabe, porque la mayoría de los usuarios hablan árabe y son probablemente geográficamente cerca de los acontecimientos en Egipto.

ANÁLISIS Y RESULTADOS

El grupo Al Arabiya y Al-Jazeera en árabe es un subconjunto mucho más pequeño (8.460 usuarios, 14.391 lazos-ver Figura 2) de toda nuestra base de datos, y por lo tanto más susceptibles a la utilización de la mayoría de los algoritmos de análisis de redes sociales. Comenzamos por estimar "centralidad de intermediación", 21 que mide el grado en que cada actor en una red se encuentra en los caminos más cortos (es decir, geodésicas) que conectan todos los pares de actores en la red. A menudo se utiliza como una medida de corretaje; aquí la usamos para identificar a los usuarios que son posibles conductos de información en la red. En la Figura 2, el tamaño de cada nodo refleja puntuación de centralidad de intermediación de ese usuario.

Al Arabiya y Al-Jazeera en árabe ocupan el tercer y cuarto, respectivamente, en términos de centralidad de intermediación. Esto no es sorprendente ya que ambos son tradicionales "ir a" fuentes de noticias e información, y sería de esperar que sean los conductos de información acerca de la revolución egipcia. El usuario Arabia "Essamz" es el segundo más alto de centralidad de intermediación. Esto tampoco fue una sorpresa para nosotros, porque él (Essam Al-Zamil) retrata a sí mismo como un activista que utiliza Twitter para iniciar conversaciones abiertas. Al-Zamil, de hecho, creó recientemente una nueva empresa llamada Radwitter Twitter, que es un programa de radio que transmite sobre eventos saudíes y las cuestiones planteadas en Twitter. El objetivo del programa es facilitar el debate en la radio entre los activistas y otros que utilizan Twitter.22 Curiosamente, el usuario que ocupa el primer lugar en términos de centralidad de intermediación es una cuenta de la parodia ("HosniMobarak") donde el usuario se hace pasar por Hosni Mubarak, el presidente de Egipto, que fue derrocado en el curso de la revolución. De acuerdo con el perfil del usuario, él (o ella) se encuentra en algún lugar cerca o en El Cairo, y la mayoría de los tweets de la cuenta durante los dos días que estudiamos estaban en Inglés. Unos pocos ejemplos aparecen a continuación:

"Voy a estar en la televisión antes de anunciar los nuevos cambios. Lo primero será la sustitución de las personas actuales de #Egipto".
"Sobreviví 83 años, 6 intentos de asesinato, 2 grandes guerras, y 2 grandes revoluciones. ¿Qué te hace pensar que no voy a sobrevivir a esto? #Egipto"
"Te engañas una vez, la culpa es mía. ¡Necio durante 30 años, la culpa es tuya, tus hijos y tus nietos. #Egipto"
"#Irony: El uso de Internet, que bloqueé anterior, por el presente anuncio mi renuncia al cargo". "De #Egipto" Presidente
"Como dije en mi declaración de televisión, voy a entregar las reformas que prometí, yo no he dicho cuándo. #Egipto"
"Dicen que todo lo que sube tiene que bajar. Pero, de nuevo, he desafiado todas las leyes que hay. #Egipto"

Es interesante que mientras que la mayoría de los tweets de la falsa Hosni de Mubarak estaban en Inglés, el algoritmo de agrupamiento Utilizamos todavía le asigna a una predominantemente clúster, lo que indica que a pesar de la barrera del idioma potencial, sus tweets recibidos Airplay sustancial dentro de una gran parte de habla árabe comunidad de habla árabe. Esto sugiere que su parodia del presidente egipcio puede haber ayudado marco de Mubarak como un líder corrupto e incompetente. Este retrato, transmitido con humor agudo, se extendió ampliamente en todo el "Twitterverse", con personas de la comunidad de habla árabe, los Países Bajos, y en otros lugares alrededor del mundo retweeting sus mensajes. La difusión activa de esta imagen negativa de individuo a ataques individuales con los requerimientos de la teoría de los movimientos sociales de la conciencia social para abrazar quejas comunes. Por supuesto, es posible que muchos egipcios ya percibe su presidente de esta manera. Si ese fuera el caso, entonces los tweets de la cuenta falsa probablemente han reforzado la percepción del público de Mubarak, y fueron tomando ventaja de la oportunidad política existente al atacar una de las vulnerabilidades del régimen. Además, cuando las personas publican tweets sobre lo real, Hosni Mubarak, que a menudo incluyen un enlace a la cuenta de la parodia, dirigiendo con ello aún más atención a ella. En cualquier caso, la teoría sugiere que el intercambio generalizado de un punto de vista común entre una gran parte educada, la población de clase media con acceso a los recursos puede haber contribuido a la sensación de la gente que el momento para el cambio (de oportunidad) había llegado.

Para ser claros, no estamos sugiriendo que la falsa Hosni Mubarak hizo que los acontecimientos en Egipto que se produzca. A medida que nuestra discusión anterior sobre la teoría del movimiento social debería haber dejado claro, una serie de factores tiene que caer en su lugar para que un grupo de individuos agraviados para movilizar, e incluso entonces no hay garantía de que lo harán. Sin embargo, nuestro análisis sugiere que los tweets de la parodia pueden haber desempeñado un papel en influir en la percepción del público de que el presidente y por lo tanto dado un impulso al movimiento. Sin datos adicionales que no podemos demostrar que este hecho ocurrió. Los resultados de nuestro análisis, sin embargo, son consistentes con dicha deducción.

CONCLUSIÓN

En este artículo, hemos examinado cómo los movimientos sociales pueden ser capaces de utilizar Twitter para enmarcar las quejas de manera que resuenan con su público objetivo. Hemos visto cómo durante la revolución egipcia, miles de personas utilizan Twitter para discutir los acontecimientos que se estaban produciendo. El uso de un algoritmo de agrupamiento, se identificaron y se centró en un grupo determinado de usuarios de Twitter, la que incluyó las organizaciones de noticias árabe Al Jazeera y Al Arabiya. Usando centralidad de intermediación para identificar nodos potencialmente influyentes dentro de este grupo, descubrimos que una cuenta de parodia Hosni Mubarak era bastante central, y especuló que sus tuits pueden haber tenido influencia en la formulación de quejas durante la revolución egipcia. Por retratar el verdadero Hosni Mubarak como corruptos y poco dispuesto a renunciar al poder, puede haber ayudado a crear o continuar una percepción pública negativa del presidente egipcio.

Este no es el único ejemplo de cuentas falsas que al parecer trataron de influir en los acontecimientos que se desarrollan durante la revolución egipcia o en otro lugar en el mundo. Por ejemplo, durante la revolución egipcia falso Henry Kissinger (la ex secretaria de Estado de EEUU) tuiteó con regularidad, y trató de retratar a Kissinger como un criminal de guerra (por ejemplo, la ubicación del perfil aparece como "En cualquier lugar pero la Haya", una referencia a la ubicación de la Corte Penal Internacional y la Corte Internacional de Justicia). Curiosamente, esta cuenta falsa menudo retweeted mensajes de la cuenta falsa "HosniMobarak". Otro ejemplo es el de las FARC falsa (Fuerzas Armadas Revolucionarias de Colombia) cuenta ("FARC"). Las FARC es un movimiento guerrillero colombiano que fue fundada originalmente en 1964 para proteger a los campesinos contra las duras políticas de los grandes terratenientes, y proporcionar a los pobres con la educación a cambio de comida y suministros. Desde entonces, ha degenerado en una organización internacional que ahora controla el tráfico de drogas de Colombia y con frecuencia da rienda suelta a la violencia contra los campesinos que afirma protect.23 Mientras las FARC tiene su propia cuenta de Twitter ("FARC_Colombia"), las cuentas falsas de tweets de las FARC sobre las victorias del gobierno contra las FARC y las atrocidades cometidas por las FARC.

Debemos tener en cuenta que Twitter tiene una política con respecto a las cuentas de parodia y cuentas de suplantación. Permite cuentas parodia, siempre y cuando dejan claro que son una parodia. Cuentas de suplantación, sin embargo, no están permitidos. De hecho, la cuenta "Henry_Kissinger" discutido anteriormente ha tenido que retirar todos sus tuits, ya que se consideró una imitación más que una parodia account.24 Si bien esta política pondrá límites a la viabilidad a largo plazo de las cuentas de suplantación, que será más probablemente continúan surgiendo, y junto con las cuentas de parodia, ayudará enmarcan cómo los demás perciben diversos eventos en todo el mundo. Por otra parte, los movimientos sociales, las insurgencias y otras formas de acción colectiva es casi seguro que continuará utilizando Twitter como un medio de comunicación con los fieles.



NOTAS:


1. John D. McCarthy and Mayer N. Zald, "Resource Mobilization and Social Movements: A Partial Theory," American Journal of Sociology 82 (1977): 1212–41.

2. Doug McAdam, Sidney Tarrow, and Charles Tilly, Dynamics of Contention (New York and Cambridge: Cambridge University Press, 2001).

3. David A. Snow and Robert D. Benford, "Ideology, Frame Resonance, and Participant Mobilization," International Social Movement Research 1 (1988): 197–217.

4. Doug McAdam, Political Process and the Development of Black Insurgency, 1930–1970 (Chicago: University of Chicago Press, 1982).

5. Christian S. Smith, The Emergence of Liberation Theology: Radical Religion and Social Movement Theory (Chicago: University of Chicago Press, 1991), 59.

6. David A. Snow, Daniel M. Cress, Liam Downey, and Andrew W. Jones, "Disrupting the ‘Quotidian:' Reconceptualizing the Relationship between Breakdown and the Emergence of Collective Action," Mobilization: An International Journal 3 (1998): 1–22.

7. See Daniel Kahneman and Amos Tversky, "Prospect Theory: An Analysis of Decision under Risk," Econometrica 47 (1979): 263–91; and Amos Tversky and Daniel Kahneman, "The Framing of Decisions and the Psychology of Choice," Science 211 (1981): 453–58.

8. Jack A. Goldstone and Charles Tilly, "Threat (and Opportunity): Popular Action and State Response in the Dynamics of Contentious Action," in Silence and Voice in the Study of Contentious Politics, Ronald R. Aminzade, Jack A. Goldstone, Doug McAdam, Elizabeth J. Perry, William H. Sewell, Jr., Sidnew Tarrow, and Charles Tilly, eds. (New York and Cambridge: Cambridge University Press, 2001), 179–94.

9. McAdam, Tarrow, and Tilly, Dynamics of Contention.

10. McCarthy and Zald, "Resource Mobilization and Social Movements:" 1212–41.

11. Christian S. Smith, Resisting Reagan: The U.S. Central America Peace Movement (Chicago: University of Chicago Press, 1996).

12. See McAdam, Political Process; and Smith, The Emergence of Liberation Theology. Social media such as Facebook and Twitter can obviously facilitate communication between activists. This aspect of social media's role in helping give birth to various forms of collective action, however, is not the focus of this paper.

13. Doug McAdam and David A. Snow, "Facilitative Spaces and Contexts," in Readings on Social Movements: Origins, Dynamics, and Outcomes, Doug McAdam and David A. Snow, eds. (New York and Oxford: Oxford University Press, 2010), 187–88.

14. Smith, The Emergence of Liberation Theology, 61.

15. Glenn E. Robinson, "Hamas as Social Movement," in Islamic Activism: A Social Movement Theory Approach, Quintan Wiktorowicz, ed. (Bloomington: Indiana University Press, 2004), 129.

16. David A. Snow, E. Burke Rochford, Jr., Steven K. Worden, and Robert D. Benford, "Frame Alignment Processes, Micromobilization, and Movement Participation," American Sociological Review 51 (1986): 464–81.

17. For information about Twitter API, see https://dev.twitter.com/

18. The green community at the bottom of the graph is the one we focus on. Another community of interest centered around a language is the purplish-pink community that extends from the center of the graph to the 4 o'clock position. This one is largely made up of Chinese speakers with some individuals speaking about a possible "jade" revolution. This does not, however, mean that each community is based around languages. Other communities tend to be focused around certain news organizations, such as CNN, or those following a celebrity.

19. Vincent D. Blondel, Jean-Loup Guillaume, Renaud Lambiotte, and Etienne Lefebvre, "Fast Unfolding of Communities in Large Networks," Journal of Statistical Mechanics P10008 (2008).

20. Mark E. J. Newman, "Modularity and Community Structure in Networks," Proceedings of the National Academy of Sciences 103 (2006): 8577–82.

21. Linton C. Freeman, "Centrality in Social Networks I: Conceptual Clarification," Social Networks 1 (1979): 215–39.

22. Mariam Abdallah, "Saudi Arabia: Boycotting Twitter to Save It," Al Akhbar English, January 31, 2012: http://english.al-akhbar.com/content/saudi-arabia-boycottingtwitter-save-it; accessed on October 5, 2012.

23. Claire Metelits, Inside Insurgency: Violence, Civilians, and Revolutionary Group Behavior (New York and London: New York University Press, 2010).

24. For more information on Twitter's parody and impersonation policies see: https://support.twitter.com/articles/106373#