viernes, 17 de junio de 2016

Redes de comercio marítimo (densas y animadas)

Esta es una visualización increíble de las rutas marítimas del mundo
por Brad Plumer | Vox

Cerca de 11 millones de toneladas de material deja llevar por todo el mundo cada año por buques de gran tamaño. Ropa, TV de pantalla plana, grano, automóviles, petróleo - el transporte de estas mercancías de puerto a puerto es lo que hace que la economía mundial va 'redondo.

Y ahora hay una gran manera de visualizar todo este proceso, a través de este mapa interactivo impresionante desde el Instituto de Energía de la UCL:




Puede utilizar las palancas en la parte superior del mapa para derribar las naves por tipo - portacontenedores (amarillo), graneleros secos (azul), los petroleros y combustibles (rojo), gaseros (verde), y barcos que transportan vehículos (púrpura) - o hacer zoom en las diferentes regiones.

Los investigadores reunieron datos de los miles de barcos comerciales que se movían a través del océano en 2012. Luego trabajaron con el estudio de visualización de datos del horno para que el mapa. Aquí están algunos puntos destacados aseado de jugar con la cosa:

1) Se puede trazar los contornos de los continentes exclusivamente al ver las rutas de envío


(Shipmap.org)

Puede alternar el mapa de modo que sólo muestra las principales rutas de navegación y nada más. Incluso en este caso, se puede ver claramente los continentes, con excepción de la región por encima del círculo polar ártico, donde viajan pocos barcos. (Aunque esto puede cambiar a medida que el hielo marino de verano mantiene en retroceso.)

También puede ver algunas de las principales vías fluviales en las que los grandes barcos pueden navegar - al igual que el río Amazonas, en el norte de Brasil, o el río San Lorenzo que permite a los barcos para viajar desde el Atlántico hasta los Grandes Lagos, o el complejo de Volga-Báltico navegable en Rusia.

También es fácil de detectar algunos centros de la economía mundial con este mapa. Las líneas rojas encima de los barcos que llevan trazas de combustibles líquidos - petróleo crudo o de gasolina. Como se puede ver, tanto en Louisiana y Texas son los principales centros de hidrocarburos. También hay gruesas líneas rojas que salían de la terminal de Valdez en Alaska, que está en el extremo sur de la tubería de Alaska, con lo que el petróleo de los campos en el norte.

2) Hay un importante cuello de botella del envío alrededor de Malasia y Singapur


(Shipmap.org)

Una de las rutas marítimas más importantes del planeta es el estrecho de Malaca, la ruta más corta entre el Pacífico y el Índico, que se puede ver aquí como una línea congestionada de barcos que viajan más allá de Singapur, Malasia e Indonesia. Alrededor del 40 por ciento del comercio mundial pasa a través de este estrecho cada año, incluyendo gran parte del crudo que va desde el Oriente Medio a China.

Pero el angosto estrecho también es vulnerable a la interrupción - y en los últimos años, ha habido un repunte de los ataques de piratas en estos estrechos. Técnicamente, los tres estados limítrofes - Singapur, Malasia e Indonesia - son responsables de la seguridad en esta región, defendiéndola contra la piratería, sino porque es tan crucial, los EE.UU., China, India y Japón han prestado asistencia en la obtención de la región .

Desafortunadamente, no hay forma fácil de solucionar. Los buques que no caben por el estrecho (su profundidad mínima es de aproximadamente 82 pies) tienen que tomar un desvío de miles de millas más al sur.

3) En el año 2012, la mayoría de los barcos mantuvo alejado de Somalia


(Shipmap.org)

A partir de alrededor de 2005, los piratas armados de Somalia comenzaron la intensificación de las incursiones de los buques que viajan alrededor del Cuerno de África. Algunos analistas argumentaron que la pesca ilegal de barcos extranjeros en la región había conducido inicialmente muchos pescadores somalíes para formar milicias armadas para defender sus aguas. Pero aquellos grupos más tarde se volvieron a apoderarse de los buques de carga y la celebración de los equipos de rescate.

Para el año 2012, los piratas estaban costando barcos comerciales entre $ 900 millones y $ 3.3 mil millones por año. Y, como se puede ver en los mapas anteriores, muchos barcos se mantuvieran alejados de la costa de Somalia después de salir del estrecho de Mandeb entre Yemen y Yibuti, que conduce hasta el canal de Suez.

Pero eso fue también la piratería somalí pico. En los años siguientes, las incursiones parecen haber disminuido drásticamente. Las compañías navieras aumentaron su seguridad en el barco mientras que varios militares desplegados buques armados para patrullar la región. Según la mayoría de las cuentas, parece haber funcionado.

4) Los buques tienen que moverse en rutas ordenadas en espacios reducidos, como el Canal Inglés


(Shipmap.org)

Los investigadores han señalado que "mientras que los buques pueden moverse libremente a través del océano abierto, las rutas están predeterminados más cerca de la tierra." Esto es evidente en el Canal Inglés, donde los barcos necesitan moverse en Niza, carriles aseado - como si se tratara de una carretera de dos carriles.

5) Se puede ver barcos esperando su turno en el Canal de Panamá


(Shipmap.org)

Cada año, cerca de 15.000 barcos pasan por el Canal de Panamá que conecta los océanos Pacífico y Atlántico. Sólo unos pocos barcos pueden pasar por las esclusas estrechos en un momento en que suben y bajan usando el agua del lago por encima lentamente. Así barcos anclan fuera del canal, a veces durante semanas, mientras esperan su turno asignado. (En total, alrededor de 30 a 40 barcos grandes pasan por el canal cada día.)

Para hacer frente a la próxima generación de grandes buques portacontenedores, el Canal de Panamá se encuentra en expansión, con un juego adicional de esclusas en el Atlántico y el Pacífico. Incluso esta expansión, sin embargo, no será capaz de manejar el mayor conjunto de buques portacontenedores - que puede ser tan grande como cuatro campos de fútbol de extremo a extremo establecidos.

Por lo tanto, ¿qué hacen esos gigantes? Nicaragua ha pensado en la construcción de su propio canal, grande para dar cabida a estos barcos, pero que nunca se puede conseguir construido (y es un fracaso para toda una serie de razones). Así que, por ahora, los grandes barcos todavía tienen que recorrer todo el camino alrededor de América del Sur.

6) Los buques del mundo son una fuente importante de emisiones de dióxido de carbono

(Shipmap.org)

Hay un enorme costo de todo este envío. Los barcos tienen que quemar una gran cantidad de combustible líquido, y en 2012, acabaron emitiendo alrededor de 796 millones de toneladas de dióxido de carbono. Los investigadores señalan que eso es más que "el conjunto del Reino Unido, Canadá o Brasil emiten en un año." O, dicho de otra manera, el envío es responsable de alrededor de un 3 a 4 por ciento de las emisiones de gases de efecto invernadero de origen humano.

Ahora, esto sigue siendo mucho más eficiente que el envío de todas esas cosas por tierra o por aire. Aún así, los investigadores han estado buscando formas de reducir el tamaño de la huella de carbono del sector del transporte marítimo. Nate Berg corrió a través de algunas de las mejores ideas aquí: "A partir de las mejoras tecnológicas, tales como timones y hélices readaptadas a mejorado de enrutamiento tiempo, las compañías navieras están viendo muchas maneras de mejorar su eficiencia."

martes, 14 de junio de 2016

Visualizando comunidades en Twitter usando Gephi

Visualización de las agrupaciones de Twitter con Gephi (actualización)
por Gabe Sawhney

[Esta actualización de mi proyecto de visualización de clúster Twitter es también el informe final para el estudio independiente que he estado haciendo en infoviz. Definitivamente, voy a recoger este trabajo de nuevo pronto, pero no en el próximo par de semanas. Un post anterior con algunas de mis primeras pruebas y fundamentos está aquí. Un tutorial sobre cómo empezar a hacer estos está aquí.]

Durante los últimos meses he estado absorbiendo mucho acerca de la visualización de información, y en las últimas cuatro semanas que he estado haciendo un montón de trabajo específicamente en la visualización de clusters basados ​​en la red Twitter. El objetivo de esto se describe en un post anterior. En el camino, he aprendido un montón raro de otras cosas: el ajuste del rendimiento de MySQL, las ventajas de la API de Google Social Graph sobre la API de Twitter, cómo moverse por el hecho de que muchos de los equipos del laboratorio de OCAD todavía se están ejecutando OS 10.5, cómo hacer un screencast, etc. Quiero aprovechar este trabajo en un montón de otras direcciones (y, una vez que me he ocupado de mis otras fechas límite). He aquí algunos de los mapas más interesantes que he producido a lo largo del camino:

En pocas las personas que siguen. (193 nodos, 192 enlaces):



Las personas que siguen, incluyendo los enlaces entre ellos (193 nodos, 2813 enlaces):



Los mismos datos, pero ahora con las agrupaciones identificadas:



Hay 7 "comunidades", que corresponden (¡torpemente!) a estas comunidades en el mundo real: arte / previsión / grandes datos; Toronto; tecnología Toronto; CFC / OCAD; Vancouver / Montreal / académicos; innovación social; otro.

Ahora vamos más grande - 6528 nodos y 30599 enlaces. Que es todo el mundo que sigo, y todo el mundo que siguen, pero filtrando aquellos que son seguidos por menos de dos personas en el resto de la red. Aquí es donde el algoritmo de agrupamiento incorporada en Gephi comienza a sturggle: se identificaron 103 agrupaciones:



Se trata de los mismos datos, pero los que tienen menos de 3 seguidores en la red se filtran, al igual que cualquier usuario con más de 4000 seguidores (desde cualquier lugar, no sólo por esta red). El número de grupos se redujo a 30. 2674 nodos, 14376 enlaces:



La misma idea, pero esta vez con mayores restricciones: el "Grado A" tenían que ser de al menos 2, y excluye cualquier persona con más de 2000 seguidores. 4061 nodos, 11667 enlaces, 402 comunidades (!):





Lo probé en las redes de los demás. Aquí hay uno; Sólo los seguidores directos. Las etiquetas también! (150 nodos, 2440 enlaces, 5 grupos):



Sobre el papel, se ve mucho mejor con un fondo negro. ¿Tal vez ocupa la pantalla demasiado ?:



Y un screencast de venir juntos:





Aquí hay otro, de nuevo sólo los seguidores directos. Dos versiones (208 nodos, 3013 enlaces, 7 clusters):




Mismos datos, pero esta vez sólo los nodos donde "In-Degree"> = 5 (4252 nodos, 34897 enlaces, 10 clusters):



He jugado un poco un manojo con la elaboración de mapas de dos o tres redes de personas a la vez, para ver hasta qué punto se superponen. Me pareció mucho más difícil para que sean legibles. Aquí hay una que resultó bien. Es toda la gente que sigo, y toda la gente que sigue a Greg. 568 nodos, 11732 enlaces, 8 comunidades. tamaño de los ganglios se corresponde con el número de seguidores que tiene la persona. Dos versiones, mismos datos, sólo una prestación diferente (hay un elemento de aleatoriedad al proceso):



También hice de screencast de éste:




En su presentación en estratos sobre la creación de prototipos con los datos, Tom Coates de Nokia dijo que a través de la experimentación (jugar?) Y la creación de prototipos, que "empiezan a desarrollar una comprensión más coloquial de los datos ...", que es muy valiosa para cuando llega el momento de desarrollar real ideas de productos. Me había olvidado de ese comentario hasta un punto intermedio de este trabajo. Yo estaba súper orgulloso de mis primeros mapas, pero se ven muy incómoda ahora. Durante estas semanas de trabajo con estos datos, he hecho progresos en encontrar la manera de manejar la situación, en primer lugar, cómo hacer que sea más legible, la forma de hacer que se vea mejor, y, de una manera que puedo " t aún describir, cómo funciona. No estoy todavía en la etapa de desarrollo de productos, pero por suerte que no era el objetivo.

Los lugares que voy a ir con ella al lado son:

  • Profundizar en la investigación sobre algoritmos de agrupamiento, y averiguar lo que sería necesario para ajustar el método de agrupación existente en Gephi, o crear otros nuevos que son más adecuados para grandes redes.
  • Hacer un montón de experimentos en la eliminación de nodos con un gran número de seguidores - estos tienden a ser no-humanos (como @TheOnion y @shitmydadsays) o celebridades (como @BarackObama y @ConanOBrien), y creo que ya que muchas personas de tantas comunidades diferentes que siguen, podrían ser 'cortocircuitos' el análisis de conglomerados. Experimentando con esto significaría ya sea manualmente la identificación de los usuarios de Twitter no humanos, o el uso de ensayo y error para ver si la eliminación de los usuarios con un gran número de seguidores da buenos resultados. (La solución fresca a este problema sería eliminar sólo aquellos usuarios que tienen un gran número de seguidores de un conjunto muy diverso de comunidades. Ni idea todavía cómo podría determinar eso.)
  • Mira en ajustar y escribir nuevas posibilidades de diseño y estilo con Gephi, mediante la creación de plugins.
  • La automatización de la creación de mapas, utilizando el kit de herramientas de Gephi, y / o una biblioteca de procesamiento que está en desarrollo. Las dos posibilidades inmediatas que esto introduciría son:
    • La creación de una página web en la que un usuario puede introducir un ID de Twitter y generar un mapa para ellos sobre la marcha (o en unos pocos minutos).
    • Prueba de diseño o de visualización algoritmos en un gran número de redes de los usuarios. Esto podría ser especialmente útil para el trabajo de ensayo y error requerido para hacer frente a las celebridades y los usuarios no humanos.

domingo, 12 de junio de 2016

Marketing: SEO de webs y ejemplos ilustrados con Gephi

SEO de sitio web y tipologías ilustradas con Gephi
Simon Georges - Developpons de nouveaux horizons


Reconocer una estructura del sitio de su visualización con Gephi


Este artículo sigue a la visualización de la página web con Gephi (que contiene en particular una configuración básica de la herramienta).

A fuerza de llevar a cabo auditorías técnicas, uno se encuentra con muchas estructuras de malla interna. La visualización a menudo da cosas buenas, pero nos damos cuenta de que la malla interna no siempre está optimizado:



Para permitir comparaciones que yo tenga que mostrar al cliente para ilustrar los resultados que pretendemos lograr, decidí hacer directamente a partir de modelos teóricos y ejemplos concretos. Nos encontraremos con que la malla optimizada a menudo producen gráficos simétricos, o regular, un algoritmo que va a entender con más facilidad que una red completa de páginas irregularidades.

En el siguiente artículo, vamos a reanudar las visualizaciones descritas en el artículo anterior (de color dependiendo de la modularidad, PageRank depende del tamaño), pero el algoritmo espacial posiblemente podemos cambiar lo necesario.

También tenemos en cuenta aquí que todos los enlaces están disponibles y accesibles a gatear, se utiliza ninguna técnica de "encubrimiento" o la ofuscación Javascript.

Organización del silo

Aquí hice una prueba con 2 categorías, subcategorías, 5 y niñas de 10 páginas para cada subcategoría, con enlaces internos "estricta" (después de la denominación de este artículo). Gráficamente, se identifican claramente las páginas secundarias de grupos relacionados con sus respectivas sub-categorías, siendo más "central" de las categorías:



Mi archivo de prueba está disponible si usted desea estudiar diversas variaciones o algoritmos espaciales: liens_internes_silos_gephi.csv.

Por contra el algoritmo de modularidad (que corta el gráfico en sub-red de colores distintos) no pueda correctamente subcategorías de posición de la misma categoría uno con el otro (independientemente de los valores damos a la modularidad del coeficiente de resolución). De hecho, esperaba obtener sólo 2 colores diferentes (uno para cada categoría, la página principal se combina con una de dos categorías), y se encontró que se obtienen muchos más colores.

Así que he intentado con diferentes categorías / subcategorías / páginas niñas, y si uno se acerca al resultado deseado al incrementar significativamente el número de subcategorías (aquí, 10 subcategorías), que n todavía no es perfecta:



La representación gráfica no es suficiente, pero los motores de búsqueda pueden utilizar otras pistas para que las páginas juntas (como su dirección URL, enlaces distintivas "cantidades" enlaces "descendientes", o por demasiado grandes diferencias contexto semántico entre las páginas de diferentes categorías).

La clave para recordar acerca de un buen silos organización es su representación en pequeños "grupos" de páginas.

Para ir más lejos, se puede utilizar filtros para Gephi particular, el filtro que le permite mantener sólo los vínculos mutuos:


Al elevar el algoritmo de distribución espacial, se obtiene una muy clara identificación de los silos de procesamiento de gráficos por separación pacífica (colores son innecesarios mismo):



Organización "piramidal"

La estructura de enlace se encuentra en la misma base que el anterior, pero un poco menos optimizado: se lo retiren los enlaces internos entre páginas del mismo nivel (subcategorías y niños páginas):



Se observa que la representación de gráficos es similar, pero los grupos se alargan en "pétalos de la flor".

El renderizado en "flor" se refuerza aún más si nos centramos de nuevo en los enlaces mutuos:



Usted puede haber notado las dos visualizaciones de estas páginas para colorear párrafo en función de su nivel de profundidad en lugar de su grupo (uno se acerca de lo que aquí Cocon.Se). Esto se puede lograr utilizando de nuevo los cálculos estadísticas Gephi, incluyendo el diámetro de la red de páginas:



Se calcula varios factores, uno de los cuales es la distancia media de una página a todas las otras páginas. En un sitio regular, se obtiene el resultado anterior, un color que corresponde al nivel de la profundidad de la página. En la página web irregular (con niveles variables de profundidad dependiendo de la categoría), este indicador está en contra impredecible y el resultado no será tan estética / práctico.

Mega menú

Un Mega menú se identifica por numerosas páginas alta PageRank interna (y casi idéntica), en contraste con los ejemplos anteriores en los que las diferencias en PageRank se suavizan de acuerdo con las páginas del sitio:



A menudo, esto también muestra las estructuras con un mayor número de páginas, en realidad es más difícil de analizar directamente y optimizar ... rápidamente. Se necesita más trabajo, tal vez con un zoom sobre una parte restringida del sitio, por ejemplo.


Sitio de "una página"


Bueno, eh ...



Así que, sí, deliberadamente magnifiqué la línea, ya que este tipo de sitio a veces algunas páginas externas (como las notificaciones legales o un enlace a un blog), pero ayuda a ilustrar la diferencia, de nuevo, para un cliente . Si comparamos este informe con la del párrafo anterior (donde la representación de gráficos está lleno de colores y formas), nos imaginamos que podemos llevar la misma finura o granularidad en las indicaciones que se dan a los motores contenido SEO.

Conclusión

Gephi tiene muchas oportunidades (incluyendo el uso de los filtros, estadísticas, ...), y por lo tanto permite la visualización de abuso utilizados directamente en un contexto de SEO.

En particular, mediante la combinación de los filtros y la variación de los parámetros utilizados para la coloración o algoritmos espaciales, podemos destacar bastante rápidamente puntos de atención. Todo no indican un problema de diseño del sitio, pero tienen como protagonistas a una irregularidad, y por lo tanto una posible vía para explorar, en particular durante una auditoría sin problema aparente inmediatamente. En sus visualizaciones, ahora!

jueves, 9 de junio de 2016

Importando datos de Excel a Gephi

Datos de Excel y laboratorio de datos de Gephi
Bowdoin DCSI



Mi objetivo para esta entrada de blog es explicar la forma de organizar los datos en una hoja de cálculo de Excel (que se guarda como un archivo de valores separados por comas o CSV) para importar en Gephi para la visualización y análisis de nodos (elementos individuales representados como puntos) y bordes (relaciones representadas por las líneas conectivo) en una red. Mi explicación asume la familiaridad con los tutoriales basados ​​en archivos Gephi .gexf preparados (la extensión de los archivos legibles por Gephi) de los datos de Les Miserables o Facebook. Asumo que mi lector está pensando ahora en la aplicación de análisis de redes para su propia investigación.

Los nuevos usuarios de Gephi pueden no tener ninguna familiaridad con los archivos XML, .gexf mark-up, o cualquier otro código para organizar los datos, pero todavía pueden encontrar uso en Gephi. Excel es típicamente una aplicación más fácil de usar para este tipo de organización, y la mayoría de las bases de datos de Microsoft Access (por ejemplo) se puede convertir en un libro de Excel (.xls) o directamente a un archivo .csv. Las explicaciones se parte de una comprensión básica de almacenamiento, la copia y la ordenación de datos en Excel. Los principios de organización se describen a continuación se pueden aplicar a cualquier aplicación que utilice para generar la tabla .csv archivos que va a utilizar en Gephi. Otros formatos compatibles y su funcionalidad se pueden encontrar en el sitio de Gephi.

Estoy utilizando las capturas de mis propios datos de investigación sobre los libros en la biblioteca de Galileo Galilei para ayudar a demostrar los tipos de información cada columna debe contener. A continuación se muestra una captura de pantalla de una hoja de cálculo en el libro de Excel que he utilizado para organizar todas mis notas relacionadas con el proyecto:



Hay muchas hojas de cálculo que figuran en la barra de pestañas en la parte inferior de la pantalla para los diferentes tipos de información que tengo para el proyecto. Es importante destacar que un archivo .csv sólo conserva la información en la hoja de cálculo activa ( "Por autor" en este caso, la pestaña en blanco) y no va a salvar las otras hojas. Es importante copiar la información que desea utilizar en su libro principal (múltiples hojas) a un libro de una sola hoja de cálculo para los nodos y un libro de trabajo de una sola hoja de cálculo para bordes. Además, los títulos de las columnas en mi libro ( "Mi #", "# de Fav", "Autor. La cita de Favaro completa", "Año", etc.) son mi taquigrafía y no pueden ser interpretados por Gephi, otra razón por la que la copia de la información que desea utilizar para nuevos archivos de libro de una sola hoja de cálculo es muy recomendable.

  1. Usted tendrá que crear dos archivos .csv: una tabla de nodos y una tabla de borde. Yo uso Excel como mi solicitud de tabla, archivos de Excel y guardar por defecto para el formato .xlsx. Con el fin de obtener el .csv, tiene que elegir esa opción para el formato de archivo al guardar.
  2. La tabla de nodos dice Gephi todos los posibles nodos en una red y debe tener al menos las columnas ID y la etiqueta. Debe haber una línea por cada nodo que aparecerá en cualquier columna de la tabla irregular:
Esto parece bastante fácil, pero ¿qué tipo de información se encuentra en mejor posición en la columna Id, y cómo debe diferir de que la etiqueta? El ejemplo anterior es tomado de una hoja de cálculo que utilizo para organizar la información sobre la biblioteca de Galileo. Todos mis nodos en este ejemplo son los nombres propios que se encuentran en los títulos de la biblioteca y de los propios títulos (alrededor de 2.650 nodos en total). El ejemplo anterior es, en una palabra, torpe. Es redundante y, finalmente, hace que mi visualización de la red ilegible si trato de añadir etiquetas en los nodos. Considere el siguiente ejemplo en el que los títulos completos se convertirían en las etiquetas de más de aproximadamente 650 nodos (nodos y bordes oscureciendo en el proceso):



Tener un número de identificación único (ID que Gephi espera) me permite almacenar una gran cantidad de información acerca de ese nodo en una hoja de cálculo o base de datos que después puedo elegir acceder cuando sea necesario. Ya que mi sistema de organización se creó mucho antes de saber acerca Gephi, mi columna de etiqueta corresponde a la columna Título en mi hoja de cálculo (que en última instancia estorba mi visualización hasta el punto de ilegibilidad si agrego etiquetas). Para que esto sea más fácil de leer, tengo que cambiar los datos en la columna Etiqueta de los datos de una columna “Short Title".

3) Como se puede observar, hay otras columnas en la primera captura de pantalla de la tabla de nodos. La tabla de nodos también puede incluir atributos (en paréntesis en el ejemplo, ya que no son necesarios para una visualización básica de una red). Los atributos son una forma de clasificar los datos, tal vez por género, raza, edad, etc. Aunque no es necesario para explorar los datos con Gephi, que permiten una exploración más matizada de una red. Por ejemplo, voy a querer añadir columnas de atributos de la afiliación religiosa (Jesuita, Benedictino, protestante, católica, etc.) y el género para iniciar la visualización de los datos de una manera que me ayuda a responder a mis preguntas de investigación. Columnas de atributos también se pueden añadir en la sección "Laboratorio de Datos" de la interfaz Gephi incluso después de haber cargado los archivos .csv para los nodos y los bordes.

4) El intervalo de tiempo es otra columna opcional de información para incluir alrededor de sus datos, los cuales pueden o no ser aplicables o útil. Copio aquí una captura de pantalla parcial de la página Gephi.org como referencia:



El wiki Gephi también muestra el código detrás de este proceso.

Pensando en mi propio conjunto de datos, necesito una columna de intervalo de tiempo para cada título que muestra el año más temprano que un libro podría haber entrado en la biblioteca. Voy a dejar mis intervalos de tiempo con la muerte de Galileo en 1642. A partir de los ejemplos en la parte 3, el tiempo de intervalo de información se vería así en la versión .csv de la hoja de cálculo, con las columnas ID, hora de inicio, hora de finalización:

4,1640,1642

5,1628,1642

6,1637,1642

Una vez que haya subido el csv, en el Laboratorio de Datos, puede combinar las columnas de la hora de inicio y fin utilizando la estrategia de combinación "Crear Intervalo de tiempo." Esto va a concatenar y formato de lo que necesita con el fin de ser capaz de ver el cambio a lo largo tiempo de la red.

5) La tabla de enlaces (el segundo archivo .csv que necesita para crear) le dice a Gephi las conexiones que existen entre los nodos. Debe tener la columnas Source y Target:


Aquí es donde tener un identificador único para todos los nodos puede ser muy conveniente. Mi fuente de arriba es el título 299 en el que la Academia de Colonia se menciona como un contribuyente al libro que yo he dado a los títulos de libros identificador 299. puede incluir a personas o lugares (objetivos), pero las personas o lugares no puede incluir títulos (Fuentes), por lo mis bordes se dirigen, y la distinción entre los nodos de origen y los nodos de destino es crítica.

6) De manera similar a la tabla de nodos, hay muchas categorías opcionales que pueden añadir matices a un análisis de una red. La tabla irregular también puede incluir una columna Etiqueta para ayudar con la clasificación de los tipos de relaciones, un identificador único para la relación (generada por Gephi), atributos (por ejemplo: la familia, amigo, compañero de trabajo, compañero de clase, etc., para las redes sociales), e intervalo de tiempo.

7) La tabla irregular también puede incluir información que no se encuentra en la tabla de nodos. Tipo indica si la relación es dirigido o no dirigido. Esta columna puede ser auto-llenado de carga y es visible en el Laboratorio de Datos.

8) Otra opción para la tabla de borde es proporcionar weightedness para la relación. De peso es su oportunidad de dar más importancia a ciertas relaciones, dándoles un peso numérico.

No olvide guardar los archivos como .csv, luego cargarlos en Gephi, los nodos en primer lugar, mediante la opción "Importar CSV" en la barra de herramientas del Laboratorio de Datos. Asegúrese de indicar el tipo de archivo que está subiendo (tabla de nodos o tabla irregular), de lo contrario corre el riesgo de mensajes de error.

Los datos pueden ser simplemente la entrada directamente en el Laboratorio de Datos de Gephi, pero estoy más familiarizado con la funcionalidad de Excel, se han organizado mis datos de investigación utilizando hojas de cálculo, y prefieren hacer ajustes, filtrar los datos, y guardar mi información en un solo formato. Los lenguajes de programación tales como R parecen particularmente adeptos a crear la información tabular necesita aquí, sobre todo cuando se tira de forma automática datos de un gran corpus.

Mi enfoque puede no funcionar para todos o cada proyecto, pero es de esperar ver los datos reales en un formato crudo proporciona un contexto para su presentación en el laboratorio de datos:




A su vez, esto debería hacer el análisis de algo tan complejo como la visualización de las conexiones entre los nombres en la biblioteca de Galileo menos opaco:

lunes, 6 de junio de 2016

Redes animales: Aprendizaje difundido por centralidad


No es una monada - ¡No es lo que conoces, sino a quien conoces!
por Alaina | Living Links
Las redes sociales dan forma a la "cultura" de los monos

Un nuevo estudio, publicado en la revista Current Biology, demuestra que los monos ardilla que se encuentran en el corazón de su grupo social recogen las innovaciones en primer lugar, y son más propensos a adquirir nuevas variaciones culturales en el comportamiento como nuevas técnicas de forrajeo.

Los Dr. Nicolas Claidière, Ms Emily Messer y el profesor Andrew Whiten de la Universidad de St. Andrews, en colaboración con el Dr. Will Hoppitt de Anglia Ruskin University estudiaron nuestros dos monos ardilla del Este y del Oeste. Examinaron sus redes sociales, mediante el registro de que pasó un tiempo con el que cuando los monos estaban en las proximidades de un "frutas artificiales" que se podría utilizar para obtener recompensas de comida mediante el uso de dos técnicas diferentes, levantar o pivotar (Figura 1).



Sofisticados análisis estadístico de estos datos revelaron los detalles de las redes sociales de los monos que ayudó a los investigadores a visualizar lo que los monos estaban en el corazón de la red y a los que eran más periféricos (Figura 2). Cada mono fue evaluado en una medida de su 'centralidad' dentro del grupo. red social Rojo contra azul



Boa, el machos alfa en el grupo Este se separó y se entrenó cómo utilizar la técnica de elevación y su equivalente, Río en el grupo Oeste fue entrenado para usar la técnica de pivote brevemente, a continuación, se reunieron con sus respectivos grupos.

Los científicos descubrieron que los monos que estaban bien conectados eran los más propensos a entender con éxito la nueva técnica implantada en su grupo. También eran más propensos a adquirir la técnica de elevación en el grupo implantada con "levantar", en comparación con la técnica de pivote en el grupo sembró con 'pivote', por lo que los machos alfa eran verdaderamente los ejes de estos dos diferentes mono "culturas".

El Profesor Whiten, de la Universidad de St. Andrews, dijo: "Nuestro estudio muestra que las innovaciones no sólo se extienden al azar en grupos de primates, pero al igual que en los seres humanos, están conformadas por las redes sociales de los monos".

Dr. Claidiere dijo: "La investigación de interés en el aprendizaje social y análisis de redes sociales ha aumentado en los últimos años, y nuestros resultados son susceptibles de estimular la investigación sobre la difusión de las innovaciones en las redes sociales de los animales.

"Sospechamos que nuestro enfoque en una red social relevante para la difusión de las innovaciones de forrajeo puede explicar por qué encontramos un efecto de la centralidad de la red de los individuos sobre su aprendizaje.

"La investigación anterior se ha centrado en otras relaciones, como quien prepara los cuales, que puede no tener correlación con el aprendizaje por observación de los monos de la misma manera".

Emily Messer, señaló otro aspecto del estudio. "También encontramos que las relaciones maternas explican las partes de la red social, por lo que algunos de la difusión de los nuevos hábitos de forrajeo también probablemente está reflejando un énfasis en el aprendizaje dentro de las familias", dijo.

sábado, 4 de junio de 2016

Análisis del hashtag #NiUnaMenos en 2015

#NiUnaMenos: unidas y retuiteadas





Por Analía Gómez Vidal - Bastión Digital

Twitter es un micromundo. Las relaciones suelen parecerse a aquellas que vivimos en la escuela secundaria, donde las jerarquías se hacen sentir pero esta vez en favs y retuits. Sin embargo, dependiendo de qué evento miremos, podemos identificar distintas dinámicas. Algunas campañas polarizan, como Ernesto Calvo señala en su libro, “Anatomía política de Twitter en Argentina” (Capital Intelectual, 2015) al describir el caso #Nisman. Otras veces las corrientes tuiteras nos unen y despolarizan, ayudando a que distintos segmentos de la sociedad puedan hablar entre sí.

A cinco meses de la marcha Ni Una Menos, las redes sociales de esos días nos muestran evidencia de esta segunda dinámica, donde diferenciación no es polarización. En una muestra de 993.578 tuits publicados entre el 31 de Mayo y el 6 de junio de 2015, se puede ver cómo la tuitósfera acompaño a quienes se movilizaron por #NiUnaMenos, sumando fuerzas en lugar de dividiéndolas, integrando antes que confrontando narrativas. A la distancia, aún hoy, podemos pensar a las movilizaciones sociales de  #NiUnaMenos como un evento unificador.

La muestra de tuits utilizada cubre una semana, y la distribución de los tuits a través de ese período de tiempo indica cómo el evento fue cobrando relevancia online en los días previos, y decayendo posteriormente en forma casi simétrica. Tan sólo en el día de la marcha se publicaron 668.429 tuits, que representan aproximadamente el 67% de la muestra. El día anterior (02/6) y el día posterior (04/06) a la marcha, el total de tuits publicados sobre la marcha rondaron el 10% del total de esta muestra, y el resto de los días tuvieron un tráfico no superior al 5% del total.

A simple vista, estos datos parecieran indicar que si bien #NiUnaMenos fue un evento promovido principalmente a través de las redes sociales, y Twitter en particular, su relevancia en el contenido online en los días previos y posteriores fue relativamente baja respecto al día de la marcha. En otras palabras, las publicaciones generadas tuvieron como motor la marcha como evento en sí. Las consignas motivadoras, por otra parte, parecieran no haber tenido tanto éxito en el sostenimiento del tráfico de información posteriormente.

Twitter genera “geografías alternativas”, comunidades de usuarios en las cuales circulan distintos tipos de mensajes, como sugieren los trabajos de Barberá y Calvo. En el gráfico que acompaña esta nota, por ejemplo, vemos distintas comunidades que interactúan más intensamente entre sí: la comunidad oficialista, a la derecha de la visualización, incluye referentes como @RandazzoF, @RossiAgustinOK, y @Lubertino. Un poco más alejado del núcleo duro kirchnerista vemos a @danielscioli y su equipo. Hacia la izquierda del gráfico vemos a los massistas y, por encima de éste, la comunidad PRO. Esta distribución confirma lo que ya sospechábamos sobre Twitter: los diálogos son intracomunidades, reforzando códigos e ideas compartidas.

Sin embargo, incluso cuando se pueden identificar áreas políticas en la periferia de la red, los objetivos no partidarios de #NiUnaMenos se ven reflejados en los tuits de la marcha. A diferencia de las redes de la campaña electoral, elaborada por el Observatorio de Redes semanas antes, el centro de la red de #NiUnaMenos no está conformado por la política sino por figuras reconocidas del espectáculo, la cultura y los medios de comunicación, en conjunto con los usuarios no partidarios que lideraron la iniciativa. Personalidades de los medios como @Su_Gimenez o @SANTIAGODELMORO compartieron espacio con promotoras activas de la marcha como @SoleVallejos y @Marcelitaojeda. En el centro de la red vemos que aquellos tuiteros con mayor número de seguidores se convirtieron en voceros activos y predominantes de la marcha, compartiendo el espacio con los organizadores de la marcha.

Analizar el contenido de algunos de los tuits más retuiteados en esta muestra también nos lleva a entender más sobre la horizontalidad de Twitter, pero desde otro ángulo. No se trata sólo de quienes son aquellos que generan más contenido, sino también del tipo de contenido que reciben. En la política como en el espectáculo, Twitter ofrece la posibilidad de interactuar con personalidades que de otra manera no podrían ser contactadas. Incluso para las críticas.

Cuando filtramos la muestra para observar algunos de los tuits más destacados dirigidos particularmente a los candidatos presidenciales, el escrache está a la orden del día. Mientras @mauriciomacri tuvo un solo tuit con su foto apoyando la marcha el 2 de Junio, la mayor parte de las respuestas que recibió fueron críticas de usuarios sobre su propia gestión en la ciudad, o incluso algunas dirigidas a su mujer, Juliana Awada, por la denuncia contra Cheeky por explotación. Curiosamente, dichos tuits dirigidos hacia la esposa del candidato PRO, de cariz particularmente violento, proceden de cuentas que se encuentran actualmente suspendidas.

@danielscioli, por su parte, recibió reacciones tanto positivas como negativas. Si bien no participó activamente de la promoción de #NiUnaMenos a través del uso del hashtag, o incluso la publicación de su foto pronunciándose a favor de ella, si tuiteó sobre III Foro Internacional sobre los Derechos de las Mujeres, organizado el mismo día (y cuyo hashtag fue #ForoPoderConMujeres). Dicha participación logró que el candidato fuera asociado mayoritariamente con reacciones positivas. Sin embargo, también recibió reclamos por parte de otros usuarios, quienes le recriminaron su cercanía a figuras controversiales como José Ottavis –denunciado por su ex esposa por violencia de género-.

@SergioMassa fue el candidato que mejor pudo capitalizar su adhesión a la marcha, de la mano de su esposa, @MalenaMassa. Los tuits más populares de la pareja fueron relacionados con la convocatoria, y mayoritariamente replicados por su propio equipo, mediante cuentas como @JovenesenMassaL . Así, entre los tuits más populares de la muestra relacionados al candidato, sólo se encuentran aquellos que comparten noticias y fotos sobre Massa y su esposa pronunciándose a favor de #NiUnaMenos.

Twitter es un micromundo. Genera miles de gigabytes de información por minuto a nivel global. Su evolución es también nuestra evolución, y la velocidad que imprime en nuestra vida diaria nos obliga a desarrollar más y mejores técnicas para entender e incorporar toda esta información en nuestro estudio de la política argentina. En casos como #Nisman o #NiUnaMenos, podemos ver como se convierte en una herramienta prioritaria para expresarse, compartir, y hasta organizarse en comunidades. Vemos también cómo las distancias entre representantes y representados parecen, al menos virtualmente, volverse cuasi nulas. Sin embargo, eventos virtuales tan disimiles nos muestran inicialmente, su versatilidad como tal: a veces, para polarizar. A veces, para unificar.

jueves, 2 de junio de 2016

Redes animales: Redes muy monas


Familiarizarse
 por Alaina | Living Links
Estudio de una integración chimpancé y sus redes sociales



Desde mediados de 2012 Living Links y el Budongo Trail en el zoológico de Edimburgo se convirtieron oficialmente en un consorcio de investigación. La Dra. Katie Slocombe de SPRG es la directora científica del Centro de Investigación del Chimpancé Budongo y tiene un interés científico desde hace mucho tiempo en los chimpancés del zoológico de Edimburgo, así como los chimpancés en el bosque de Budongo en Uganda.

A través de los años, ella y sus colegas han tenido la oportunidad de realizar múltiples estudios con nuestros chimpancés y recientemente uno de estos proyectos ha sido publicado en la revista American Journal of Primatology.

Schel, M.A., Rawlings, B., Claidiere, N., Wilke, C, Wathan, J, Richardson, J, Pearson, S, Herrelko, E, Whiten,  A., and Slocombe, K (2012). Network Analysis of Social Changes in a Captive Chimpanzee Community Following the Successful Integration of Two Adult Groups. American Journal of Primatology 00:1-13.

En mayo de 2010, un nuevo grupo de chimpancés de Beekse Bergen Safari Park (Holanda) llegó al Budongo Trail, y estos chimpancés se fuera a introducir a la población que habita en este recinto existente. En el transcurso de 3 meses los recién llegados se integraron con éxito con la población original.

Para facilitar la introducción del Budongo Trail había sido diseñado de tal manera que los guardianes fueron capaces de introducir lentamente los chimpancés entre sí mediante el uso de un sistema multi-pod (Figura 1). Las presentaciones se llevaron a cabo al ritmo que fue dictado por el comportamiento de los chimpancés uno hacia el otro mientras estaban separados físicamente. Los encargados de la experiencia del conocimiento 'de los individuos y su comportamiento fue clave para el éxito de la integración. Tabla 1 muestra las características demográficas de los individuos están introduciendo y la Figura 2 muestra el proceso de la integración.

Budongo mapa de los senderos

Fig. 1 - Un mapa que representa la envolvente sistema multi-pod y la zona de recinto al aire libre.

Tabla 1 - Datos demográficos de los chimpancés.


La Fig 2. Ilustración del proceso de integración de los individuos en el grupo mixto tercera. Una célula sombreada naranja indica que los individuos abandonaron su grupo original y pasaron a formar parte del grupo mixto. Los machos dominantes de cada grupo (CL, PA, KD y Q) se introdujeron pasado.

En el documento de los autores discuten las complejidades de la integración de dos grupos de chimpancés en cautividad no relacionados y supervisan la dinámica del grupo en todo el proceso de integración con el uso de Análisis de Redes Sociales (ARS). El ARS utiliza asociaciones (por ejemplo. Vecino más cercano) y los datos de interacciones (por ejemplo, de la preparación.) Para crear una representación gráfica (sociograma) de las relaciones sociales dentro del grupo (Figura 3).



Figura 3 - Sociogramas que ilustran los patrones de asociación de los períodos temprana y tardía de la integración. Los machos se muestran como cuadrados azules y las hembras como los círculos de color rosa. nombres de chimpancés Edimburgo están resaltados en rojo y los chimpancés Beekse Bergen muestran en amarillo. El espesor de la relación representa la fuerza de la asociación entre dos individuos y el tamaño del nodo representa lo bien conectado ese individuo está dentro de toda la red.

Los sociogramas muestran que en los primeros tiempos de la integración Edith, una mujer de 13 años del grupo Beekse Bergen, tenía las asociaciones de grupos de cruz más fuertes, mientras que en el último período fue Kindia, un niño de 12 años de edad de sexo masculino de alto rango de Edimburgo.

Los datos del ARS que se ha recogido y se muestra para este grupo de chimpancés está en curso para que podamos seguir vigilando el lento proceso de integración social entre los dos nuevos grupos de chimpancés. Como se puede ver en el sociograma todavía hay una tendencia a que los chimpancés se asocien con sus miembros originales del grupo a pesar de que han estado viviendo en el mismo recinto grande para más de un año. Con el tiempo vamos a ver una mayor uniformidad de la mezcla de las dos subpoblaciones o van a seguir confiando en las viejas coaliciones?

Esta investigación no sólo nos permite un vistazo a la complejidad de los sistemas sociales de los chimpancés, pero también puede ser útil para hacer el bienestar enfocada opciones de manejo de los animales. Si conocemos la conectividad de cada individuo en el grupo entonces podemos hacer predicciones sobre cómo el traslado / adiciones a la población que pueden jugar a cabo, junto con la planificación de las cuales los individuos pueden necesitar otras personas de apoyo social en situaciones nuevas.

Para obtener información acerca de otro proyecto de chimpancé en el Camino de Budongo favor ver un vídeo de la entrevista con Katie sobre el estudio de la comunicación del chimpancé.