lunes, 26 de enero de 2015

Software y grafos de conocimiento: Herramientas y opciones

Explorando la Sociedad y la Cognición a través del Marco de Ciencia de las Redes
Grafos de conocimiento: El nuevo tipo de documento para el Siglo 21

Nodus Lab


Excel fue un producto revolucionario para la época, pero en el siglo 21 las columnas y filas ya no son suficientes. El aumento de la complejidad y de los datos grandes (Big Data), la proliferación de las redes sociales, minificación de flujos informativos hacen a los modelos de información en dos dimensiones insuficientes. Lo que importa hoy en día son las relaciones entre los datos multidimensionales, que combinan una mejor vista de la imagen más grande y con una atención al detalle: las redes y gráficos.

Un agradecimiento especial a Dor Garbash de Rhizi / CRI y Alexis Jacomy de Sigma.Js para conversaciones esclarecedoras sobre este tema.

De las tablas relacionales a los grafos de redes

Los documentos de texto y tablas de Excel son esencialmente dispositivos de narración. Son muy útiles para comunicar información de una manera lógica y cronológicamente coherente. Sin embargo, como las redes digitales proliferan, la complejidad de las historias que necesitan ser dicho también aumenta. Es por eso que tiene sentido para abrazar las redes como los nuevos dispositivos de narración útiles.

Para usar un ejemplo simple: lo que sería una visión general del sector de alta tecnología suelen tener la apariencia? Un enfoque estándar sería abrir una lista de las 500 empresas de Fortune y hacer una selección, lo que podría ser presentado como un informe o una tabla como la siguiente:



Es una mesa informativa, ya que los datos dentro se pueden combinar para crear una historia. Por ejemplo, Google es un motor de búsqueda y lo que gana 3 veces menos que el de Apple, pero cuesta sólo dos veces menos ... por lo tanto, las expectativas de los inversores tienen en relación a Google podrían ser mayores que hacia Apple, pero esto debe ser comprobado con algunos otros datos , etc.

Este tipo de historia, sin embargo, no revela cómo se interconectan esas compañías. De hecho, una tabla de dos dimensiones sólo será capaz de decir cómo A (una fila), a través de una serie de criterios (una columna), se refiere a B (otra fila) y la forma B, a través de otros criterios (otra columna), se refiere a C (la tercera fila), pero no nos dirá que A y B y C se refieren a D, que es un competidor a E, que se relaciona con F, E y G, que prestan servicios para A y B. o usted necesitaría varias tablas - por ejemplo, una base de datos relacional y un par de consultas complejas.

Ahí es donde los documentos de grafos de red pueden ser muy útiles. Ellos proporcionan una forma visual muy simple para representar interconexión. Gráficos de red pueden ser utilizados para proporcionar una visión general de una industria, describir funcionamiento interno de una organización terrorista, dar una buena idea de la filosofía contemporánea o incluso ser utilizado para encontrar los mejores restaurantes de Berlín, en base a las preferencias de cada uno.

Para continuar con el ejemplo anterior: para aprender sobre una industria, uno podría simplemente visualizar conexiones entre las empresas de alta tecnología basados en algunos criterios. Por ejemplo, de Google "Las personas también buscan ..." ofrece características resultados según la frecuencia con personas que buscan A también buscan B, que ofrece una manera de obtener una vista de pájaro de la industria desde el punto de vista de los clientes:


(enlace al documento grafo de red original)

Este gráfico muestra las conexiones entre los principales jugadores en el mercado de un vistazo. Las historias que se pueden contar el uso de este gráfico son mucho más diversas y asociativo de las historias que se pueden derivar de las hojas de cálculo. Por ejemplo, "las personas que buscan Amazon también la búsqueda de Netflix y Flipcart, que son todas las empresas de comercio electrónico, sino también para Apple, que es un competidor de Microsoft y Apple está conectado a AT & T, que es un proveedor de telecomunicaciones, sólo como Comcast, a través del cual AOL entrega su contenido y las personas que buscan AOL también la búsqueda de Google, que es un motor de búsqueda que ayuda a la gente a encontrar el contenido, como Digg, StumbleUpon y Newswine hacen para las noticias ".

Este tipo de documento da una idea mucho mejor acerca de las conexiones dentro de la industria y ofrece las nuevas ideas que no se derivarían tan fácilmente de las hojas de cálculo convencionales pobladas con los números. Además, varias herramientas de la teoría de grafos se pueden utilizar para proporcionar una representación gráfica más legible, con el fin de identificar grupos de elementos estrechamente relacionados (que están más estrechamente alineados juntos anteriormente usando el diseño de la Fuerza-Atlas) o para identificar los elementos más conectados (tales como Apple y Digg anterior, que se muestran como nodos más grandes en la gráfica, porque están mejor conectados que otros).

Describiendo relaciones : Ricos enlances

Los gráficos de la red en sí mismos proporcionan una muy buena manera de ver el panorama general, una visión general de las relaciones. Sin embargo, hay otro aspecto esencial para redes: las descripciones reales de esas relaciones. Los datos de borde ricos llamadas pueden proporcionar información valiosa sobre la naturaleza de los gráficos de redes y ofrecer instrumentos adicionales para la construcción de relatos basados en la red.

El siguiente ejemplo es una red de los más prominentes políticos rusos, a veces se hace referencia como "sistema". La información para el gráfico proceda de diversas publicaciones, artículos de Wikipedia y los resultados de búsqueda de Google.

Como se puede observar, cada relación se describe con un texto y la mayoría de las relaciones tienen una atribución de la fuente. El gráfico no sólo proporciona una buena descripción de quién es quién en el sistema político de Rusia, pero también explica toda relación, por lo que este gráfico mucho más útil para la investigación y el periodismo de investigación:


(abrir el grafo de la red interactiva de sistema político de Rusia)

Por otra parte, este tipo de "bordes ricos gráfico" se puede utilizar para encontrar rápidamente la información que uno necesita. Por ejemplo, al hacer clic en los dos nodos interconectados "Sergey Shoigu" y "Sergey Lavrov" muestra de forma rápida descripción de la relación entre ellos:






Análisis detallado de grafos de red y formatos abiertos

Un aspecto muy importante de este nuevo aumento de formato gráfico de la red es que es un tipo de un documento XML, lo que hace que sea muy fácil para portarlo entre plataformas e incluso leer en cualquier editor de texto.

Si hay interés para llevar a cabo el análisis un poco más detallado de la red presentado anteriormente, se puede exportar en un formato de archivo .gexf y abrió sus puertas en el análisis de redes profesionales y software de visualización como Gephi:



Con el fin de hacer que el gráfico sea más legible, que oscilaba los nodos por grado (el más es el número de conexiones, cuanto más grande es el nodo en el gráfico) y aplicada diseño Fuerza-Atlas, que empuja los nodos más conectados aparte, mientras que la recolección los nodos más pequeños alrededor de ellos. También aplicamos algoritmo modularidad, que detecta las comunidades en el gráfico, que se indican con colores distintos dentro de la gráfica (nodos que están más densamente conectadas entre sí que con el resto de la red).

El gráfico resultante es un recurso narrativo muy potente, que puede ser utilizado para contar una historia sobre el actual sistema político en Rusia (o incluso revelar cualquier otra conspiración local o global). En el ejemplo anterior, se puede ver claramente que Vladimir Putin construyó una red con varios centros distintos, que están conectados entre sí a través de él, y por la necesidad de trabajar juntos en el gobierno. La alianza dentro de esos grupos es generalmente determinada por las opiniones políticas (conservadores vs liberales) o por la función dentro del gobierno (sector de la energía está en manos de los políticos conservadores, mientras que los sectores de la banca y las finanzas están en manos de los más liberales). También hay un par de grupos que son responsables de las relaciones públicas (secretario de prensa, Dmitry Peskov de Putin y el ministro de Relaciones Exteriores, Sergei Lavrov), así como lo que se llama el equipo de los "proyectos especiales", encabezada por el cardenal gris conocido de la política del Kremlin, Vladislav Surkov (que era uno de los principales arquitectos de la red política actual, y fue responsable de la solución de la pieza con Chechenia y está presuntamente implicado en la lucha actual en Novorossia - parte oriental de Ucrania).
Es interesante que en el sistema del Putin se mantiene la diferencia entre los diferentes centros de influencia a través de poner juntos a la gente de trabajo que a menudo tienen puntos de vista políticos y económicos opuestos. La mayoría de las decisiones relacionadas con el personal en el Kremlin a menudo se basan en el equilibrio de la energía disponible para los conservadores y los liberales.

Otra característica interesante del análisis de redes es la capacidad de detectar los nodos más influyentes en la red: las personas que tienen la más alta centralidad de intermediación que conecta los diferentes grupos de poder juntos. La aplicación de esta medida a la gráfica se obtienen los siguientes resultados:



Se puede observar que tanto Vladimir Putin y su cercano aliado Igor Sechin tienen el poder más de corretaje entre los diferentes grupos. El líder de la oposición principal, Aleksey Navalny, también se ha posicionado bien en la red. Su problema, sin embargo, mientras que Putin es el que negocia algún tipo de paz entre todos los diferentes grupos, Navalny es lugar actuando como un arma que esos grupos utilizan una contra la otra (a través de sus investigaciones contra la corrupción a menudo filtrados de uno de los grupos ), poniéndolo en una posición mucho más arriesgado. Sin embargo, ha sido la postura de Navalny desde el principio que su intención no es la de integrar a sí mismo en el "sistema", pero, en vez de romperlo. Sin embargo, tendría que construir una red diferente, en lugar de la ya existente en primer lugar, con el fin de asegurar el desarrollo futuro después de que el antiguo sistema se desmonta.

Conclusión

En esta revisión, hemos demostrado que los documentos de gráficos de red se pueden servir recursos narrativos como útiles, aumentando los formatos existentes. Los documentos de texto estándar, páginas web HTML y hojas de cálculo están haciendo un buen trabajo en la exhibición de datos cronológicos coherentes. Tan pronto como hay una necesidad de contar una historia de la interconexión y la complejidad, un tipo diferente de documentos y dispositivos de narración son necesarios. Gráficos de red pueden servir muy bien en este sentido: dar una visión general de un determinado campo de la consulta a los detalles concretos para cada relación que es parte de la gran imagen.

Nos gustaría dar las gracias a la IRC y Dor Garbash de Rhizi para inspirar conversaciones sobre estos temas.



Editores de grafos de red


Si usted está interesado en crear sus propios gráficos, pruebe:
• Nodus Labs’ InfraNodus editor de grafos
Linkurio.Us – Neo4J herramienta de vizualización de bases de datos de grafos
Gephi software de análisis de grafos y visualización
Sigma.Js biblioteca para compartir grafos en línea
Rhizi plataforma de grafos colaborativos
Cograph plataforma para compartir grafos
Metamaps herramienta colaborativa para mapear relaciones

No hay comentarios:

Publicar un comentario en la entrada