jueves, 23 de junio de 2022

Analizando datos con Graph Commons

Análisis de redes de datos

Burak Arikan


El análisis de datos con métodos visuales lo ayuda a obtener una mejor comprensión de la complejidad. Ya sea que indague en una base de datos filtrada, investigue las interacciones entremezcladas de un ecosistema, administre su organización en red o organice un gran archivo, comienza a dar sentido a un problema complejo al mapear sus actores y relaciones. Como un proceso de pensamiento fundamentalmente humano, el mapeo nos ayuda a navegar vínculos particulares entre los actores mientras vemos los patrones en un panorama más amplio y obtenemos información a lo largo de este viaje. Hemos estado adaptando interfaces y procesos para que esa experiencia sea lo más intuitiva posible en la plataforma Graph Commons.


Comienza analizando un mapa de red examinando su centralidad y métricas de agrupación. La red se organiza a sí misma mediante una simulación basada en la física entre nodos vecinos, jalándose y empujándose unos a otros como resortes. Este proceso de organización del diseño revela los actores centrales y periféricos, los enlaces indirectos, los grupos orgánicos, los nodos puente y los valores atípicos que de otro modo no vería.

Mientras navega por un mapa de red, reconoce visualmente los nodos más conectados a partir de sus líneas de entrada y salida, que establecen conexiones específicas entre partes de la imagen, mientras descartan otras. El tamaño de fuente y círculo indica la importancia relativa de cada nodo. Observa los grupos de nodos estrechamente interconectados. Los nodos puente entre dos o más clústeres se vuelven claramente visibles. Sin embargo, cuando un mapa de red se hace más grande, el nivel de detalle abruma nuestros sentidos. Para examinar y comparar dichas cualidades con precisión, necesita vistas más cuantitativas de los datos contenidos en el grafo.


Red de Sistemas Penales (2013)— Un mapa de red de países vinculados a temas jurídicos ya sea que se ejerzan o no en su derecho.

La interfaz gráfica actual en Graph Commons proporciona una experiencia continua de cambiar de lo particular (un nodo específico y sus relaciones inmediatas) a lo general (ver la red más grande) y viceversa. Creemos que este ciclo te ayuda a crear un marco de referencia útil en tu mente para digerir la complejidad. Para respaldar esta experiencia cualitativa con métodos cuantitativos, hemos desarrollado una nueva característica que simplemente llamamos "Analysis".



De un grafo a una lista, luego a un gráfico

Para obtener un resumen de los nodos más importantes en un gráfico, abra la barra de Análisis, donde verá una lista de los nodos principales ordenados por sus métricas, como el número de conexiones, la centralidad de intermediación y propiedades numéricas como la edad, también como la frecuencia de propiedades nominales como el día de la semana. Desde una lista, abre un gráfico para ver la distribución de todos los nodos por una determinada métrica, lo que proporciona un análisis comparativo de un gráfico de dispersión típico.

Identifique clústeres en su red

Una tarea común de análisis en redes es descubrir los grupos orgánicos o comunidades en base a las conexiones entre los nodos de la red. La idea es encontrar grupos de nodos que tengan más conexiones entre sí que con los extraños.



Mostrando 6 clusters por color identificados en la red

Con la función "Clustering" en la barra de análisis, puede identificar grupos orgánicos en su red. Cuando ejecuta el proceso de agrupamiento, aplica el algoritmo de modularidad de Louvain y encuentra los grupos muy unidos caracterizados por una densidad de vínculos relativamente alta.

Cuando se detectan clústeres, es importante resaltar su importancia dentro de la red más grande. Por lo tanto, se etiquetan automáticamente en función del nodo más conectado del clúster. Sin embargo, le recomendamos encarecidamente que cambie el nombre de estas comunidades usted mismo para resaltar lo que estas comunidades especifican en su red.

La “Red de Sistemas Penales” (visto arriba), es un mapa de red de países en relación con temas jurídicos como cadena perpetua, libertad condicional, sentencia indefinida y amnistía. Al mostrar si estos temas se están ejerciendo o cómo, proporciona una comparación de sanciones a escala entre países y sistemas legales.

Cuando aplicamos el análisis de conglomerados, muestra los siguientes conglomerados, que están etiquetados por el nodo más central dentro de un conglomerado determinado:

  • Países donde la amnistía es otorgada por un presidente
  • Países con cadena perpetua
  • Países donde la solicitud de libertad condicional varía según la sentencia
  • Amnistía por real decreto
  • El cúmulo de la pena de muerte
  • Países donde solicitar libertad condicional es menor de 25 años

La agrupación de estos países y los sistemas de penas están en línea con la distinción de las tradiciones legales. Los países de derecho consuetudinario (desde EE. UU. hasta el Reino Unido y sus antiguas colonias), los países de derecho civil (Europa, América Latina, Asia y más allá) y la combinación de países de derecho civil y religioso (en parte, Oriente Medio y África del Norte ) se encuentran cerca uno del otro en el diagrama de red.

Lista de actores y vínculos importantes

Según el tipo de red, algunos nodos pueden tener posiciones relativamente más importantes que otros. En algunas situaciones, los nodos importantes pueden definirse como centrales para la red cuando tienen muchas conexiones, o como puentes entre dos comunidades. Los nodos puente pueden ser importantes porque su eliminación puede dividir la red en partes o se vuelven demasiado poderosos, ya que son el intermediario del flujo de información entre las comunidades.



Estados Unidos tiene la tasa de encarcelamiento más alta del mundo.

En la barra de análisis, puede enumerar los nodos principales por una propiedad numérica, en este caso, esta es una lista de países por tasas de encarcelamiento (prisioneros por cada 100 000 habitantes). Los datos de este gráfico son de 2013, Estados Unidos tenía la tasa de encarcelamiento más alta del mundo, seguido de Cuba, Rusia, El Salvador, Azerbaiyán y Belice. Los principales países actuales con altas tasas de encarcelamiento no cambiaron drásticamente. Como ves en la captura de pantalla anterior, en la lista puedes hacer clic en un país y resaltarlo para ver sus conexiones.



La cadena perpetua existe en la mayoría de los países. Se hace clic en la penalización de la lista para resaltar sus conexiones/países.

En esta red tiene sentido enumerar las penalizaciones por número de conexiones, ya que podemos conocer las penalizaciones más comunes entre estos países. La “cadena perpetua” es la más común, seguida de la “amnistía del presidente” y la “cadena perpetua por asesinato”. Es bastante preocupante ver que la pena de “Sentencia indefinida” aún se aplica en 49 países del mundo.

Las listas proporcionan un resumen de los nodos más importantes de un gráfico. Al hacer clic en un nodo de la lista, verá dónde se encuentra en la red junto con sus conexiones resaltadas.
 

Comparar distribuciones en gráficos

Cuando está mapeando, a menudo descubre patrones que no sabía que existían antes. Ver la distribución de todos los actores le brinda una vista cuantitativa completa de todos los nodos ordenados por propiedad, para que comprenda mejor qué actores son más importantes que otros según las métricas que elija mirar. Cuando abre un gráfico, ve la distribución de todos los nodos en un gráfico de dispersión, que proporciona un análisis comparativo de los nodos en dos ejes.


Distribución de países por tasa de encarcelamiento. A partir de esta distribución de cabeza gruesa, podemos decir que muchos países tienen altas tasas de encarcelamiento. Para ver los gráficos interactivos, haga clic en el enlace "View in Chart" en la barra de análisis.


La distribución de penalizaciones por grado de centralidad (número de conexiones), que se muestra arriba, sigue ligeramente el típico diagrama de ley de potencia que se observa en las redes sin escala.



La distribución de sanciones por centralidad de intermediación se muestra arriba. Las primeras 2 y las siguientes 4 penalizaciones tienen valores de centralidad de intermediación distintivamente altos, lo que significa que tienen la mayor calidad de puente entre los diferentes grupos.


Arriba se muestra una comparación de las sanciones por grado (eje y) y valores de centralidad de intermediación (eje x). La “prisión perpetua” tiene con diferencia los valores más altos en ambos grados. En general, esta comparación es útil para encontrar valores atípicos, lo que no es realmente el caso en esta red en particular.

El uso de una interfaz híbrida que emplee mapas visuales, listas y gráficos le ayudaría a obtener una visión más profunda al analizar redes complejas.

No hay comentarios:

Publicar un comentario