miércoles, 2 de abril de 2014

Usando Gephi para analizar centralidad geográfica

Juguemos con Gephi: Comprendiendo centralidad de grado, de grado ponderado e intermediación
Matthieu Totet - Koumin

Hola a todos,

Hoy voy a tratar de explicar algunas noción clásica cuando usted está buscando en su gráfico. El Grado y Licenciatura ponderado son bastante simples de entender y es casi la base del análisis gráfico. Centralidad betweeness pedir un poco de enfoque mente para entender, pero cuando explique con un ejemplo expresivo, es sencillo !

El conjunto de datos

Me quedo con la relación de los países por las fronteras. Es muy simple y concreto para entender, cambia de la Tradicional « Redes sociales » y el conjunto de datos es lo suficientemente diferentes para ver con claridad el concepto que queremos estudiar.

Por supuesto, los animo y propongo a utilizar el archivo gexf para hacerlo y explorar por ustedes mismos [Archivo Gexf]

Aquí está la cartografía con sólo un poco de visualización de diseño. No tocamos sin embargo, el tamaño de los nodos.



 Grado : Graduame soy famoso.

 

El grado de un nodo es el número de relación (enlace) que tiene, de forma independiente si es una en o una relación fuera. Es la suma de bordes para un nodo. Es idea muy simple de entender.

No tenemos un grado de entrada y grado de salida en nuestro gráfico, es porque tenemos un grafo no dirigido. Estas estadísticas son exactamente los mismos que el Grado, pero « In» contar sólo enlaces entrantes y « Out» cuenta sólo los enlaces salientes.

Para mostrar el tamaño del nodo por grado : Ranking >> Nodos >> Elige un rango de parámetros Grado y haz clic en " Aplicar »


¿Qué quiere decir aquí?


Una relación (borde ) es una frontera entre los 2 países, por lo que si un país tiene un alto grado, que significa que tiene una gran cantidad de países vecinos.

En la cartografía anterior, vemos que Rusia y China son muy grandes, es porque tienen una gran cantidad de países vecinos, 14 para ser exactos.

Grado ponderado: Más grande es mejor


El grado ponderado de un nodo es como el título. Se basa en el número de enlaces para un nodo, pero ponderado por el peso de cada enlace. Se está haciendo la suma del peso de los enlaces.
Por ejemplo, un nodo con 4 bordes que el peso 1 (1 +1 +1 +1= 4) es equivalente a :

  • un nodo con bordes 2 que el peso 2 (2 +2= 4) o
  • un nodo con bordes 2 que el peso 1 y 1 borde que el peso 2 (1 +1 +2= 4) o
  • un nodo con 1 punta que peso 4 etc...

El grado ponderado tiene que ser calculado antes, ir a Estadísticas >> Media. Grado ponderado >> Ejecutar. Después de un tiempo rápido, tendrá el resultado de cálculo y usted será capaz de hacer Clasificacion >> Nodos >> Elija un rango de parámetros Grado >> Grado ponderado y haga clic en « Aplicar »


¿Qué quiere decir aquí?

Usted puede haber notado que algunos bordes son más grandes que otros, es porque en los datos recogidos, el peso del borde representa la longitud de la frontera en kilómetros. Así el grado ponderada aquí es equivalente al número total de kilómetros de frontera para un país.

Aquí, de nuevo a Rusia y China son grandes porque tienen grandes fronteras. Pero si se compara con la cartografía anterior, verá que todos los países europeos eran grandes antes, pero ahora es muy poco. Es porque esos países gozan muy pequeñas fronteras.

Centralidad de intermediación: Maestro de Marionetas

Para visualizar el concepto, se toma todo el camino más corto de todos los nodos a todos los nodos en el gráfico. En cada ruta, si un nodo está recorrida, agrega él « un punto ». Cuando se llevan a cabo todos los caminos, tiene un ranking donde algunos nodos se viajaba mucho y algunos pocos ( casi nunca). Esto describe la centralidad betweeness, si un nodo tiene un número alto, tiene una alta centralidad de intermediación.

Si está navegando en el gráfico, lo más probable viajado nodos que tienen un alto betweeness. Y si se quita tesis nodos primero, hay una alta probabilidad de reducir su gráfico en múltiples componentes conectados.

La centralidad betweeness tiene que ser calculado antes, ir a Estadísticas >> Diámetro Red >> Ejecutar. Después de un tiempo rápido, tendrá el resultado de cálculo y usted será capaz de hacer Clasificacion >> Nodos >> Elija un rango de parámetros Grado >> betweeness Centralidad y haga clic en « Aplicar »


¿Qué quiere decir aquí?

La centralidad de intermediación aquí significa que, si quieres ir de un país a otro, lo más probable es que tenga que viajar a través de los grandes nodos. Lo que se ve es que hay un conjunto de países que son muy «centrales», ya que se están ligando (indirectamente ) a casi todos los países del mundo.

Y si nos fijamos en el caso de Francia, que tiene la mayor centralidad de intermediación. ¿Por qué? Es principalmente debido al hecho de que es el único país que está haciendo el enlace entre América y resto del mundo.


¡Aquí está! Espero haber sido claro en mi explicación y te ha gustado este tutorial.

3 comentarios:

  1. Cómo obtienen los datos geográficos del archivo Gexf? Existe algún programa de georeferenciación del que extraer los datos para su posterior utilización en gephi?

    ResponderEliminar
  2. Muchas gracias, me fue muy útil, saludos desde Colombia.

    ResponderEliminar
  3. Muchas gracias, me fue muy útil, saludos desde Colombia.

    ResponderEliminar