Mostrando entradas con la etiqueta excentricidad. Mostrar todas las entradas
Mostrando entradas con la etiqueta excentricidad. Mostrar todas las entradas

viernes, 4 de julio de 2014

ARS 101: Centralidad de excentricidad y cercanía

Excentricidad y Cercanía 
Netzwerkerin

Excentricidad y cercanía son medidas de centralidad. La medida de centralidad trata de captar cómo ciertos nodos son importantes para una red determinada. Por definición, cuando una medida de centralidad es más alta, más central es ese nodo de la red. En general, la medida de centralidad concreta que da los resultados más significativos depende del contexto de la red. Aquí le damos la definición de dos medidas de centralidad estrechamente relacionados, la excentricidad y la cercanía.

En muchas aplicaciones, la centralidad de un nodo depende principalmente de su distancia a otros nodos. En algunas aplicaciones, la centralidad de algún nodo v se determina por la distancia máxima, en otros está determinada por la suma de las distancias a los otros nodos. Sin embargo, un nodo es más central si el máximo o la suma de las distancias es pequeña. Para cumplir con la definición de una medida de carácter central, por lo que es necesario tomar la inversa de los dos números. Que ahora distmax (v) denota la distancia máxima  que el nodo v tiene hacia cualquier otro nodo w. Entonces, la excentricidad ecc(v) de nodo v se define como:

ecc (v) = 1/distmax (v).

Análogamente, deje distsum (v) denota la suma de las distancias de v para todos los demás nodos j en la red. Entonces, la estrecha cercanía (v) del nodo v se define como:

close (v) = 1/distsum (v).




Larry, Anna y Rudy tienen las mayores centralidades de excentricidad en esta red

martes, 14 de enero de 2014

ARS 101: Medidas de centralidad (financiera) nuevas

Tutorial 4 - Medidas de centralidad
Por SAMANTHA COOK


Para la próxima entrega de nuestra serie de tutoriales FNA, le mostraremos cómo calcular medidas de centralidad en el FNA. En tutoriales anteriores, junto con la documetación completa se puede encontrar en la página de introducción. En las redes financieras, medidas de centralidad se utilizan a menudo para estimar la importancia sistémica de los bancos u otras instituciones financieras. Como las redes financieras siguen siendo cada vez más interconectado, la identificación de los bancos importantes se vuelve más crucial tanto para los reguladores y los inversores, la definición y la investigación de medidas de centralidad es un área activa de investigación en finanzas y ciencia de las redes.



Centralidad puede ser considerada a nivel de nodo o el nivel de enlace , y por lo general se interpreta como la "conexión " o la importancia de un nodo o enlace. FNA puede calcular todas las métricas de centralidad de uso común , así como algunos otros que están en la vanguardia de la investigación de la red. Nos ilustran estas medidas de centralidad que utilizan la red visualizada abajo [archivo de descarga de arcos] , que se presentó en la visualización de papel Red 2009 por Lothar Krempel .



Medidas de centralidad de nivel de nodo

Promedio de la ruta más corta

Camino más corto promedio de un nodo es la duración media de la ruta más corta desde el nodo a cada otro nodo accesible desde él. La apl comando calcula la ruta más corta media para cada nodo y guarda el resultado como una propiedad de nodo denominado apl . Los nodos con los valores más bajos de APL son más central , por esta medida , ya que pueden llegar a los otros nodos de la red en menos pasos .

Centralidad de intermediación

Intermediación centralidad de un nodo es el número de caminos más cortos dirigidos entre todos los otros pares de nodos que pasan por el nodo dado . El bwc comando calcula la centralidad de intermediación de cada nodo y guarda el resultado como una propiedad de nodo denominado bwc . Los nodos con BWC más altos son más central por esta medida .

Distancia de Ego 

El egodistance comando calcula , para un nodo dado , la distancia a cada otro nodo . Los nodos con distancias ego inferior son más central por esta medida . El nodo cuya distancia ego se calculará se especifica por el parámetro - V seguido de ID del nodo .

Excentricidad

Excentricidad de un nodo es el camino más largo a partir de ese nodo a cualquier otro nodo en la red . Un camino es cualquier ruta entre dos nodos donde ningún nodo es visitado más de una vez . La excentricidad de comando calcula la excentricidad de cada nodo y guarda el resultado en una propiedad de nodo llamado excentricidad . Los nodos con menor excentricidad son más centrales por esta medida.

Centralidad del Vector Propio

La centralidad de vector propio de un nodo es la cantidad esperada de tiempo dedicado a visitar ese nodo en una caminata aleatoria infinita en la red. Sólo se puede calcular para las redes que están fuertemente conectados . El comando evc calcula la centralidad del vector propio de cada nodo y guarda el resultado en una propiedad de nodo llamado evc. Los nodos con mayor centralidad del vector propio son más central por esta medida .

PageRank

PageRank de un nodo es la cantidad esperada de tiempo dedicado a visitar ese nodo en una caminata al azar en la red. El parámetro alfa añade una pequeña probabilidad de moverse entre dos pares de nodos , que permite que la métrica que se calcula incluso para redes que no están conectados firmemente . Cuando alfa es igual a cero , PageRank es igual a la centralidad del vector propio estándar . El comando pagerank calcula el PageRank de cada nodo y guarda el resultado como una propiedad de nodo llamado pagerank. Los nodos con mayor PageRank son más centrales por esta medida.

CheiRank

Un nodo de Chei Rango se calcula primero la transposición de la red ( es decir, invirtiendo la dirección de todos los enlaces dirigidos ) y luego calculando su PageRank . El comando cheirank calcula el Chei Rango de cada nodo y guarda el resultado como una propiedad de nodo llamado cheirank . Los nodos con mayor Chei Fila son más centrales por esta medida.

SinkRank

SinkRank de un nodo es el número medio de pasos necesarios para llegar a ese nodo en una caminata al azar en la red, tratando el nodo dado como sumidero (es decir, la eliminación de todos sus enlaces salientes). Es especialmente útil para medir la importancia sistémica de los bancos en las redes de pago, en los bancos en quiebra pueden ser consideradas como sumideros. El sinkrank calcula el SinkRank de cada nodo y guarda el resultado como una propiedad de nodo llamado sinkrank . Los nodos con menor SinkRank son más centrales por esta medida.

SourceRank

SourceRank de un nodo se calcula primero la transposición de la red y luego calcular su SinkRank. El comando sourcerank calcula el SourceRank de cada nodo y guarda el resultado como una propiedad de nodo llamado sourcerank. Los nodos con menor SourceRank son más centrales por esta medida.

Medidas de centralidad de nivel de nodo ponderadas

Con la excepción de centralidad de intermediación , todas las medidas de centralidad de nivel de nodo tienen una propiedad de peso opcional ; cualquier propiedad de arco numérico se puede utilizar como un peso . La propiedad de peso se proporciona añadiendo el parámetro -p seguido del nombre de la propiedad para el comando. Por ejemplo , con los pesos siempre que el algoritmo de promedio de camino más corto sería calcular la longitud de cualquier ruta de acceso como la suma de los pesos de ese camino en lugar de simplemente el número de pasos . Si no se proporciona un parámetro de peso es equivalente a usar los pesos que son siempre igual a uno.

Los comandos siguientes muestran algunos ejemplos de cálculo de medidas de centralidad ponderados utilizando las dos propiedades del vínculo en el archivo de datos de muestra, strength_uniform y strength_skewed . (Utilice el listap comando para ver todas las propiedades de enlace almacenados en una red. ) El strength_uniform propiedad enlace tiene valores que se distribuyen de manera uniforme en los enlaces , mientras que los valores de strength_skewed hacen más grandes moviéndose de izquierda a derecha en la visualización anterior.

apl - p- strength_uniform guardarcomo apl_uniform
pagerank- p - strength_skewed guardarcomo pagerank_skewed

Medidas de centralidad de nivel de enlace

Centralidad de intermediación

Centralidad de intermediación de un enlace es el número de caminos más cortos dirigidos ( además del propio enlace ) que pasan a través del enlace dado . El bwc comando calcula la centralidad de intermediación de cada enlace (así como cada nodo ) y guarda el resultado como una propiedad de enlace llamado bwc . Vínculos con bwc mayores son más centrales por esta medida.

Guión

Además copie o escriba en la línea de comandos FNA , los comandos se pueden almacenar en un script que se ejecute a la vez. Para crear una secuencia de comandos FNA , haga clic en la pestaña Scripts en la parte derecha de la plataforma FNA , haga clic en la cruz verde a la derecha , a continuación, escriba o pegue los comandos en el cuadro de texto que aparece. Los scripts pueden ser ejecutados con la orden de marcha . Los comandos a continuación el cálculo de los indicadores de centralidad que se describen en este tutorial y crear una visualización.

# load arcs file
loada -file tutorial4_arcs.csv -preserve false

# node-level centrality measures
# the results are by default stored with the name of the command,
# if no -saveas -parameter is given
apl
# bwc calculates link-level betweenness centrality as well
bwc
evc
eccentricity
pagerank
cheirank
sinkrank
sourcerank
# some weighted centrality measures
apl -p strength_uniform -saveas apl_uniform
pagerank -p strength_skewed -saveas pagerank_skewed

# create visualization
viz -vlabel vertex_id -fontsize 30 -vtransparencydefault 0.4 -vsize pagerank -saveas tutorial4_viz

Si guarda estos comandos en un script llamado centralidad , que se pueden ejecutar a la vez con el comando siguiente.

run -file centrality

Visualización

El comando es decir facilita la comparación de los diferentes indicadores de centralidad en una sola red. En la visualización de abajo ( creado desde el comando a saber más arriba) , el tamaño del nodo es proporcional al PageRank . Nodo g , lo que parece menos conectado , tiene de hecho el PageRank más bajo. El nodo d altamente central tiene el más alto PageRank . Para hacer que las etiquetas de nodo más fácil de leer, nos propusimos vtransparencydefault a 0,4 para que los nodos más transparente (su valor por defecto es 0.7) y ajustar tamaño del texto a 30 (el valor predeterminado es 14).



Podemos cambiar de forma interactiva las alturas y anchuras de nodos en la visualización para comparar las propiedades del nodo haciendo clic en la rueda en la parte inferior izquierda de la visualización. En la versión a continuación , la altura del nodo es proporcional al PageRank mientras que la anchura de nodo es proporcional a la centralidad de intermediación . Cuanto menos un nodo tiene la forma de un círculo, más el PageRank e intermediación centralidad de ese nodo difieren . Aquí nodo d tiene un alto PageRank y baja centralidad de intermediación mientras que el nodo e tiene PageRank bajo y alta centralidad de intermediación . Nodos eyf tienen una alta centralidad de intermediación porque todos los caminos entre nodos g y cualquiera de los otros nodos deben pasar a través de ellos , estos nodos no están altamente conectados con la mayor parte de la red , sin embargo , lo que explica su baja PageRank .



Sugerencia : Utilice la visualización interactiva de comparar y PageRank PageRank ponderada (guardado como la propiedad de nodo pagerank_skewed) en esta red. Usted puede ver los valores de los pesos de enlace mediante el establecimiento de la etiqueta de Enlace en el panel Asignaciones de propiedades de la visualización .

Financial Network Analysis

miércoles, 1 de enero de 2014

ARS 101: Más sobre centralidades

C como centralidad(es)

Por Matthew Drevelle - Groupe fmr

Estas notas tienen por objeto definir con la mayor claridad y precisión posible términos claves del análisis de red. Ellos atienden a un público principiante tanto como sea posible y evitar cualquier formalización matemática.

La centralidad de un vértice en un gráfico en vez regresa a la cumbre en comparación con otros vértices. La centralidad de un vértice puede calcularse de varias maneras de responder a diferentes lógicas de centralidad : número de vecinos , la proximidad a otros picos , importante punto de tránsito ...

Las medidas de centralidad del "vecindario"


Una serie de medidas de considerar la centralidad de un vértice con respecto a sus vecinos inmediatos.

La medición de la centralidad más simple es el grado del vértice ( grado ) , es decir, el número de enlaces con la cumbre como final (o el número de vecinos del vértice ) . El grado puede ser entrante, saliente o ponderada ( véase D. como grado para más detalles) . La medición de la información de grado sobre la importancia de un vértice en el gráfico . Una cumbre con un alto grado se consideran centrales , ya que está directamente conectado con el elevado número de vértices del grafo , por lo que tiene potencial de interacciones directas con otros más importantes que un pico que tiene vértices de grado inferior.

La centralidad de Eigenvector (centralidad de autovector) mide un nodo está conectado a otros vértices muy conectado del grafo. Este índice se basa en el principio de que un enlace conectado con un enlace bajamente conectado "vale" menos que una relación con un vértice altamente conectados. Esta es un tipo que es una extensión de la centralidad de grado, en el que el peso depende de los nodos vecinos de su centralidad.

En el grafo de centralidad de grado, la parte superior de color rojo es la más céntrica, tiene 5 vecinos directos. En el grafo de la centralidad del vector propio, la parte superior roja , y en menor medida, las naranjas son picos centrales porque están fuertemente conectados a los vértices conectados firmemente.

La centralidad también se puede medir mediante la identificación de autoridades (authorities) y concentradores. Las autoridades son vértices que tienen un gran número de enlaces entrantes. Los concentradores son vértices que tienen muchos enlaces salientes a las autoridades. Estas medidas se utilizan sobre todo para el ranking de páginas web para los buscadores.

Medidas de centralidad, teniendo en cuenta el conjunto de vértices


La excentricidad de un vértice (eccentricity) es el número de enlaces necesarios para conectarlo al nodo más lejano. Cuanto mayor es la excentricidad, menor es el nodo central.

El índice de Shimbel (Shimbel distance, farness) es la suma de las longitudes de los caminos más cortos para conectar todos los demás vértices. Identifica el pico más central en la identificación de aquellos que están más cerca de los vértices del grafo. La centralidad de la proximidad (proximidad central) es la inversa del índice de Shimbel, que corresponde a la normalización entre 0 y 1 del índice, donde 1 es una centralidad importante. Estos dos índices se utilizan también para medir la accesibilidad en un gráfico (ver A como accesibilidad).


En el gráfico de la excentricidad, la parte superior de color amarillo es el más central. Hay 2 enlaces que deben ir hasta llegar a cualquier vértice de la gráfica de la misma. En el gráfico de la proximidad , los vértices son de color rojo más cercano a los vértices de la gráfica . Vértices amarillas se eliminan en particular de todos los otros picos

La centralidad de intermediación (betweeness centrality) es el número de caminos más cortos a través del gráfico cada vértice. Esta medida también se puede aplicar a los enlaces del grafo. Una alta centralidad de intermediación no está necesariamente correlacionado con una centralidad de grado significativa: un nodo con un grado bajo que une dos grupos de vértices tendrá una alta centralidad de intermediación. Los nodos con alta centralidad de intermediación son "puntos de pasajes importantes" para conectar rápidamente dos vértices del grafo.


En este grafo, la parte superior de color rojo es central. Debido a su posición entre el lado izquierdo y el lado derecho de la gráfica , un gran número de caminos más cortos que pasan a través de la parte superior.