sábado, 25 de octubre de 2014

Centralidad de cercanía en componentes desconectados

Centralidad de cercanía en redes con componentes desconectados

Una medida centralidad de nodo clave en las redes es proximidad central (Freeman, 1978;. Opsahl et al, 2010; Wasserman y Faust, 1994). Se define como la inversa de la lejanía, que a su vez, es la suma de las distancias a todos los demás nodos. Como la distancia entre los nodos en los componentes desconectados de una red es infinito, esta medida no se puede aplicar a redes con componentes desconectados (Opsahl et al, 2010;. Wasserman y Faust, 1994). Este anuncio pone de relieve una posible solución temporal, lo que permite que la medida se aplique a estas redes y al mismo tiempo mantener la idea original detrás de la medida.

Esta red da un ejemplo concreto de la medida de la cercanía. La distancia entre el nodo G y el nodo H es infinita dado que no existe un camino directo o indirecto entre ellos (es decir, que pertenecen componentes separados). Mientras al menos un nodo es inalcanzable por los otros, la suma de las distancias a todos los otros nodos es infinito. Como consecuencia, los investigadores han limitado la cercanía a medida el componente más grande de nodos (es decir, medido intra-componente). La matriz de distancia para los nodos de la red de la muestra es:
NodosTodos incluidosIntra-componente
ABCDEFGHIJKLejaníaCercaníaLejaníaCercanía
A112233InfInfInfInfInf0120.08
B112123InfInfInfInfInf0100.10
C111222InfInfInfInfInf090.11
D221211InfInfInfInfInf090.11
E212213InfInfInfInfInf0110.09
F322112InfInfInfInfInf0110.09
G332132InfInfInfInfInf0140.07
HInfInfInfInfInfInfInf12InfInf030.33
IInfInfInfInfInfInfInf11InfInf020.50
JInfInfInfInfInfInfInf21InfInf030.33
KInfInfInfInfInfInfInfInfInfInfInf00Inf

Aunque las puntuaciones de proximidad dentro de los componentes no son infinitos para todos los nodos de la red, sería inexacto utilizarlos como medida cercanía. Esto es debido al hecho de que la suma de las distancias contendría un número diferente de trayectorias (por ejemplo, hay dos distancia desde el nodo H a otros nodos en su componente, mientras que hay seis distancias desde el nodo G a otros nodos de su componente). De hecho, los nodos en componentes más pequeños por lo general se considera que estar más cerca de los demás que los nodos de los componentes más grandes. Por lo tanto, los investigadores se ha centrado exclusivamente en el componente más grande. Sin embargo, esto conduce a una serie de cuestiones metodológicas, incluyendo la selección de la muestra.
Para desarrollar esta medida, me fui de nuevo a la ecuación original:
\mbox{closeness}(i) = \sum_j \left[ d_{ij} \right]^{-1} = \frac{1}{\sum_j d_{ij}}
donde i es el nodo focal, j es otro nodo en la red, y d_{ij} es la distancia mas corta entre estos dos nodos. En esta ecuación, las distancias están invertidas después de que se han sumado, y cuando la suma de un número infinito, el resultado es infinito. Para superar este problema durante su estancia en consonancia con la medida existente de cercanía, me aproveché del hecho de que el límite de un número dividido por infinito es cero. A pesar de que el infinito no es un número exacto, el inverso de un número muy alto es muy cercano a 0. De hecho, se devuelve 0 si introduce 1 / Inf en el programa estadístico R. Al tomar ventaja de esta característica, es posible reescribir la ecuación cercanía como la suma de las distancias La Inversa a todos los demás nodos en lugar de la inversa de la suma de las distancias a todos los demás nodos. La ecuación sería entonces:
\mbox{closeness}(i) = \sum_j \frac{1}{d_{ij}}
Para ejemplificar este cambio, para el ejemplo de la red anterior, las distancias inversas y las puntuaciones de proximidad son:
NodesCloseness
ABCDEFGHIJKSumNormalized
A1.001.000.500.500.330.3300003.670.37
B1.001.000.501.000.500.3300004.330.43
C1.001.001.000.500.500.5000004.500.45
D0.500.501.000.501.001.0000004.500.45
E0.501.000.500.501.000.3300003.830.38
F0.330.500.501.001.000.5000003.830.38
G0.330.330.501.000.330.5000003.000.30
H00000001.000.5001.500.15
I00000001.001.00020.20
J00000000.501.0001.500.15
K000000000000

Como puede verse en esta tabla, una puntuación cercanía se alcanza para todos los nodos, teniendo en cuenta un número igual de distancias para cada nodo, independientemente del tamaño del componente de los nodos. Por otra parte, los nodos que pertenecen a un mayor componente generalmente alcanza una puntuación más alta. Esto es deliberado, ya que estos nodos pueden llegar a un mayor número de personas distintas de los nodos en componentes más pequeños. Las puntuaciones normalizadas están unidos entre 0 y 1. Es 0 si un nodo es un aislado, y 1 si un nodo está conectado directamente todos los demás.
Esta medida se puede extender fácilmente a las redes ponderados mediante la introducción (1959) el algoritmo de Dijkstra tal como se propone en la distancia más corta media en redes ponderados.
Referencias
Dijkstra, E. W., 1959. A note on two problems in connexion with graphs. Numerische Mathematik 1, 269-271.
Freeman, L. C., 1978. Centrality in social networks: Conceptual clarification. Social Networks 1, 215-239.
Opsahl, T., Agneessens, F., Skvoretz, J. (2010). Node centrality in weighted networks: Generalizing degree and shortest paths. Social Networks 32, 245-251.
Wasserman, S., Faust, K., 1994. Social Network Analysis: Methods and Applications. Cambridge University Press, New York, NY.

Tore Opsahl

No hay comentarios:

Publicar un comentario