Centralidad de grado y variación en los pesos de los enlaces
Tore Opsahl
La centralidad de los nodos, o la detección e identificación de los nodos centrales en una red, ha sido un tema clave en los estudios de redes. La medida básica de centralidad del nodo es el grado, que se define como el número de conexiones o vínculos que tiene un nodo focal (Freeman, 1978). El grado es un indicador básico y a menudo se usa como primer paso cuando se estudian redes (Wasserman y Faust, 1994). Para describir formalmente esta medida y facilitar la comparación entre las diferentes medidas introducidas en esta publicación, esta medida se puede formalizar para un nodo focal
i como:
donde j representa todos los demás nodos, N es el número total de nodos, y x es la matriz de adyacencia, en la que la celda
se define como 1 si el nodo i está conectado al nodo
j, y 0 en caso contrario.
El grado generalmente se ha extendido a la suma de pesos cuando se analizan redes ponderadas y la fuerza del nodo etiquetado (Barrat et al., 2004). Esta medida se puede formalizar de la siguiente manera:
donde w es la matriz de adyacencia ponderada, en la que
es mayor que 0 si el nodo i está conectado al nodo j, y el valor representa el peso del lazo. Esto es igual a la definición de grado si la red es binaria, es decir, cada vínculo tiene un peso de 1. Por el contrario, en redes ponderadas, los resultados de estas dos medidas son diferentes. Dado que la fuerza del nodo tiene en cuenta los pesos de los lazos, esta ha sido la medida preferida para analizar redes ponderadas (por ejemplo, Barrat et al., 2004; Opsahl et al., 2008).
Grado y fortaleza: dos nodos con la misma fuerza de nodo, pero diferente número de enlaces.
Sin embargo, la fuerza del nodo es una medida contundente, ya que solo tiene en cuenta el nivel total de participación de un nodo en la red, y no el número de otros nodos a los que se conectó. Para ejemplificar esto, el nodo A y el nodo B tienen la misma fuerza, pero el nodo A está conectado a tres veces más nodos que el nodo A y, por lo tanto, está involucrado en más partes de la red. Como el grado y la fuerza pueden ser indicadores del nivel de participación de un nodo en la red circundante, Opsahl et al propusieron una segunda generalización. (2010) que incorporaron tanto el número de empates como la suma de los pesos de empate. Su medida puede formalizarse como:
donde
es un parámetro de ajuste positivo que controla la importancia relativa del número de lazos y la suma de los lazos. Específicamente, hay dos valores de referencia (0 y 1), y si el parámetro se establece en cualquiera de estos valores, se reproduce la medida existente. Si el parámetro se establece en el valor de referencia de 0, los resultados de la medida se basan únicamente en el número de vínculos, y son iguales a los encontrados al aplicar la medida de Freeman (1978) a una versión binaria de una red donde todos los lazos con un peso mayor que 0 están configurados para presentar. Por el contrario, si el valor del parámetro es 1, los resultados de la medida se basan solo en ponderaciones de enlaces y son idénticos a la generalización de grado ya propuesta (Barrat et al., 2004). Para otros valores de
, se obtienen resultados alternativos, que se basan tanto en el número de lazos como en los pesos de los lazos. En particular, se pueden distinguir dos rangos de valores. Primero, un conjunto de parámetros entre 0 y 1 valoraría positivamente tanto el número de enlaces como los ponderadores de enlace. Esto implica que ambos incrementos en el grado y la fuerza del nodo aumentarán el resultado. En segundo lugar, si el valor del parámetro está por encima de 1, las medidas valorarían positivamente la resistencia del enlace y negativamente el número de lazos. Los nodos con un promedio de lazos más fuertes obtendrán una puntuación más alta.
Variación en los pesos de lazos: dos nodos con los mismos puntajes utilizando las medidas de grado de Freeman (1978), Barrat et al. (2004) y Opsahl et al. (2010).
Todas las medidas anteriores son insensibles a la variación en los pesos de corbata. Por ejemplo, los dos nodos, A y B, en este diagrama tienen el mismo número de conexiones, la misma fuerza de nodo y logran el mismo puntaje usando la segunda generalización, ya que es un producto del grado y la fuerza de nodo. Mientras que las medidas de cercanía e intermediación propuestas en Opsahl et al. (2010) son sensibles a la variación en los pesos de lazos, la medida del grado fue diseñada para no ser. Sin embargo, una medida estrechamente relacionada con las medidas de cercanía y entremedio que es sensible a las diferencias de peso puede definirse de la siguiente manera:
Al exponer el peso de la corbata en lugar del peso promedio de la corbata, la medida se vuelve sensible a la variación en los pesos de la corbata. Por ejemplo, el nodo A y el nodo B obtendrían el siguiente puntaje utilizando las diversas medidas:
Medida |
Nodo |
A |
B |
Freeman’s |
2 |
2 |
Barrat et al.’s |
4 |
4 |
Opsahl et al.’s, alpha=0.5 |
2.83 |
2.83 |
Opsahl et al.’s, alpha=1.5 |
5.66 |
5.66 |
New measure, alpha=0.5 |
2.83 |
2.73 |
New measure, alpha=1.5 |
5.66 |
6.20 |
Como se puede ver en la tabla anterior, la nueva medida está estrechamente vinculada a la generalización propuesta por Opsahl et al. (2010); sin embargo, cuando los pesos de lazos son diferentes, la medida varía entre los dos nodos. Del mismo modo que las otras medidas de centralidad que utilizan un parámetro de ajuste, el parámetro de ajuste en estas medidas controla la importancia relativa del número de lazos y la suma de los lazos. Además, también controla si la variación en los pesos de lazo debe descontarse o considerarse favorable. Un parámetro entre 0 y 1 descuentos, mientras que un parámetro superior a 1, aumenta el resultado de la medida cuando los pesos de lazo son diferentes.
¿Quiere probarlo con tus datos?
A continuación se muestra el código para calcular la medida de grado propuesta. Debe tener el paquete tnet instalado antes de ejecutar el código.
.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
# Load tnet
library(tnet)
# Load a function to calculate the new measures
degree2_w <- function (net, type="out", alpha = 1) {
net <- as.tnet(net, type="weighted one-mode tnet")
if (type == "in") {
net <- data.frame(i = net[, 2], j = net[, 1], w = net[,3])
net <- net[order(net[, "i"], net[, "j"]), ]
}
index <- cumsum(!duplicated(net[, 1]))
k.list <- cbind(unique(net[, 1]), NaN, NaN, NaN)
dimnames(k.list)[[2]] <- c("node", "degree", "output", "alpha")
k.list[, "degree"] <- tapply(net[, "w"], index, length)
k.list[, "output"] <- tapply(net[, "w"], index, sum)
net[,"w"] <- net[,"w"]^alpha
k.list[, "alpha"] <- tapply(net[, "w"], index, sum)
if (max(net[, c("i", "j")]) != nrow(k.list)) {
k.list <- rbind(k.list, cbind(1:max(net[, c("i", "j")]), 0, 0, 0))
k.list <- k.list[order(k.list[, "node"]), ]
k.list <- k.list[!duplicated(k.list[, "node"]), ]
}
return(k.list)
}
# Load a sample network
net <- cbind(
i=c(1,1,2,2),
j=c(2,3,1,3),
w=c(2,2,1,3))
# Calculate the measures
degree_w(net, measure=c("degree","output","alpha"), alpha=1.5)
degree_w(net, measure=c("degree","output","alpha"), alpha=0.5)
degree2_w(net, alpha=0.5)
degree2_w(net, alpha=1.5)
|
Referencias
Barrat, A., Barthelemy, M., Pastor-Satorras, R., Vespignani, A., 2004. The architecture of complex weighted networks. Proceedings of the National Academy of Sciences 101 (11), 3747-3752.
Freeman, L. C., 1978. Centrality in social networks: Conceptual clarification. Social Networks 1, 215-239.
Opsahl, T., Agneessens, F., Skvoretz, J. (2010).
Node centrality in weighted networks: Generalizing degree and shortest paths. Social Networks 32, 245-251.
Opsahl, T., Colizza, V., Panzarasa, P., Ramasco, J. J., 2008.
Prominence and control: The weighted rich-club effect. Physical Review Letters 101 (168702).
Wasserman, S., Faust, K., 1994. Social Network Analysis: Methods and Applications. Cambridge University Press, New York, NY.