Mostrando entradas con la etiqueta grado ponderado. Mostrar todas las entradas
Mostrando entradas con la etiqueta grado ponderado. Mostrar todas las entradas

lunes, 9 de diciembre de 2019

Centralidad de grado y variación en los pesos de los enlaces

Centralidad de grado y variación en los pesos de los enlaces

Tore Opsahl




La centralidad de los nodos, o la detección e identificación de los nodos centrales en una red, ha sido un tema clave en los estudios de redes. La medida básica de centralidad del nodo es el grado, que se define como el número de conexiones o vínculos que tiene un nodo focal (Freeman, 1978). El grado es un indicador básico y a menudo se usa como primer paso cuando se estudian redes (Wasserman y Faust, 1994). Para describir formalmente esta medida y facilitar la comparación entre las diferentes medidas introducidas en esta publicación, esta medida se puede formalizar para un nodo focal i como:

donde j representa todos los demás nodos, N es el número total de nodos, y x es la matriz de adyacencia, en la que la celda se define como 1 si el nodo i está conectado al nodo j, y 0 en caso contrario.

El grado generalmente se ha extendido a la suma de pesos cuando se analizan redes ponderadas y la fuerza del nodo etiquetado (Barrat et al., 2004). Esta medida se puede formalizar de la siguiente manera:

donde w es la matriz de adyacencia ponderada, en la que es mayor que 0 si el nodo i está conectado al nodo j, y el valor representa el peso del lazo. Esto es igual a la definición de grado si la red es binaria, es decir, cada vínculo tiene un peso de 1. Por el contrario, en redes ponderadas, los resultados de estas dos medidas son diferentes. Dado que la fuerza del nodo tiene en cuenta los pesos de los lazos, esta ha sido la medida preferida para analizar redes ponderadas (por ejemplo, Barrat et al., 2004; Opsahl et al., 2008).





Grado y fortaleza: dos nodos con la misma fuerza de nodo, pero diferente número de enlaces.


Sin embargo, la fuerza del nodo es una medida contundente, ya que solo tiene en cuenta el nivel total de participación de un nodo en la red, y no el número de otros nodos a los que se conectó. Para ejemplificar esto, el nodo A y el nodo B tienen la misma fuerza, pero el nodo A está conectado a tres veces más nodos que el nodo A y, por lo tanto, está involucrado en más partes de la red. Como el grado y la fuerza pueden ser indicadores del nivel de participación de un nodo en la red circundante, Opsahl et al propusieron una segunda generalización. (2010) que incorporaron tanto el número de empates como la suma de los pesos de empate. Su medida puede formalizarse como:
donde es un parámetro de ajuste positivo que controla la importancia relativa del número de lazos y la suma de los lazos. Específicamente, hay dos valores de referencia (0 y 1), y si el parámetro se establece en cualquiera de estos valores, se reproduce la medida existente. Si el parámetro se establece en el valor de referencia de 0, los resultados de la medida se basan únicamente en el número de vínculos, y son iguales a los encontrados al aplicar la medida de Freeman (1978) a una versión binaria de una red donde todos los lazos con un peso mayor que 0 están configurados para presentar. Por el contrario, si el valor del parámetro es 1, los resultados de la medida se basan solo en ponderaciones de enlaces y son idénticos a la generalización de grado ya propuesta (Barrat et al., 2004). Para otros valores de , se obtienen resultados alternativos, que se basan tanto en el número de lazos como en los pesos de los lazos. En particular, se pueden distinguir dos rangos de valores. Primero, un conjunto de parámetros entre 0 y 1 valoraría positivamente tanto el número de enlaces  como los ponderadores de enlace. Esto implica que ambos incrementos en el grado y la fuerza del nodo aumentarán el resultado. En segundo lugar, si el valor del parámetro está por encima de 1, las medidas valorarían positivamente la resistencia del enlace y negativamente el número de lazos. Los nodos con un promedio de lazos más fuertes obtendrán una puntuación más alta.


Variación en los pesos de lazos: dos nodos con los mismos puntajes utilizando las medidas de grado de Freeman (1978), Barrat et al. (2004) y Opsahl et al. (2010).

Todas las medidas anteriores son insensibles a la variación en los pesos de corbata. Por ejemplo, los dos nodos, A y B, en este diagrama tienen el mismo número de conexiones, la misma fuerza de nodo y logran el mismo puntaje usando la segunda generalización, ya que es un producto del grado y la fuerza de nodo. Mientras que las medidas de cercanía e intermediación propuestas en Opsahl et al. (2010) son sensibles a la variación en los pesos de lazos, la medida del grado fue diseñada para no ser. Sin embargo, una medida estrechamente relacionada con las medidas de cercanía y entremedio que es sensible a las diferencias de peso puede definirse de la siguiente manera:

Al exponer el peso de la corbata en lugar del peso promedio de la corbata, la medida se vuelve sensible a la variación en los pesos de la corbata. Por ejemplo, el nodo A y el nodo B obtendrían el siguiente puntaje utilizando las diversas medidas:
Medida Nodo
A B
Freeman’s 2 2
Barrat et al.’s 4 4
Opsahl et al.’s, alpha=0.5 2.83 2.83
Opsahl et al.’s, alpha=1.5 5.66 5.66
New measure, alpha=0.5 2.83 2.73
New measure, alpha=1.5 5.66 6.20

Como se puede ver en la tabla anterior, la nueva medida está estrechamente vinculada a la generalización propuesta por Opsahl et al. (2010); sin embargo, cuando los pesos de lazos son diferentes, la medida varía entre los dos nodos. Del mismo modo que las otras medidas de centralidad que utilizan un parámetro de ajuste, el parámetro de ajuste en estas medidas controla la importancia relativa del número de lazos y la suma de los lazos. Además, también controla si la variación en los pesos de lazo debe descontarse o considerarse favorable. Un parámetro entre 0 y 1 descuentos, mientras que un parámetro superior a 1, aumenta el resultado de la medida cuando los pesos de lazo son diferentes.

¿Quiere probarlo con tus datos?

A continuación se muestra el código para calcular la medida de grado propuesta. Debe tener el paquete tnet instalado antes de ejecutar el código.

.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
# Load tnet
library(tnet)
# Load a function to calculate the new measures
degree2_w <- function (net, type="out", alpha = 1) {
    net <- as.tnet(net, type="weighted one-mode tnet")
    if (type == "in") {
        net <- data.frame(i = net[, 2], j = net[, 1], w = net[,3])
        net <- net[order(net[, "i"], net[, "j"]), ]
    }
    index <- cumsum(!duplicated(net[, 1]))
    k.list <- cbind(unique(net[, 1]), NaN, NaN, NaN)
    dimnames(k.list)[[2]] <- c("node", "degree", "output", "alpha")
    k.list[, "degree"] <- tapply(net[, "w"], index, length)
    k.list[, "output"] <- tapply(net[, "w"], index, sum)
    net[,"w"] <- net[,"w"]^alpha
    k.list[, "alpha"] <- tapply(net[, "w"], index, sum)
    if (max(net[, c("i", "j")]) != nrow(k.list)) {
        k.list <- rbind(k.list, cbind(1:max(net[, c("i", "j")]), 0, 0, 0))
        k.list <- k.list[order(k.list[, "node"]), ]
        k.list <- k.list[!duplicated(k.list[, "node"]), ]
    }
    return(k.list)
}
# Load a sample network
net <- cbind(
i=c(1,1,2,2),
j=c(2,3,1,3),
w=c(2,2,1,3))
# Calculate the measures
degree_w(net, measure=c("degree","output","alpha"), alpha=1.5)
degree_w(net, measure=c("degree","output","alpha"), alpha=0.5)
degree2_w(net, alpha=0.5)
degree2_w(net, alpha=1.5)

Referencias


Barrat, A., Barthelemy, M., Pastor-Satorras, R., Vespignani, A., 2004. The architecture of complex weighted networks. Proceedings of the National Academy of Sciences 101 (11), 3747-3752.

Freeman, L. C., 1978. Centrality in social networks: Conceptual clarification. Social Networks 1, 215-239.

Opsahl, T., Agneessens, F., Skvoretz, J. (2010). Node centrality in weighted networks: Generalizing degree and shortest paths. Social Networks 32, 245-251.

Opsahl, T., Colizza, V., Panzarasa, P., Ramasco, J. J., 2008. Prominence and control: The weighted rich-club effect. Physical Review Letters 101 (168702).

Wasserman, S., Faust, K., 1994. Social Network Analysis: Methods and Applications. Cambridge University Press, New York, NY.

viernes, 22 de junio de 2018

Centralidad en redes ponderadas

Centralidad de nodo en redes ponderadas

Tore Opsahl


La centralidad de los nodos, o la identificación de qué nodos son más "centrales" que otros, ha sido un tema clave en el análisis de redes (Freeman, 1978; Bonacich, 1987; Borgatti, 2005; Borgatti et al., 2006). Freeman (1978) argumentó que los nodos centrales eran aquellos "en el meollo de las cosas" o puntos focales. Para ejemplificar su idea, utilizó una red que consta de 5 nodos. El nodo medio tiene tres ventajas sobre los otros nodos: tiene más vínculos, puede alcanzar a todos los demás más rápidamente y controla el flujo entre los demás. Con base en estas tres características, Freeman (1978) formalizó tres medidas diferentes de la centralidad del nodo: grado, cercanía e interdependencia. Grado es la cantidad de nodos a los que está conectado un nodo focal y mide la participación del nodo en la red. Su simplicidad es una ventaja: solo debe conocerse la estructura local alrededor de un nodo para que se calcule (p. Ej., Cuando se utilizan datos de la Encuesta social general, McPherson et al., 2001). Sin embargo, existen limitaciones: la medida no toma en consideración la estructura global de la red. Por ejemplo, aunque un nodo podría estar conectado a muchos otros, podría no estar en condiciones de alcanzar a otros rápidamente para acceder a los recursos, como la información o el conocimiento (Borgatti, 2005; Brass, 1984). Para capturar esta característica, la centralidad de cercanía se definió como la suma inversa de las distancias más cortas a todos los demás nodos desde un nodo focal. Una de las principales limitaciones de la cercanía es la falta de aplicabilidad a las redes con componentes desconectados (consulte Centralidad de proximidad en redes con componentes desconectados). La última de las tres medidas, betweenness, evalúa el grado en que un nodo se encuentra en la ruta más corta entre otros dos nodos y puede canalizar el flujo en la red. Al hacerlo, un nodo puede ejercer control sobre el flujo. Si bien esta medida tiene en cuenta la estructura de red global y puede aplicarse a redes con componentes desconectados, no deja de tener sus limitaciones. Por ejemplo, una gran proporción de nodos en una red generalmente no se encuentra en la ruta más corta entre ninguno de los otros dos nodos, y por lo tanto recibe la misma puntuación de 0.

 
Una red de estrella con 5 nodos y 4 enlaces. El tamaño de los nodos corresponde al grado de los nodos. Adaptado de Freeman (1978) y Opsahl et al. (2010).



Las tres medidas se han generalizado a redes ponderadas. En un primer conjunto de generalizaciones, Barrat et al. (2004) grado generalizado tomando la suma de pesos en lugar de los nudos, mientras que Newman (2001) y Brandes (2001) utilizaron el algoritmo de Dijkstra (1959) de caminos más cortos para generalizar la cercanía y la interdependencia a redes ponderadas, respetuosamente (ver Rutas más cortas en Weighted Networks para más detalles). Estas generalizaciones se centraron únicamente en los pesos vinculados e ignoraron la característica original de las medidas: el número de vínculos. Como tal, un segundo conjunto de generalización fue propuesto por Opsahl et al. (2010) que incorpora tanto el número de vínculos como los pesos de enlace utilizando un parámetro de ajuste.

Grado

El grado es la más simple de las medidas de centralidad del nodo al usar la estructura local solo alrededor de los nodos. En una red binaria, el grado es el número de vínculos que tiene un nodo. En una red dirigida, un nodo puede tener un número diferente de enlaces salientes y entrantes, y por lo tanto, el grado se divide en grado y grado, respectivamente.

Por lo general, el grado se ha extendido a la suma de ponderaciones cuando se analizan las redes ponderadas (Barrat et al., 2004; Newman, 2004; Opsahl et al., 2008) y la resistencia del nodo etiquetada. Es igual a la definición tradicional de grado si la red es binaria (es decir, cada vínculo tiene un peso de 1). Por el contrario, en las redes ponderadas, los resultados de estas dos medidas son diferentes. Como la fuerza del nodo toma en consideración el peso de los enlaces, esta ha sido la medida preferida para analizar las redes ponderadas (por ejemplo, Barrat et al., 2004; Opsahl et al., 2008). Sin embargo, la fortaleza del nodo es una medida contundente, ya que solo toma en consideración el nivel total de participación de un nodo en la red, y no toma en cuenta la característica principal de las medidas originales formalizadas por Freeman (1978): el número de vínculos. Esta limitación se destaca por la centralidad de grado de las tres redes de ego de la tercera red EIES de Freeman. Los tres nodos han enviado aproximadamente la misma cantidad de mensajes; sin embargo, a un número bastante diferente de otros. Si se aplicó la medida original de Freeman (1978), el puntaje de centralidad del nodo en el panel A es casi cinco veces más alto que el nodo en el panel C. Sin embargo, al usar la generalización de Barrat et al., Obtienen aproximadamente el mismo puntaje.




Redes Ego de Phipps Arabie (A), John Boyd (B) y Maureen Hallinan (C) de la tercera red EIES de Freeman. El ancho de un enlace corresponde a la cantidad de mensajes enviados desde el nodo focal a sus contactos. Adoptado de Opsahl et al. (2010).


En un intento de combinar el grado y la fuerza, Opsahl et al. (2010) utilizó un parámetro de ajuste para establecer la importancia relativa de la cantidad de vínculos en comparación con los pesos de enlace. Específicamente, la medida de centralidad de grado propuesta fue el producto de la cantidad de nodos a los que está conectado un nodo focal y el peso promedio de estos nodos ajustado por el parámetro de ajuste. Hay dos valores de referencia para el parámetro de ajuste (0 y 1), y si el parámetro se establece en cualquiera de estos valores, se reproducen las medidas existentes (Barrat et al., 2004; Freeman, 1978). Si el parámetro se establece en el valor de referencia de 0, los resultados de las medidas se basan únicamente en el número de vínculos, y son iguales a la encontrada al aplicar la medida de Freeman (1978) a una versión binaria de una red donde todas las los lazos con un peso mayor a 0 se configuran como presentes. Al hacerlo, los pesos vinculados son completamente ignorados. Por el contrario, si el valor del parámetro es 1, la medida se basa solamente en los pesos de empate y es idéntica a la generalización ya propuesta (Barrat et al., 2004). Esto implica que no se tiene en cuenta el número de vínculos. La siguiente tabla destaca las diferencias entre las medidas de grado.
.
Nodo Grado medido por
Freeman (1978) Barrat et al. (2004) Opsahl et al. (2010; alpha=0.5) Opsahl et al. (2010; alpha=1.5)
Phipps Arabie (A) 28 155 66 365
John Boyd (B) 11 188 45 777
Maureen Hallinan (C) 6 227 37 1396

Para calcular las puntuaciones de grado de los nodos, a continuación se muestra un código de muestra para calcular los puntajes de grado de las neuronas del gusano c.elegans (Watts y Strogatz, 1998) utilizando el R-package tnet.
1
2
3
4
5
6
7
8
9
10
11
# Load tnet
library(tnet)
# Load the neural network of the c.elegans network
data(tnet)
# Calculate the out-degree of neurons and the generalised measures (alpha=0.5)
degree_w(net=celegans.n306.net, measure=c("degree","output","alpha"), alpha=0.5)
# Calculate the in-degree of neurons and the generalised measures (alpha=0.5)
degree_w(net=celegans.n306.net, measure=c("degree","output","alpha"), alpha=0.5, type="in")


Cercanía



La cercanía se define como la inversa de la lejanía, que a su vez es la suma de las distancias a todos los demás nodos (Freeman, 1978). La intención detrás de esta medida fue identificar los nodos que podrían llegar a otros rápidamente. Una limitación principal de la cercanía es la falta de aplicabilidad a redes con componentes desconectados: dos nodos que pertenecen a diferentes componentes no tienen una distancia finita entre ellos. Por lo tanto, la cercanía generalmente está restringida a los nodos dentro del componente más grande de una red. La publicación de blog Closeness Centrality in Networks with Disconnected Components sugiere un método para superar esta limitación,

La cercanía se ha generalizado a las redes ponderadas por Newman (2001), que utilizó el algoritmo de Dijkstra (1959) (para obtener más detalles, consulte Trayectos más cortos en Redes ponderadas). Para reiterar rápidamente el trabajo de Dijkstra (1959) y de Newman (2001) aquí:
  1. Dijkstra (1959) propuso un algoritmo para encontrar las rutas más cortas en una red donde los pesos podrían considerarse costos. La ruta menos costosa que conecta dos nodos fue la ruta más corta entre ellos (por ejemplo, una red de carreteras donde cada tramo de carretera tiene un costo de tiempo asignado).
  2. Newman (2001) transformó los pesos positivos en una red de colaboración en costos invirtiéndolos (dividiendo 1 por el peso).
  3. Sobre la base de los pesos invertidos, Newman (2001) aplicó el algoritmo de Dijkstra y encontró los caminos menos costosos entre todos los nodos.
  4. El costo total de las rutas de un nodo a todos los demás fue una medida de lejanía: cuanto mayor es el número, más cuesta que un nodo llegue a todos los otros nodos. Para crear una medida de proximidad, Newman (2001) siguió a Freeman (1978) e invirtió los números (1 dividido por la lejanía). Por lo tanto, una alta lejanía se transformó en una baja cercanía, y una baja lentitud se transformó en una gran cercanía.

De forma similar a la generalización de grado de Barrat et al. (2004), el algoritmo generalizado de Newman (2001) se centra únicamente en la suma de ponderaciones de relación y no tiene en cuenta la cantidad de vínculos en las rutas. Opsahl et al. (2010) la generalización de las rutas más cortas se puede aplicar para determinar la longitud de ellas.

Para calcular las puntuaciones de cercanía de los nodos, a continuación se muestra un código de muestra para calcular los puntajes de cercanía de las neuronas del gusano c.elegans (Watts y Strogatz, 1998) utilizando el paquete de R tnet.




.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# Load tnet
library(tnet)
# Load the neural network of the c.elegans network
data(tnet)
# Calculate the binary closeness scores
closeness_w(net=celegans.n306.net, alpha=0)
# Calculate the first generation weighted closeness scores
closeness_w(net=celegans.n306.net, alpha=1)
# Calculate the second generation weighted closeness scores (alpha=0.5)
closeness_w(net=celegans.n306.net, alpha=0.5)

Intermediación

La medida en que un nodo forma parte de las transacciones entre otros nodos se puede estudiar utilizando la medida de interdependencia de Freeman (1978). En la red de muestra de la derecha, si los enlaces no tenían un peso asignado, las líneas grises intermitentes representan las 9 rutas más cortas de la red que pasan por nodos intermedios. El nodo resaltado es un intermedio en 8 de estas rutas. Esto le dará a este nodo una puntuación de interinidad de 8.



Brandes (2001) propuso un nuevo algoritmo para calcular la interrelación más rápido. Además de reducir el tiempo, este algoritmo también relajó la suposición de que los vínculos debían estar presentes o ausentes (es decir, una red binaria) y permitió que se calculase la interdependencia en redes ponderadas (tenga en cuenta que esta generalización es independiente de la medida de flujo propuesta por Freeman et al., 1991, que podría ser más apropiado en ciertos entornos). Esta generalización tiene en cuenta que, en las redes ponderadas, la transacción entre dos nodos podría ser más rápida a lo largo de las rutas con más nodos intermedios que están fuertemente conectados que las rutas con menos nodos intermedios débilmente conectados. Esto se debe al hecho de que los nodos intermedios fuertemente conectados tienen, por ejemplo, un contacto más frecuente que los conectados débilmente. Por ejemplo, el vínculo entre el nodo superior izquierdo y el nodo focal en la red de muestra anterior tiene cuatro veces la fuerza del enlace entre el nodo inferior izquierdo y el nodo focal. Esto podría significar que el nodo superior izquierdo tiene contacto más frecuente con el nodo focal que el nodo inferior izquierdo. A su vez, esto podría implicar que el nodo superior izquierdo podría dar al nodo focal una información (o una enfermedad) cuatro veces más rápido que el nodo inferior izquierdo. Si estamos estudiando los nodos que con mayor probabilidad canalizan información o enfermedades en una red, entonces la velocidad a la que viaja y las rutas que lleva se ven claramente afectadas por los pesos. La identificación de las rutas más cortas en redes ponderadas también se puede utilizar al identificar los nodos que canalizan transacciones entre otros nodos en redes ponderadas. Si suponemos que las transacciones en una red ponderada siguen las rutas más cortas identificadas por el algoritmo de Dijkstra en lugar de la que tiene el menor número de nodos intermedios, entonces el número de rutas más cortas que pasan por un nodo podría cambiar.

.
Nodo Medida de intermediación de
Freeman (1978) Brandes (2001) Opsahl et al. (2010; alpha=0.5)
1 0 4 0
2 8 8 8
3 0 0 0
4 0 0 0
5 4 4 4
6 0 0 0


Ahora, el nodo 1 (A) también obtuvo una puntuación de interdependencia de 4. Esto se debe a que se usa la ruta indirecta desde el nodo B al nodo C hasta A en lugar de la conexión directa.

De forma similar a la generalización de proximidad de Newman (2001), el algoritmo generalizado de Brandes (2001) se centra únicamente en la suma de ponderaciones de relación y no tiene en cuenta la cantidad de vínculos en las rutas. Opsahl et al. (2010) la generalización de las rutas más cortas también puede aplicarse para identificarlas.

Para calcular las puntuaciones de interdete de los nodos, a continuación se muestra un código de muestra para producir las tres tablas anteriores utilizando el paquete de R de tnet.
.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# Manually enter the example network
net <- cbind(
i=c(1,1,2,2,2,2,3,3,4,5,5,6),
j=c(2,3,1,3,4,5,1,2,2,2,6,5),
w=c(4,2,4,1,4,2,2,1,4,2,1,1))
# Calculate the binary betweenness measure
betweenness_w(net, alpha=0)
# Calculate the first generation weighted betweenness measure
betweenness_w(net, alpha=1)
# Calculate the first generation weighted betweenness measure
betweenness_w(net, alpha=0.5)

 Nota: La implementación del algoritmo de Brandes (2001) encuentra múltiples rutas si tienen exactamente la misma distancia. Por ejemplo, si se encuentra un camino sobre el empate directo con un peso de 1 (distancia = 1/1 = 1) y un segundo camino es a través de un nodo intermediario con dos empates con pesos de 2 (distancia = 1/2 + 1 / 2 = 1), las dos rutas tienen exactamente la misma distancia. Sin embargo, si hay un tercer camino a través de dos intermediarios con tres vínculos con pesos de 3 (distancia = 1/3 + 1/3 + 1/3), no es exactamente igual a 1 ya que las computadoras leen estos valores como 0.3333333 y la suma de estos valores es 0.9999999. Por lo tanto, esta ruta se considera más corta que las otras dos rutas (distancia = 1).

Referencias

Barrat, A., Barthelemy, M., Pastor-Satorras, R., Vespignani, A., 2004. The architecture of complex weighted networks. Proceedings of the National Academy of Sciences 101 (11), 3747-3752. arXiv:cond-mat/0311416
Brandes, U., 2001. A Faster Algorithm for Betweenness Centrality. Journal of Mathematical Sociology 25, 163-177.
Dijkstra, E. W., 1959. A note on two problems in connexion with graphs. Numerische Mathematik 1, 269-271.
Freeman, L. C., 1978. Centrality in social networks: Conceptual clarification. Social Networks 1, 215-239.
Freeman, L. C., Borgatti, S. P., White, D. R., 1991. Centrality in valued graphs: A measure of betweenness based on network flow. Social Networks 13 (2), 141-154.
Newman, M. E. J., 2001. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality. Physical Review E 64, 016132.
Opsahl, T., Agneessens, F., Skvoretz, J. (2010). Node centrality in weighted networks: Generalizing degree and shortest paths. Social Networks 32, 245-251. 

domingo, 30 de julio de 2017

La topología de las redes ponderadas

La arquitectura de las redes ponderadas complejas

A. Barrat *, M. Barthélemy †, R. Pastor-Satorras ‡, y A. Vespignani *, §
afiliaciones de autor

Comunicado por Giorgio Parisi, Universidad de Roma, Roma, Italia, 8 de enero de 2004 (recibido para revisión el 29 de octubre de 2003)

PNAS

ResumenLas estructuras en red surgen en una amplia gama de contextos diferentes, tales como las infraestructuras tecnológicas y de transporte, los fenómenos sociales y los sistemas biológicos. Estos sistemas altamente interconectados han sido recientemente el foco de una gran atención que ha descubierto y caracterizado su complejidad topológica. Junto con una compleja estructura topológica, las redes reales muestran una gran heterogeneidad en la capacidad e intensidad de las conexiones. Sin embargo, estas características no se han considerado principalmente en estudios anteriores en los que los enlaces se representan normalmente como estados binarios, es decir, presentes o ausentes. Aquí estudiamos la red de colaboración científica y la red mundial de transporte aéreo, que son ejemplos representativos de sistemas sociales y de grandes infraestructuras, respectivamente. En ambos casos es posible asignar a cada enlace del grafo un peso proporcional a la intensidad o capacidad de las conexiones entre los diversos elementos de la red. Definimos métricas apropiadas que combinan observables ponderados y topológicos que nos permiten caracterizar las propiedades estadísticas complejas y la heterogeneidad de la resistencia real de enlaces y vértices. Esta información nos permite investigar las correlaciones entre las cantidades ponderadas y la estructura topológica subyacente de la red. Estos resultados proporcionan una mejor descripción de las jerarquías y principios organizativos en la base de la arquitectura de redes ponderadas.
Un gran número de sistemas naturales y artificiales se estructuran en forma de redes. Ejemplos típicos son los grandes sistemas de comunicación (Internet, red telefónica, World Wide Web), las infraestructuras de transporte (rutas ferroviarias y aéreas), los sistemas biológicos (redes de interacción de genes y / o proteínas) y una variedad de estructuras de interacción social -3). Las propiedades macroscópicas de estas redes han sido objeto de intensa actividad científica que ha puesto de manifiesto la aparición de una serie de características topológicas significativas. Específicamente, muchas de estas redes muestran la propiedad del mundo pequeño (4), lo que implica que la red tiene una distancia topológica media entre los distintos nodos que aumenta muy lentamente con el número de nodos (logarítmica o incluso más lenta), a pesar de mostrar un alto grado De interconexión local típica de los retículos más ordenados. Adicionalmente, varias de estas redes se caracterizan por una abundancia estadística de "hubs" con un número muy grande de conexiones k comparadas con el valor medio grado Formula. La evidencia empírica recogida a partir de datos reales indica que esta característica distintiva encuentra su caracterización estadística en presencia de distribuciones de grados libres de escala P (k), es decir, mostrando un comportamiento de potencia-ley P (k) ~ k -γ para un rango significativo De valores de k (5). Estas características topológicas resultan ser extremadamente relevantes porque tienen un fuerte impacto en la evaluación de las propiedades físicas de estas redes como su robustez o vulnerabilidad (6-9).
Si bien estas conclusiones por sí solas pueden proporcionar una visión para el análisis de amenazas y las decisiones de política, las redes se especifican no sólo por su topología, sino también por la dinámica de la información o el flujo de tráfico que tiene lugar en la estructura. En particular, la heterogeneidad en la intensidad de las conexiones puede ser muy importante en la comprensión de los sistemas sociales. Análogamente, la cantidad de tráfico que caracteriza las conexiones en los sistemas de comunicación y las grandes infraestructuras de transporte es fundamental para una descripción completa de estas redes.
Motivados por estas observaciones, emprendemos en este trabajo el análisis estadístico de redes complejas cuyos enlaces se han asignado a un peso dado (el flujo o la intensidad) y por lo tanto pueden describirse generalmente en términos de grafos ponderados (10, 11). Trabajando con dos ejemplos típicos de este tipo de red, introducimos algunas métricas que combinan de forma natural tanto la topología de las conexiones como el peso que se les asigna. Estas cantidades proporcionan una caracterización general de las propiedades estadísticas heterogéneas de pesos e identifican definiciones alternativas de centralidad, cohesividad local y afinidad. Mediante mediciones apropiadas también es posible explotar la correlación entre los pesos y la estructura topológica del grafo, revelando la arquitectura compleja mostrada por redes ponderadas reales.

Datos de redes ponderadas

Para proceder al análisis general de las redes ponderadas complejas consideramos dos ejemplos específicos para los cuales es posible tener una caracterización completa de los enlaces entre los elementos de los sistemas, la red mundial de aeropuertos (WAN) y la red de colaboración científica SCN).

WAN. Analizamos la base de datos de la Asociación Internacional de Transporte Aéreo (www.iata.org) que contiene la lista mundial de pares de aeropuertos conectados por vuelos directos y el número de plazas disponibles en cualquier conexión para el año 2002. El grafo de transporte aéreo resultante comprende N = 3.880 vértices denota aeropuertos y E = 18.810 enlaces que representan la presencia de una conexión de vuelo directo. El grado medio de la red es  Formula, mientras que el grado máximo es 318. La topología del grafo muestra tanto las propiedades del mundo pequeño como las sin escalas, como ya se observó en diferentes análisis de conjuntos de datos (12, 13). En particular, la longitud media de la trayectoria más corta, medida como el número medio de aristas que separa cualquier dos nodos de la red, muestra el valor Formula, muy pequeño comparado con el tamaño de la red N. La distribución del grado toma la forma P(k) = k  f(k/k x), donde γ ≅ 2.0 y f(k/k x) es una función de corte exponencial que encuentra su origen en restricciones físicas sobre el número máximo de conexiones que un solo aeropuerto puede manejar (3, 13 ). Por lo tanto, el gráfico de conexión al aeropuerto es un ejemplo claro de una red con una distribución heterogénea de grados, que muestra propiedades libres de escala en una amplia gama de valores de grado.

SCN. Consideramos la red de científicos que han escrito manuscritos enviados al Archivo de e-Print en relación con la física de la materia condensada (http://xxx.lanl.gov/archive/cond-mat) entre 1995 y 1998. Los científicos están identificados con nodos, Y existe una ventaja entre dos científicos si han coautorizado al menos un trabajo. La red conectada resultante tiene N = 12.722 nodos, con un grado medio (es decir, número medio de colaboradores Formula) y grado máximo 97. Las propiedades topológicas de esta red y otras redes similares de colaboraciones científicas han sido estudiadas en refs. 14-16.

Las propiedades de un grafo pueden ser expresadas por su matriz de adyacencia a ij, cuyos elementos toman el valor 1 si un enlace conecta el vértice i con el vértice j y 0 en caso contrario. Los datos contenidos en los conjuntos de datos anteriores permiten ir más allá de esta representación topológica definiendo un gráfico ponderado (10) que asigna un peso o valor que caracteriza cada enlace de conexión. En el caso de la WAN, el peso w ij de un enlace que une los aeropuertos iyj representa el número de asientos disponibles en los vuelos entre estos dos aeropuertos. La inspección de los pesos muestra que el número medio de asientos en ambas direcciones es idéntico w ij = w ji para una abrumadora mayoría de enlaces. En lo sucesivo trabajaremos con el gráfico simétrico no dirigido y evitaremos la complicación derivada de los desequilibrios de flujo. Se muestra un ejemplo del gráfico ponderado resultante en la Fig. 1. Es evidente que la definición anterior de pesos es una medida directa y objetiva del flujo de tráfico en la parte superior de la red.


Figura. 1.
Representación gráfica del grafo ponderado obtenido de los datos de la red aeroportuaria. Los principales aeropuertos de los Estados Unidos están conectados por enlaces que indican la presencia de un vuelo sin escalas en ambas direcciones cuyos pesos representan el número de asientos disponibles (millones / año).

Para el SCN seguimos la definición de peso introducida en refs. 14 y 15: La intensidad w ij  de la interacción entre dos colaboradores i y j se define como
Formula
Donde el índice p corre sobre todos los papeles, n p es el número de autores de papel p, y Formula es 1 si el autor i ha contribuido al papel p y 0 de lo contrario. Si bien cualquier definición de la intensidad de una conexión en las redes sociales depende de los elementos particulares elegidos para ser relevantes, la definición anterior parece ser más objetiva y representativa de la interacción científica: Es grande para los colaboradores que tienen muchos documentos en común, Al peso introducido por cualquier papel dado es inversamente proporcional al número de autores.

Centralidad y ponderaciones

Para tener en cuenta la información proporcionada por el grafo ponderado, identificaremos las cantidades apropiadas que caracterizan su estructura y organización a nivel estadístico. El análisis estadístico de los pesos w ij entre pares de vértices indica la presencia de distribuciones asimétricas hacia la derecha, ya señalando un alto nivel de heterogeneidad en el sistema tanto para la WAN como para el SCN como también se indica en refs. 12, 14 y 15. Sin embargo, se ha observado que los ponderadores de los enlaces individuales no proporcionan una imagen general de la complejidad de la red (11). Una medida más significativa de las propiedades de la red en términos de los pesos reales se obtiene extendiendo la definición del grado de vértice k i = Σj a ij en términos de la fuerza de vértice s i,, definida como
Formula

Esta cantidad mide la fuerza de los vértices en términos del peso total de sus conexiones. En el caso de la WAN, la intensidad de los vértices simplemente explica el tráfico total manejado por cada aeropuerto. Por el contrario, la fuerza es una medida de la productividad científica porque es igual al número total de publicaciones de cualquier científico dado, excluyendo las publicaciones de autor único. Esta cantidad es una medida natural de la importancia o centralidad de un vértice i en la red.

La identificación de los nodos más centrales del sistema es un problema importante en la caracterización de la red (17). La medida topológica más intuitiva de la centralidad viene dada por el grado: los nodos más conectados son más centrales. Sin embargo, más no es necesariamente mejor. De hecho, al considerar únicamente el grado de un nodo, hacemos caso omiso de que los nodos de grado pequeño pueden ser cruciales para conectar diferentes regiones de la red actuando como puentes. Para determinar cuantitativamente el papel de estos nodos, se ha definido la centralidad de intermediación (14, 15, 17, 18) como el número de trayectos más cortos entre pares de vértices que pasan a través de un vértice dado. Los nodos centrales son por lo tanto parte de los más cortos Dentro de la red que los nodos periféricos. Además, la centralidad de intermediación se utiliza a menudo en las redes de transporte para proporcionar una estimación del tráfico manejado por los vértices, suponiendo que el número de trayectos más cortos es una aproximación de orden cero a la frecuencia de uso de un nodo dado. De centralidad se basa sólo en elementos topológicos. Por lo tanto, es intuitivo considerar la definición alternativa de centralidad construida considerando la fuerza s i de los vértices como una definición más apropiada de la importancia de un vértice en redes ponderadas. Por ejemplo, en el caso de la WAN, esta cantidad proporciona el tráfico real que atraviesa el vértice i, y es natural estudiar cómo se compara y correlaciona con otras medidas topológicas de centralidad.

La distribución de probabilidad P(s) de que un vértice tiene fuerza s es pesada en ambas redes, y el comportamiento funcional presenta similitudes con la distribución de grados P(k) (ver Fig. 2). Una descripción funcional precisa de las distribuciones de cola pesada puede ser muy importante para entender la evolución de la red y será diferida para un análisis futuro. Este comportamiento no es inesperado porque es plausible que la fuerza s i aumente con el grado de vértice k i y, por lo tanto, la lenta cola decadente de P(s) deriva directamente de la muy lenta decadencia de la distribución de grados. Para arrojar más luz sobre la relación entre la fuerza y ​​el grado de los vértices, investigamos la dependencia de s i en k i. Encontramos que la fuerza media s(k) de vértices con grado k aumenta con el grado como
Formula


Fig.2. (A) Grado (inserción) y distribución de la fuerza en el SCN. El grado k corresponde al número de coautores de cada científico, y la fuerza s representa el número total de publicaciones del científico. Las distribuciones son de cola pesada incluso si no es posible distinguir una forma funcional definida. (B) Las mismas distribuciones para la WAN. El grado k (inserto) es el número de conexiones sin escalas a otros aeropuertos, y la fuerza s es el número total de pasajeros manejados por cualquier aeropuerto dado. En este caso, la distribución del grado puede ser aproximada por el comportamiento de la ley de potencia P(k) ∼ k   con γ = 1.8 ± 0.2. La distribución de la fuerza tiene una pesada cola que se extiende más de cuatro órdenes de magnitud.

En ausencia de correlaciones entre el peso de los bordes y el grado de vértices, los pesos w ij  son en promedio independientes de i y j, por lo que podemos aproximar Formula, donde Formula es el ponderador promedio en la red. De la ecuación 2 entonces tenemos Formula. Es decir, la fuerza de un vértice es simplemente proporcional a su grado, dando un exponente β = 1, y las dos cantidades proporcionan por lo tanto la misma información sobre el sistema. En la Fig. 3 se presenta el comportamiento obtenido tanto para las redes ponderadas reales como para sus versiones aleatorias, generadas por una redistribución aleatoria de los pesos reales sobre la topología existente de la red. Para el SCN las curvas son muy similares y bien ajustadas por la fuerza de aproximación no correlacionada Formula . Curiosamente, este no es el caso de la WAN. La Fig. 3B muestra claramente un comportamiento muy diferente para el conjunto de datos reales y su versión aleatoria. En particular, el ajuste de potencia-ley para los datos reales da un exponente "anómalo" βWAN = 1,5 ± 0,1. Este valor implica que la resistencia de los vértices crece más rápidamente que su grado, es decir, el peso de los bordes que pertenecen a vértices altamente conectados tiende a tener un valor mayor que el correspondiente a una asignación aleatoria de pesos. Esta tendencia denota una fuerte correlación entre el peso y las propiedades topológicas en la WAN, donde cuanto más grande es un aeropuerto, más tráfico puede manejar.


Fig. 3. La fuerza media s (k) en función del grado k de los nudos. (A) En el SCN los datos reales son muy similares a los obtenidos en una red ponderada al azar. Sólo a valores k muy grandes es posible observar una ligera desviación del comportamiento lineal esperado. (B) En la WAN los datos reales siguen un comportamiento de ley de potencia con exponente β = 1,5 ± 0,1. Este valor denota correlaciones anómalas entre el tráfico manejado por un aeropuerto y el número de sus conexiones.

La huella dactilar de estas correlaciones también se observa en la dependencia del peso w ij en los grados de los nudos finales k i y k j. Como podemos ver en la Fig. 4, para la WAN el comportamiento del peso medio en función de los grados de punto final puede ser bien aproximado por una dependencia de la ley de potencia
Formula



Fig.4. Peso medio en función del grado de punto final. La línea continua corresponde a una fórmula de comportamiento potencia-ley, con exponente θ = 0,5 ± 0,1. En el caso del SCN es posible observar un comportamiento casi plano para aproximadamente dos órdenes de magnitud.

Con un exponente θ = 0,5 ± 0,1. Este exponente puede estar relacionado con el exponente β al notar que Formula, resultando en β = 1 + θ, si las correlaciones topológicas entre los grados de vértices conectados pueden ser descuidadas. Éste es precisamente el caso de la WAN, donde la relación de escalamiento anterior está bien satisfecha por los valores numéricos proporcionados por las mediciones independientes de los exponentes. En el SCN, en cambio, la fórmula es casi constante durante más de dos décadas, lo que confirma una falta general de correlaciones entre los pesos y los grados de vértice.

Análogamente, un estudio del valor medio s (b) de la fuerza para vértices con intermedios b muestra que el comportamiento funcional puede ser aproximado por una forma de escala  s(b) ∼ b δ  con δSCN ≅ 0.5 y δWAN ≅ 0.8 para el SCN Y la WAN, respectivamente. Como antes, la comparación entre el comportamiento de los datos reales y el caso aleatorizado muestra diferencias más pronunciadas en el caso de la WAN. En ambas redes, la fuerza crece con la intermediación más rápido que en el caso aleatorio, especialmente en la WAN. Este comportamiento es otra clara firma de las correlaciones entre las propiedades ponderadas y la topología de red.

Organización estructural de redes ponderadas

Junto con la jerarquía de vértices impuesta por la distribución de la fuerza, mayores son las redes más centrales y complejas que muestran una arquitectura impuesta por la organización estructural y administrativa de estos sistemas. Por ejemplo, las áreas temáticas y las estructuras nacionales de investigación dan lugar a grupos o comunidades bien definidos en el SCN. En la WAN, por otra parte, las diferentes jerarquías corresponden a grupos aeroportuarios nacionales o regionales y sistemas de transporte intracontinental; Factores políticos o económicos pueden imponer restricciones adicionales a la estructura de la red (13). Para descubrir estas estructuras, algunas cantidades topológicas se estudian habitualmente. El coeficiente de agrupación mide la cohesividad del grupo local y se define para cualquier vértice i como la fracción de vecinos conectados de i (4). El coeficiente de agrupamiento promedio C = N -1Σi c i expresa así el nivel estadístico de cohesividad que mide la densidad global de trillizos de vértices interconectados en la red. Se puede obtener más información inspeccionando el coeficiente de agrupamiento promedio C (k) restringido a clases de vértices con grado k. En redes reales (20, 21), C (k) presenta un comportamiento altamente no trivial con un decaimiento de la ley de potencia en función de k, señalando una jerarquía en la que los vértices de grados bajos pertenecen generalmente a comunidades bien interconectadas (alto coeficiente de agrupación) Mientras que los concentradores conectan muchos vértices que no están conectados directamente (coeficiente de agrupación pequeño) (20, 21). Otra cantidad utilizada para investigar la arquitectura de las redes es el grado medio de vecinos más cercanos, k nn (k), para vértices de grado k (22). Esta última cantidad está relacionada con las correlaciones entre el grado de vértices conectados (22, 23), ya que puede expresarse como k nn(k) = Σk kP(k′|k), donde P(k′|k) es la probabilidad condicional de que un vértice dado con grado k esté conectado a un vértice de grado k'. En ausencia de correlaciones de grados, P(k′|k) no depende de k y tampoco el grado medio de vecinos más cercano; Es decir, k nn(k) = constante (22). En presencia de correlaciones, el comportamiento de k nn(k) identifica dos clases generales de redes. Si k nn(k) es una función creciente de k, los vértices de alto grado tienen una probabilidad mayor de estar conectados con vértices de gran envergadura. Esta propiedad se conoce en física y ciencias sociales como mezclas asortativas (24). Por el contrario, un comportamiento decreciente de k nn(k) define la mezcla desasortativas, en el sentido de que los vértices de alto grado tienen una mayoría de vecinos con grado bajo, mientras que lo contrario ocurre para los vértices de bajo grado.

Las cantidades anteriores proporcionan firmas claras de una organización estructural de redes en las que diferentes clases de grado muestran diferentes propiedades en la estructura de conectividad local. Sin embargo, se definen únicamente en términos topológicos, y la inclusión de pesos y sus correlaciones puede cambiar constantemente nuestra visión de la organización jerárquica y estructural de la red. Esto se puede comprender fácilmente con el ejemplo simple de una red en la que los pesos de todos los bordes que forman triples de vértices interconectados son extremadamente pequeños. Incluso para un gran coeficiente de agrupación, es evidente que estos triples tienen un papel menor en la dinámica de la red y la organización, y que las propiedades de agrupamiento son definitivamente sobrestimado por un simple análisis topológico. De manera similar, los vértices de alto grado podrían estar conectados a una mayoría de vértices de bajo grado mientras que concentran la mayor fracción de su fuerza solamente en los vértices con alto grado. En este caso, la información topológica apunta a propiedades desasistidas, mientras que la red podría considerarse asortativa de manera efectiva, porque los bordes más relevantes en términos de pesos están enlazando vértices de alto grado.

Para resolver las incongruencias anteriores se introducen métricas que combinan la información topológica con la distribución de peso de la red. En primer lugar, consideramos que el coeficiente de agrupamiento ponderado definido como (véase la Fig. 5)
Formula


Fig. 5.Ejemplos de configuraciones locales cuyas cantidades topológicas y ponderadas son diferentes. En ambos casos el vértice central (lleno) tiene un enlace muy fuerte con sólo uno de sus vecinos. El agrupamiento ponderado y el grado medio de vecinos más cercanos capturan con mayor precisión el nivel efectivo de cohesividad y afinidad debido a la fuerza de interacción real.

Este coeficiente es una medida de la cohesión local que tiene en cuenta la importancia de la estructura agrupada sobre la base de la cantidad de tráfico o intensidad de interacción realmente encontrada en los trillizos locales. De hecho, Formula cuenta para cada triplete formado en la vecindad del vértice i el peso de los dos bordes participantes del vértice i. De esta manera, consideramos no sólo el número de trillizos cerrados en el vecindario de un vértice sino también su peso relativo total con respecto a la fuerza del vértice. El factor de normalización si(k i - 1) explica el peso de cada borde multiplicado por el número máximo posible de tripletes en los que puede participar, y asegura que la Formula. Consistentemente, la definición de Formula recupera el coeficiente de agrupamiento topológico en el caso de que w ij = constante. A continuación, definimos Cw y Cw (k) como el coeficiente de agrupación ponderada promediado sobre todos los vértices de la red y sobre todos los vértices con grado k, respectivamente. Estas cantidades proporcionan información global sobre la correlación entre pesos y topología, especialmente comparándolos con sus análogos topológicos. En el caso de una gran red aleatoria (falta de correlaciones) es fácil ver que Cw C  y Cw (k) = C(k). En redes ponderadas reales, sin embargo, podemos enfrentar dos casos opuestos. Si Cw C, estamos en presencia de una red en la que los trillizos interconectados son más probables formados por los bordes con pesos más grandes. Por otro lado, Cw C señala una red en la que el agrupamiento topológico se genera por los bordes con bajo peso. En este caso, el agrupamiento tiene un efecto menor en la organización de la red porque la mayor parte de las interacciones (tráfico, frecuencia de las relaciones, etc.) se produce en los bordes que no pertenecen a trillizos interconectados. Lo mismo puede suceder para Cw (k), para lo cual también es posible analizar las variaciones con respecto a la clase de grado k.

Junto con el coeficiente de agrupación ponderada, se introduce el grado de vecinos más próximos promedios ponderados, definido como (véase la figura 5)
Formula

En este caso, realizamos un promedio local ponderado del grado de vecindad más cercano según el peso normalizado de los bordes de conexión, w ij/s i. Esta definición implica que Formula si los enlaces con los pesos más grandes están apuntando a los vecinos con mayor grado y Formula en el caso opuesto. La Formula mide así la afinidad efectiva para conectar con vecinos de alto o bajo grado según la magnitud de las interacciones reales. Además, el comportamiento de la función Formula marca las propiedades ponderadas asortativas o desasortativas considerando las interacciones reales entre los elementos del sistema.

Como prueba general, inspeccionamos los resultados obtenidos tanto para el SCN como para la WAN comparando las cantidades topológicas regulares con las obtenidas con la definición ponderada aquí introducida. Las medidas topológicas nos dicen que el SCN tiene un espectro continuamente en descomposición C(k) (véase la figura 6A). Esto implica que los hubs presentan un vecindario agrupado mucho más bajo que los vértices de bajo grado. Este efecto puede interpretarse como la evidencia de que los autores con pocos colaboradores trabajan normalmente dentro de un grupo de investigación bien definido en el que colaboran todos los científicos (agrupación alta). Sin embargo, los autores con un alto grado de colaboración colaboran con diferentes grupos y comunidades, que a su vez no suelen tener colaboraciones, creando así un coeficiente de agrupamiento más bajo. Además, el SCN exhibe una conducta asociativa de acuerdo con la evidencia general de que las redes sociales se denotan generalmente por un fuerte carácter asociativo (24) (véase la figura 6B). El análisis de las cantidades ponderadas confirma este cuadro topológico, proporcionando más información sobre la arquitectura de la red. El coeficiente de agrupamiento ponderado es muy cercano al topológico (Cw /C ≅ 1). Este hecho indica de manera cuantitativa que las colaboraciones de grupo tienden en promedio a ser estables y determinar la intensidad media de las interacciones en la red. Además, la inspección de Cw (k) (ver Fig. 6A) muestra generalmente que para k ≥ 10 el coeficiente de agrupación ponderada es mayor que el topológico. Esta diferencia implica que los autores de alto grado (es decir, con muchos colaboradores) tienden a publicar más artículos con grupos interconectados de coautores. Este hallazgo sugiere que los científicos influyentes forman grupos de investigación estables donde se obtiene la mayor parte de su producción. Finalmente, las propiedades asociativas encuentran una confirmación de corte claro en el análisis ponderado con una Formula que crece como una potencia de k.


Fig. 6. Cantidades topológicas y ponderadas para el SCN. (A) La agrupación ponderada se separa de la topológica alrededor de k ≥ 10. Este valor marca una diferencia para los autores con mayor número de colaboradores. (B) El comportamiento asortativo se mejora en la definición ponderada del grado medio de vecinos más cercanos.

Una imagen diferente se encuentra en la WAN, donde el análisis ponderado proporciona un escenario más rico y de alguna manera diferente (Fig. 7). Esta red también muestra una C (k) en descomposición, una consecuencia del papel de los grandes aeropuertos que proporcionan conexiones sin escalas a destinos muy lejanos a escala internacional e intercontinental. Estos destinos no suelen estar interconectados entre ellos, dando lugar a un bajo coeficiente de agrupamiento para los hubs. Encontramos, sin embargo, que Cw /C ≅ 1.1, lo que indica una acumulación de tráfico en los grupos interconectados de vértices. El coeficiente de agrupamiento ponderado Cw (k) también tiene un comportamiento diferente en que su variación es mucho más limitada en todo el espectro de k. Esta observación implica que los aeropuertos de alto grado tienen una tendencia progresiva a formar grupos interconectados con enlaces de alto tráfico, equilibrando así la agrupación topológica reducida. Debido a que el alto tráfico está asociado a los hubs, tenemos una red en la que los nodos de alto grado tienden a formar cliques con nodos de igual o mayor grado, el llamado fenómeno del club rico (25). Prueba interesante también emerge de la comparación de k nn(kFormula. El k nn(k) topológico muestra un comportamiento asortativo sólo en grados pequeños. Para k> 10, k nn(k) se aproxima a un valor constante, hecho que revela una estructura no correlacionada en la que vértices con grados muy diferentes tienen un vecindario muy similar. Sin embargo, el análisis de la Fórmula ponderada muestra un pronunciado comportamiento asociativo en todo el espectro k, proporcionando una imagen diferente en la que los aeropuertos de alto grado tienen una mayor afinidad con otros grandes aeropuertos en los que se dirige la mayor parte del tráfico.


Fig.7. Cantidades topológicas y ponderadas para la WAN. (A) El coeficiente de agrupación ponderada es mayor que el topológico en todo el espectro de grados. (B) k nn(k) alcanza una meseta para k> 10 que denota la ausencia de correlaciones topológicas marcadas. En contraste, la Formula exhibe un comportamiento asortativo más definido.

Conclusiones

Hemos demostrado que una visión más completa de las redes complejas se proporciona por el estudio de las interacciones que definen los vínculos de estos sistemas. Los pesos que caracterizan las diversas conexiones muestran características estadísticas complejas con distribuciones muy variables y comportamiento de ley de potencia. En particular, hemos considerado los ejemplos específicos de SCN y WAN donde es posible apreciar la importancia de las correlaciones entre pesos y topología en la caracterización de las propiedades de la red real. De hecho, el análisis de las cantidades ponderadas y el estudio de las correlaciones entre pesos y topología proporcionan una perspectiva complementaria sobre la organización estructural de la red que podría no ser detectada por cantidades basadas únicamente en información topológica. Nuestro estudio ofrece así un enfoque cuantitativo y general para entender la arquitectura compleja de redes ponderadas reales.



Referencias

  1. Albert, R. & Barabási, A.-L. (2002) Rev. Mod. Phys. 74 , 47-97. CrossRef | Web of Science | Google Scholar
  2. Dorogovtsev, S. N. & Mendes, J. F. F. (2003) Evolution of Networks: From Biological Nets to the Internet and WWW (Oxford Univ. Press, Oxford). Google Scholar
  3. Amaral, L. A. N., Scala, A., Barthélemy, M. & Stanley, H. E. (2000) Proc. Natl. Acad. Sci. USA 97 ,11149-11152. Abstract/FREE Full Text
  4. Watts, D. J. & Strogatz, S. H. (1998) Nature 393 , 440-442. CrossRef | Medline | Web of Science | Google Scholar
  5. Barabási, A.-L & Albert, R. (1999) Science 286 , 509-512. Abstract/FREE | Full Text
  6. Cohen, R., Erez, K., ben Avraham, D. & Havlin, S. (2000) Phys. Rev. Lett. 85 , 4626-4628. CrossRef | Medline | Web of Science | Google Scholar 
  7. Callaway, D. S., Newman, M. E. J., Strogatz, S. H. & Watts, D. J. (2000) Phys. Rev. Lett. 85 , 5468-5471 2000 CrossRef | Medline | Web of Science | Google Scholar 
  8. Albert, R., Jeong, H. & Barabási, A.-L. (2000) Nature 406 , 378-382 2000 CrossRef | Medline | Web of Science | Google Scholar
  9. Pastor-Satorras, R. & Vespignani, A. (2001) Phys. Rev. Lett. 86 , 3200-3203. CrossRef | Medline | Web of Science | Google Scholar
  10. Clark, J. & Holton, D. A. (1998) A First Look at Graph Theory (World Scientific, Singapore). Google Scholar
  11. Yook, S. H., Jeong, H., Barabási, A.-L. & Tu, Y. (2001) Phys. Rev. Lett. 86 , 5835-5838.  CrossRef  | Medline | Web of Science | Google Scholar
  12. Li, W. & Cai, X. (2003) e-Print Archive, http://xxx.lanl.gov/abs/cond-mat/0309236Google Scholar
  13. Guimerà, R., Mossa, S., Turtschi, A. & Amaral, L. A. N. (2003) e-Print Archive,http://xxx.lanl.gov/abs/cond-mat/0312535.  Google Scholar
  14. Newman, M. E. J. (2001) Phys. Rev. E 64 , 016131. CrossRef | Google Scholar
  15. Newman, M. E. J. (2001) Phys. Rev. E 64 , 016132. CrossRef | Google Scholar
  16. Barabási, A. L., Jeong, H., Néda, Z., Ravasz, E., Schubert, A. & Vicsek, T. (2002) Physica A 311 ,590-614. CrossRef | Web of Science | Google Scholar
  17. Freeman, L. C. (1977) Sociometry 40 , 35-41. CrossRef | Web of Science | Google Scholar
  18. Goh, K.-I., Kahng, B. & Kim, D. (2001) Phys. Rev. Lett. 87 , 278701. CrossRef | Medline | Google Scholar
  19. Brandes, U. (2001) J. Math. Soc. 25 , 163-177. CrossRef | Google Scholar
  20. Vázquez, A., Pastor-Satorras, R. & Vespignani, A. (2002) Phys. Rev. E 65 , 066130. CrossRef | Google Scholar
  21. Ravasz, E. & Barabási, A.-L. (2003) Phys. Rev. E 67 , 026112. CrossRef | Google Scholar
  22. Pastor-Satorras, R., Vázquez, A. & Vespignani, A. (2001) Phys. Rev. Lett. 87 , 258701. CrossRef | Medline | Google Scholar
  23. Maslov, S. & Sneppen, K. (2001) Science 296 , 910-913. Google Scholar
  24. Newman, M. E. J. (2002) Phys. Rev. Lett. 89 , 208701. CrossRef | Medline | Google Scholar
  25. Zhou, S. & Mondragon, R. J. (2003) e-Print Archive, http://xxx.lanl.gov/abs/cs.NI/0303028Google Scholar