sábado, 24 de diciembre de 2016

Redes sociales urbanas y el problema de búsqueda

La anatomía de las redes sociales urbanas y sus implicaciones en el problema de búsqueda

C. Herrera-Yagüe, C. M. Schneider, T. Couronné, Z. Smoreda, R. M. Benito, P. J. Zufiria & M. C. González
Scientific Reports 5, Article number: 10265 (2015)
doi:10.1038/srep10265


Resumen
La aparición de grandes conjuntos de datos de comunicación geolocalizados ha aumentado recientemente nuestra comprensión de cómo las redes sociales se relacionan con su espacio físico. Sin embargo, muchas propiedades reportadas de forma recurrente, como la agrupación espacial de las comunidades de la red, aún no han sido probadas sistemáticamente a diferentes escalas. En este trabajo analizamos la estructura de la red social de más de 25 millones de usuarios de teléfonos de tres países en tres escalas diferentes: país, provincias y ciudades. Constantemente encontramos que este último escenario urbano presenta diferencias significativas con el conocimiento común sobre las redes sociales. En primer lugar, la aparición de un componente gigante en la red parece estar controlada por si la red abarca toda la frontera urbana, casi independientemente de la población o de la extensión geográfica de la ciudad. En segundo lugar, las comunidades urbanas están mucho menos agrupadas geográficamente de lo esperado. Estos dos hallazgos arrojan nueva luz sobre la investigabilidad ampliamente estudiada en redes auto-organizadas. Mediante una simulación exhaustiva de las estrategias de búsqueda descentralizada, concluimos que las redes urbanas no pueden buscarse a través de la proximidad geográfica como sus contrapartes en todo el país, sino a través de una estructura comunitaria dirigida por homofilia.

Introducción

En la última década, los métodos de análisis de redes sociales nos han permitido descubrir patrones locales y globales1, ubicar individuos influyentes2 y examinar la dinámica de la red3. El estudio de las redes sociales a nivel macro traza los resultados de las interacciones sociales colectivas ya gran escala, tales como el desarrollo económico4, la transferencia de recursos5, la transmisión de enfermedades6 y las comunicaciones7 sobre una gran población. En estos casos, los nodos de las redes representan a individuos, y los acoplamientos se definen generalmente por amistades o conocidos entre ellos. Los patrones estructurales bien documentados de estas redes son: las correlaciones positivas en el grado de nodos adyacentes 8, un diámetro corto (aumentando como el logaritmo natural del número de nodos) 9 y la transitividad o agrupación de la red, que es la propensión a los pares de nodos A ser conectados si comparten un vecino mutuo9. Curiosamente, las redes sociales también se dividen en grupos o comunidades, y la existencia de tales comunidades por sí solas puede producir tanto correlaciones de grado como de agrupación alta10. Por otro lado, algunos enlaces sociales son también la consecuencia de atributos similares de sus nodos. Personas similares tienden a seleccionar entre sí11,12, se comunican más frecuentemente y presentan interacciones sociales más fuertes7.

Paralelamente al surgimiento del análisis de redes sociales ya menudo utilizando fuentes de datos similares, los patrones de movilidad humana también han evolucionado considerablemente en los últimos años13,14. Un interesante tema de estudio que ha comenzado a crecer recientemente es combinar los hallazgos de ambas áreas para explicar la relación entre las redes sociales y el espacio geográfico. Evidentemente, los contactos sociales sólo pueden existir si existe la oportunidad de crear tales contactos. Esto explica, por ejemplo, los hallazgos omnipresentes que muestran que la proximidad geográfica favorece la existencia de contactos sociales15,16. Además, se han analizado Comunidades de Red (áreas localmente densas del gráfico social) en varias redes sociales de escala nacional cuando se conocen las posiciones espaciales de los nodos, como ocurre cada vez más en las redes sociales resultantes de las tecnologías de información y comunicación17. Un resultado bien documentado de estas comunidades es que se repasa las fronteras nacionales18, 19 y administrativas20 cuando se estudian a escala nacional.

La dispersión espacial de los contactos sociales a escala de país se ha estudiado en el contexto de la planificación del transporte (véase 21 y sus referencias). Kowald et al. Realizó un estudio comparativo de los lazos sociales y sus distancias, de encuestados de individuos dentro de ciudades en tres continentes diferentes. Informaron que aunque los modelos últimos necesitan incorporar las características de los egos, las ataduras, y las facilidades del transporte, hay una tendencia general de un decaimiento de la ley de la energía de lazos sociales con la distancia. En este trabajo queremos explorar la estructura grupal de las redes sociales en las ciudades y su relación con el espacio. El tamaño de los grupos sociales tiene importantes implicaciones para nuestras sociedades, Simmel22 veía el creciente tamaño en los grupos de redes como el origen del aislamiento de los individuos. Estas implicaciones y la literatura relacionada están fuera del alcance de este trabajo. Los estudios de redes sociales en las ciudades han medido el papel de la densidad de los lazos sociales23,24 o cara a cara25,26. Aquí, nos interesa el análisis de las comunidades dentro de las ciudades y su relación con el espacio. A pesar de algunos análisis de las comunidades dentro de las ciudades27,28, todavía hay falta de conocimiento sobre una estructura clara de las redes sociales urbanas en el espacio. Específicamente, cómo los componentes conectados emergen con la distancia29 en las redes sociales urbanas.

Aquí asignamos a cada usuario de telefonía móvil a una ubicación fija correspondiente a su torre de código postal o móvil más comúnmente utilizada, con el objetivo de estudiar sistemáticamente las propiedades espaciales de sus redes sociales a diferentes escalas, incluyendo la formación de un componente gigante en el espacio . La distancia geográfica entre dos nodos se define entonces como la distancia de sus respectivos lugares más comunes, típicamente el hogar o el trabajo. Se espera que dentro de las ciudades esta distancia no sea un factor limitante importante en la creación de lazos sociales, ya que puede ser otros factores que definen su distancia social. La distancia social se da por las diferencias entre los grupos de la sociedad, incluyendo las diferencias sociodemográficas, de raza o de identidad social30. La búsqueda es una propiedad de red bien establecida que se relaciona con la proximidad geográfica y la distancia social: las personas comunes son capaces de dirigir mensajes sólo a través de sus conocidos y para llegar a cualquier persona objetivo en sólo unos pocos pasos. A la luz de la comunicación por correo electrónico, Dodds et al.33 demostraron que al encaminar un mensaje a un objetivo, la gente seleccionó en los primeros pasos a conocidos que podrían ser geográficamente Cerca de ese objetivo. Sin embargo, en los últimos pasos, los participantes seleccionaron a conocidos que podrían pertenecer al grupo profesional de la meta (es decir, socialmente cerca). Hasta ahora, la estructura de red que hace posible la búsqueda no se ha medido empíricamente en redes sociales de gran escala.

Diseñamos nuestro estudio para explorar el papel de las distancias sociales y geográficas en las redes sociales. La distancia social no es trivialmente definida en redes sociales con datos recopilados pasivamente sin mucha información sobre los atributos de los nodos. Introducir una métrica de distancia social para estos casos es una cuestión interesante, pero fuera del alcance de este trabajo. Watts et al. Definió la distancia social entre dos nodos como la diferencia en los niveles de jerarquía de los dos grupos más pequeños a los cuales los nodos pertenecían34. Aquí, utilizamos una definición similar, propuesta por Kleinberg et al.35: distancia social entre nodos y es el número de nodos en el grupo más pequeño que contiene y. En este trabajo definimos a los grupos sociales como comunidades de red, que son sub-redes densas localmente. Las comunidades de redes son, por lo tanto, un aspecto central en el análisis de las redes sociales, siendo la fuente de sus propiedades estructurales (correlación de grados y alta agrupación) y consecuencia de propiedades no estructurales, como el homofilismo36. La detección de comunidades en red (módulos o grupos) es una tarea difícil que ha atraído mucha atención en los últimos años37. Aquí adoptamos un método bien establecido que detecta a las comunidades optimizando la modularidad de Newman Girvan metric38.

En primer lugar se presenta una descripción general de las redes sociales medidas, con especial atención a las propiedades del pequeño mundo ya las distribuciones de distancia entre enlaces. A continuación, presentamos el desempeño de diferentes estrategias de enrutamiento y mostramos que las estrategias geogreligiosas (elegir la distancia geográfica más pequeña a la meta) son ineficaces dentro de las ciudades mientras que las estrategias basadas en la distancia social (elegir dentro de la comunidad más pequeña) siguen funcionando. Descubrimos dos características de las redes sociales urbanas que causan el fracaso de las estrategias geográficas: las comunidades urbanas están geográficamente dispersas y no hay un gran componente conectado en grupos de nodos definidos por su proximidad geográfica. Medimos además en las redes urbanas cómo la densidad de enlaces  decae con el aumento del tamaño de grupo () o la distancia. Encontramos que la probabilidad de encontrar un vínculo entre individuos y en un grupo de escalas de tamaño como , con  cuando los grupos  (S) son definidos por los usuarios que viven dentro de bolas geográficas de un cierto radio. Esto contrasta con las observaciones a escala nacional que informan  15. Estos resultados respaldan la evidencia de que mientras los algoritmos geogreídicos trabajan para alcanzar la ciudad de un objetivo, fallan dentro de las fronteras urbanas. Además, mostramos que la condición todavía se mantiene cuando los grupos () están definidos por la distancia social. Estos resultados de grupos urbanos definidos por la distancia social o la distancia geográfica están de acuerdo con las condiciones analíticas de la búsqueda de redes39 y apoyan los resultados reportados en los experimentos de enrutamiento33. Este trabajo proporciona nuevas evidencias de redes sociales: las redes urbanas forman comunidades geográficamente dispersas que las hacen buscables.


Resultados

Estructura de red

Nuestro conjunto de datos contiene información para 7 mil millones de interacciones de teléfonos móviles recopilados durante un período de 6 meses en Francia, Portugal y España. Estos resultados confirman que las redes exhiben la pequeña propiedad mundial, con el número medio de personas en el camino más corto entre un remitente y un destinatario es, y en los diferentes países, similar al Valores reportados en trabajos anteriores7,40. Como única ilustración de las redes resultantes, extraemos la distribución espacial de las personas más centrales de la red, considerando que alguien es más central si está en promedio más cercano a todos los demás en el gráfico (centralidad de proximidad). En la Fig. 1 se muestra la distribución de la media gráfica distancia entre un remitente y todos los posibles destinatarios  entre la población de cada país. Este valor también se conoce como el inverso de la centralidad de cercanía41 y varía de a, por lo que todo el mundo en el país está en promedio dentro del lúpulo de la gente más central y dentro de los menos centrales. Cada punto representa una torre de telefonía móvil, que es nuestra menor resolución espacial. Con el fin de exponer la columna vertebral de la red social, la intensidad de color de cada torre de telefonía móvil representa la centralidad de cercanía de la persona más central en esa torre. Además, los vínculos ponen de relieve las conexiones sociales sólo entre las personas más centrales de cada país, mostrando diferencias significativas en la red social analizada en los tres países.


País% GCNodes Links 
Francia
Portugal
España
325/5000
Tabla 1: Características de las redes sociales en los países estudiados: tamaño del componente gigante (GC), número de usuarios (nodos) y relaciones (enlaces), grado medio , coeficiente de agrupación promedio , longitud promedio de la trayectoria más corta  y el correspondiente Valores para redes aleatorias con el mismo tamaño  y .


Visualización de lugares centrales en Francia, España y Portugal. Cada círculo representa una torre de teléfono móvil y su color (el más brillante, el más central) corresponde a la inversa de la centralidad de proximidad  (número medio de saltos a cualquier otra persona) de la gente más central de esta torre. Las personas siempre se asignan a su dirección de facturación o la torre más utilizada. Las líneas blancas destacan la red social entre las 50 personas más centrales de cada país. En los tres cuadros se muestra la distribución de la de todas las personas y la relación con el color usado. Esta figura fue creada usando Grace y Inkscape.

En cuanto a la distribución de grados, nuestras tres redes presentan la distribución de colas pesadas común encontrada en trabajos previos con redes sociales7,4. Las distribuciones de grados para las tres redes se muestran en la Fig. 2a (detalles sobre el ajuste de la ley de potencia se pueden encontrar en la Tabla S1). Observamos la existencia de hubs (nodos con un número muy alto de conexiones) en las tres redes. Para medir la proximidad geográfica entre individuos necesitamos asignar una ubicación a cada uno de ellos. En nuestro estudio, los usuarios se encuentran en su código postal de facturación (España) o su torre más utilizada (Francia y Portugal). Los códigos postales de España están geolocalizados de acuerdo con la base de datos de geonames, disponible en http://downloads.geonames.org/export/zip, y agrupados de acuerdo a la latitud y longitud ya que algunos códigos postales tienen coordenadas idénticas. Las coordenadas de las torres fueron proporcionadas por el transportista. En total, 8.928 lugares diferentes están disponibles en España, 17.475 en Francia y 2.209 en Portugal. Está bien documentado que la probabilidad de encontrar un vínculo social disminuye con la proximidad geográfica, independientemente del proxy utilizado para inferir la red social: blogs15, redes sociales basadas en la localización43,44 o datos de telefonía móvil7,18,42. En todos ellos la fracción de vínculos sociales entre nodos que están a distancia unos de otros decrece (al menos en un cierto rango) como ley de poder, con exponentes entre -1 y -2. Como se muestra en la Fig. 2b, nuestros datos se ajustan a este comportamiento para las tres redes. Kowald et al.21 presentan un análisis cuidadoso de la función de decaimiento observando las bandas de distancia dependiendo de la población, un análisis similar sobre estos datos permanece en estudios posteriores.


Estructura nacional de las redes sociales. (A) Distribución de grados para cada una de las redes a nivel de país. (B) Probabilidad de un enlace para tener distancia en cada una de las redes. Las distancias se agrupan en contenedores de 7 km. En los tres países, la distribución presenta un decaimiento de la ley de potencia (exponentes entre -1 y -1,5) hasta km. Una gran parte de los enlaces se encuentran dentro de la misma torre (= 0), promediando 40% en España (rojo), 18% en Francia (azul) y 21% en Portugal (verde).


Además, debido al elevado número de enlaces considerados, podemos observar picos de largo alcance. La razón de estos picos es la heterogeneidad en la distribución espacial de la población (observamos los mismos picos incluso si aleatorizamos los enlaces manteniendo a los actores en el mismo lugar). Una vez establecido que los caminos cortos existen en toda la red, exploramos el éxito de las estrategias de enrutamiento en dos niveles: intercity e intracity.

Explorando Estrategias de Enrutamiento

Con el fin de recopilar información sobre la estructura de la red social, investigamos la conocida condición de búsqueda. Exploramos diferentes estrategias de enrutamiento en las redes sociales descritas anteriormente. Separamos el experimento de enrutamiento en dos fases: enrutamiento interurbano y enrutamiento intracity.

El enrutamiento interurbano busca alcanzar la ciudad correcta mientras que el enrutamiento intracity busca el blanco individual dentro de una ciudad. Las ciudades se definen por sus fronteras administrativas. En este estudio se consideran dos escalas: provincias y municipios como se muestra en la Fig. S5. En ambas fases, probamos diferentes estrategias de enrutamiento descentralizado que emplean sólo información de nodos vecinos (también llamados contactos o amigos). En una búsqueda aleatoria (ran), los individuos enrutan el mensaje seleccionando aleatoriamente a un nodo vecino que no ha tenido el mensaje previamente. El enrutamiento geográfico (geo) pasa el mensaje al contacto geográficamente más cercano al objetivo final, mientras que el grado de enrutamiento (deg) selecciona al amigo con el mayor número de amigos. Finalmente, el enrutamiento comunitario (com) envía el mensaje a un amigo de manera que pertenezca a la comunidad más pequeña que contenga el objetivo (ver detalles en la sección Métodos).

Nuestros resultados de simulaciones interurbanas presentados en la Fig. 3a indican que el enrutamiento geo y com pueden alcanzar las ciudades objetivo. Además, la tasa de éxito depende sólo logarítmicamente del tamaño de la población de la ciudad de destino (Figura S8), lo que confirma que ambas estrategias son igualmente eficientes. El experimento interurbano puede replicarse en nuestra página de inicio45. Las estrategias geográficas ya habían sido reportadas como exitosas usando medio millón de redes de bloggers en los Estados Unidos15. Sin embargo, el enrutamiento intracity no ha sido explorado previamente debido a que tanto el bajo tamaño de la muestra de la red (de la población estadounidense) como la falta de información de las coordenadas de los individuos dentro de las ciudades obligaron a relajar la estructura de red modelada: Mensajes a cualquier persona dentro de la ciudad objetivo, incluso si no estaban conectados directamente. Por el contrario, nuestra muestra de población más grande (12-40%) y una resolución espacial mucho más pequeña (escala de torre de telefonía móvil) nos permiten explorar el enrutamiento dentro de las ciudades usando un enrutamiento estricto entre individuos conectados.


Figura 3


Resultados para diferentes estrategias de enrutamiento en ambas etapas. (A) Dependencia del número de saltos l en la tasa de éxito de enrutamiento interurbano (los resultados para completar la entrega dentro y saltos se resaltan mediante círculos). (B) Tasa de éxito versus tamaño de la población para tres estrategias en 155 municipios y 150 provincias. Todas las funciones logarítmicas y de ley de potencia son guías para el ojo.

A continuación, exploramos las estrategias de enrutamiento analizando las propiedades de la red dentro de las fronteras administrativas geográficas en dos escalas: las provincias como límites superiores (que suelen incluir ciudades grandes y suburbios) y municipios como límites inferiores. Así, analizamos las tres diferentes estrategias de enrutamiento en las redes sociales de los grandes municipios y todas las provincias de los tres países. En contraste con el enrutamiento interurbano, el enrutamiento dentro de los municipios es significativamente más exitoso si la estrategia utiliza información de la comunidad (las figuras S10-S15 muestran estrategias adicionales). Para diferentes estrategias de enrutamiento Fig. 3b muestra la tasa de éxito de los municipios (círculos llenos) y provincias (círculos abiertos) en cada país en función del tamaño de la población N; Se empleó un lımite superior de 100 lúpulos y la Fig. S24 muestra resultados con un límite superior más pequeño. Encontramos que en ambas escalas el enrutamiento basado en la comunidad es eficiente debido a la lenta decadencia en la tasa de éxito  ( y ) y en contraste con la estrategia aleatoria, que como se espera se desintegra casi inversamente lineal como  (). Curiosamente, el enrutamiento basado geográficamente presenta un comportamiento de cruce entre los municipios (sólo rutas intracity) y provincias (incluyendo una etapa interurbana inicial). Este comportamiento se debe al hecho de que una provincia consta de varios municipios. Aunque el enrutamiento basado geográficamente llega al municipio correcto, dentro del municipio esta estrategia falla. Esto explica las diferentes escalas observadas para el enrutamiento geográfico en los municipios y provincias: mientras que dentro de los municipios la tasa de éxito de enrutamiento escala de forma similar al enrutamiento al azar  (), la provincia encauza la tasa de éxito escalas similares a la comunidad de enrutamiento  ( y ), pero con una menor tasa de éxito Como consecuencia de su ineficacia dentro de los municipios.

En las secciones siguientes mostramos que el fracaso del enrutamiento geográfico dentro de las ciudades radica en dos propiedades espaciales de las redes sociales urbanas previamente desconocidas: falta de conectividad de corto alcance y dispersión geográfica de las comunidades urbanas.

Colapso de la conectividad dentro de las ciudades

Una condición necesaria para que cualquier algoritmo geogreedy tenga éxito en un experimento de enrutamiento es que el subgrafo inducido por los nodos situados dentro de cualquier bola geográfica de radio r debe ser conectado. Esto equivale a decir que si un mensaje dirigido al usuario objetivo B ha llegado a un usuario A, A y B están en el mismo componente conectado dentro del subgrafo inducido por aquellos nodos incluidos en el círculo cuyo centro está en B y tiene un radio de hasta R. Si bien esto se concede en una celosía nuestros resultados muestran que no es necesariamente el caso en una red del mundo real (ver Fig. 4a). Probamos esta estructura en nuestros datos usando distancias geométricas y sociales. Dividimos la red en grupos de tamaño  usando cualquiera de las bolas geográficas (mientras que en este trabajo sólo consideramos los círculos geográficos 2D mantenemos el término bolas para la consistencia con el trabajo teórico anterior35 que se ha generalizado a dimensiones superiores) de un cierto radio r () o comunidades existentes () Una cuestión natural que surge entonces es: ¿cuál es el radio crítico  para que las bolas geográficas con  es probable que contengan una red conectada? Curiosamente, observamos que no hay un único , sino que este radio se define por el tamaño de una ciudad, de modo que sólo las bolas geográficas que contienen ciudades enteras contienen una red conectada.


Figura 4

Conectividad de corto alcance (a) En un enrejado 2D (izquierda), cualquier bola geográfica contiene una red conectada, sin embargo esto no es el caso para ninguna red (derecha) donde la ruta entre dos nodos dentro de una bola geográfica podría incluir nodos fuera de la red Bola si la red inducida por los nodos dentro de la pelota no está conectada. (B) Fracción de nodos en el componente gigante en función del tamaño relativo de la bola geográfica para las tres capitales en comparación con las redes nacionales. Cada uno de los 6000 puntos en la figura se calculó seleccionando 2 nodos u y v al azar dentro de una ciudad o dentro del país, extrayendo la subred definida por la bola cuyo centro está en y el radio hasta e identificando el número de individuos que pertenecieron al gigante Componente de dicha subred.

Ilustramos este hecho más detalladamente calculando el tamaño del componente conectado más grande dentro de diferentes tamaños de radio y grupo, realizando este análisis centrado en diferentes lugares de la capital (ciudad) o centrado en una provincia de los tres países. La Figura 4b muestra que la fracción de nodos en el componente gigante es mucho menor dentro de las ciudades que dentro de las provincias. Sorprendentemente, encontramos que esta falta de conectividad no es causada por no tener suficientes enlaces de corta distancia (realmente entre 18 y 40% de enlaces están dentro de la misma ubicación (torre o código postal)). Cuando hacemos zoom en una región de la ciudad, encontramos pequeños grupos muy agrupados que forman islas; Los caminos entre estos grupos geográficamente vecinos existen a través de personas que viven lejos.

Para ilustrar mejor este hallazgo hemos estudiado todas las redes intra-torre en las capitales y las hemos comparado con redes del mismo tamaño centradas en municipios del campo. Higo. 5a muestra el componente gigante promedio para torres y municipios de un cierto tamaño. Los municipios con una población dada tienen un componente gigante más grande que una torre en una ciudad con la misma población.

Figura 5


El colapso de la conectividad dentro de las ciudades. A) Relación entre el tamaño de la población y la fracción de nodos en el componente gigante para todas las torres de las ciudades capitales (azul) y los municipios del país dentro del mismo rango de población (rojo). Las barras de errores representan el error estándar de la media . El tamaño de los componentes conectados dentro de los municipios tiende a ser mayor que dentro de torres del mismo tamaño. (B) y (c) representan las causas de este comportamiento, menor grado promedio y mayor agrupación son las razones por las que el componente gigante es mayor en los municipios. D) Número de enlaces dentro de la misma torre usando varios modelos de aleatorización. Los resultados se promedian durante las pruebas. La red real tiene un mayor número de enlaces intra-torre que un gráfico independiente del espacio (ER) y un modelo . En el caso de Lisboa, la red real tiene aún más vínculos que un modelo . Para explicar el elevado número de enlaces intra-torre, la distancia geográfica no es suficiente, por lo que se necesita otro efecto como la agrupación.


Dado un número fijo de nodos, un componente gigante emerge más probable con un número más alto de acoplamientos y con la agrupación baja (un acoplamiento que cierra un triángulo no agranda ningún componente conectado). Como se muestra en la Fig. 5b-5c, ambos efectos están presentes a nivel municipal y no dentro de torres. Esto explica los diferentes tamaños de componentes gigantes entre municipios y torres. Sin embargo, la alta agrupación parece ser dominante para la falta de un componente conectado, ya que en Portugal el grado medio es el mismo en torres y municipios. Por otra parte, el pequeño grado medio no parece ser debido a la falta de datos, ya que los datos de Francia presenta el grado medio más alto a escala de país, mientras que exhibe el grado medio más pequeño en la escala de la torre.

Nuestros resultados sobre la distancia geográfica coinciden con la literatura anterior15,4, mostrando que sigue la probabilidad de que dos usuarios a distancia r estén conectados sigue una . Sin embargo, este único hallazgo no nos da ninguna información sobre el número de enlaces entre personas dentro de la misma ubicación (torre / código postal), ya que en principio están a distancia . Con el fin de poder aplicar modelos geográficos puros (generar enlaces con ) a nuestros datos, tenemos que aleatorizar la posición de los usuarios alrededor de la ubicación de la torre. Una suposición común para los datos del teléfono móvil es considerar que si una llamada es procesada por una torre, entonces esa torre es la más cercana a la ubicación del usuario. Esta suposición implica que el espacio geográfico se puede dividir según el diagrama de Voronoi de las torres en esa región. De esta manera nuestra asignación al azar asigna a cada usuario una posición uniformemente distribuida en la célula Voronoi a la que pertenece. La figura S22 muestra el proceso de aleatorización en París y Lisboa. Después de la asignación al azar, la distancia entre dos usuarios es mayor que cero, por lo que podemos aplicar a los modelos  el número de predicciones y los enlaces presentes intra-torre para el mismo número de enlaces en toda la red. En la Fig. 5d se muestra que el número de enlaces intra-torre observados en ambas ciudades es mayor que lo que generaría un modelo geográfico puro (incluso más alto que  en el caso de Lisboa). A pesar de esta abundancia de enlaces, no hay un componente gigante, lo que implica que el agrupamiento juega un efecto importante en este nivel, produciendo islas muy agrupadas dentro de la misma torre.

Dispersión geográfica de las comunidades urbanas

En la escala de país se sabe que las comunidades identificadas están altamente correlacionadas espacialmente e incluso vuelven a dibujar las fronteras administrativas como se muestra en la Fig. 6 (izquierda), donde los colores indican la comunidad dominante de cada torre de telefonía móvil. Esta ha sido la motivación de una línea de investigación orientada a redibujar los mapas políticos según las características de las redes sociales18,20,46. Sin embargo, en la escala de la ciudad (Fig. 6 derecha) las comunidades están dispersas sobre el espacio y dentro del área del centro están distribuidas casi aleatoriamente. Esto muestra por primera vez que las comunidades dentro de las ciudades no están geográficamente determinadas.


Figura 6

Agrupamiento geográfico de las comunidades sociales. En la escala del país, las torres pertenecientes a las 20 comunidades más grandes se presentan en diversos colores y formas. En la escala de la ciudad, se presentan torres dentro de cada capital. En la escala nacional, la mayoría de las comunidades encajan con las fronteras administrativas, mientras que dentro de las ciudades las comunidades no parecen estar geográficamente impulsadas. La figura fue creada usando los paquetes maptools de R y ggplot2.

Estos resultados son confirmados por la medición de  (distancia media entre dos torres pertenecientes a la misma comunidad) y  (distancia media entre dos torres aleatorias), que se presentan en la tabla 2. Los detalles sobre el cálculo de ambas distancias se pueden encontrar en los la sección de Métodos. Aunque  es consistentemente más de 4 veces mayor que  en la escala de país, las dos medidas se hacen mucho más similares dentro de las ciudades, confirmando cuantitativamente el resultado visual de la Fig. 6.

Tabla 2: Distancia media entre dos torres pertenecientes a la misma comunidad () en comparación con la distancia cuando las comunidades son aleatorias (). El efecto geográfico  es más pronunciado en las comunidades nacionales.


Red(km)(km)
Portugal
Francia
España
Lisboa (concelho)
Paris (department)
Madrid (municipio)


Un hallazgo adicional inesperado es que algunas áreas turísticas rompen la tendencia general de todo el país. Una parte significativa de la Riviera francesa y la costa sur de la isla de Córcega pertenecen a la comunidad de París, incluso si están lejos de la capital. Lo mismo sucede con Ibiza (la isla más occidental de Baleares) y Madrid. En el Algarve de Portugal (costa sur del país) el efecto no es tan claro, pero definitivamente hay una mayor diversidad comunitaria en la zona, y es posible encontrar torres pertenecientes a las comunidades de Oporto y Lisboa. Tenga en cuenta que es poco probable que sea un efecto estacional turístico porque en Francia y Portugal se asigna al usuario la torre más utilizada en un período de 6 meses y en España se utiliza el código postal de facturación. Dado que ambos son proxies razonables para la residencia permanente, este efecto es más probable debido a los urbanitas que se retiraron a la costa, e incluso llegar a ser mayoría en ciertas áreas, pero aún mantener sus lazos sociales en la gran metrópoli.


Métricas de distancia y búsqueda en redes urbanas

La búsqueda de red está relacionada con la densidad de sus enlaces34,35. La densidad de P enlaces en función de la distancia de los nodos determina la condición necesaria para la búsqueda de la red. Esta condición se postula en el marco del modelo de grupo35, que generaliza los resultados previos en las jerarquías de las redes sociales34 y las celdas espaciales39.   es la probabilidad de existencia de enlace entre un par de nodos  que están dentro de la distancia , definida como el tamaño del grupo más pequeño que contiene ambos u y v.

Dada la distribución de distancia de la forma  cuando  la red social no es buscable; Si  la red social siempre se puede buscar, y si  la red puede ser buscable.

Probamos esta estructura en nuestros datos usando distancias geométricas y sociales. Dividimos la red en grupos de tamaño  usando bolas geográficas de un cierto radio r () o comunidades existentes () como se ilustra en los cuadros de la Fig. 7. A continuación, calculamos la probabilidad de que dos nodos que pertenecen al mismo grupo (que es el grupo al que pertenecen los más pequeños) comparten un enlace y cómo esta probabilidad depende del tamaño del grupo. Observamos que ambas funciones tienen el exponente próximo , pero en los grupos basados ​​en geografía estos exponentes están siempre por debajo, mientras que el exponente es consistentemente superior a 1 para las comunidades como se muestra en la Fig. 7. Aunque el marco de modelo de grupo no captura todas nuestras propiedades de red (distribución heterogénea de grados y coeficiente de agrupación), encontramos que nuestros resultados empíricos en redes urbanas confirman resultados teóricos sobre las condiciones de búsqueda de redes sociales.

Figura 7

Comparación del exponente para la probabilidad de encontrar un vínculo entre dos personas en función del menor tamaño de grupo común:  para 96 ciudades en Francia. Los grupos se construyen basados en la geografía (, negro) o en la comunidad (, rojo).


Discusión

En resumen, hemos demostrado que las ciudades (como se define convencionalmente por sus fronteras administrativas y el tamaño de la población) cambian la estructura de las redes sociales. Curiosamente, estos hallazgos podrían estar relacionados con el crecimiento urbano y la función económica de las ciudades23,24.

En conjunto, los resultados presentados conducen a los siguientes descubrimientos:
(i) Las comunidades dentro de las ciudades siguen una estructura jerárquica que favorece la distancia social sobre la distancia geográfica. 
(ii) Si bien las personas que viven en un radio geográfico que incluye varias ciudades forman una red conectada, el mismo radio dentro de las ciudades conduce a componentes altamente agrupados conectados únicamente a través de personas en partes distantes de la ciudad.
(iii) La estructura de las comunidades (aquí relacionada con la proximidad social) y no la distancia geográfica es lo que hace que las redes sociales puedan ser consultadas dentro de las ciudades. Este hallazgo es consistente con los resultados experimentales que sugieren que las personas usan la profesión o el nombre del objetivo en los pasos finales para hacer inferencias sobre su educación o etnicidad, como una pista para ayudar a encaminar dentro de las ciudades33.

Este trabajo descubre una característica desconocida de las redes sociales: mientras que a nivel nacional las descripciones de las redes sociales consisten en comunidades altamente conectadas y geográficamente cercanas, encontramos que la geografía desempeña un papel secundario cuando se forman comunidades dentro de las ciudades. Las redes urbanas consisten en comunidades geográficamente dispersas. Esta estructura explica por qué las personas son capaces de conducir con éxito en experimentos de tipo Milgram, siempre que identifiquen correctamente la comunidad del objetivo. Nuestros resultados apoyan la hipótesis teórica de Kleinberg: la probabilidad de encontrar amistades dentro de las comunidades se descompone como una ley de poder con un tamaño creciente de la comunidad35, lo que confirma que entre todas las posibles configuraciones de red, los seres humanos han favorecido a aquellos que pueden llegar a alguien incluso si son entregados usando Sólo información local. Este es un notable ejemplo de una estructura auto-organizada que permite a un pequeño grupo de individuos resolver un problema complejo cooperando para aprovechar el conocimiento colectivo47,48.

Referencias