Mostrando entradas con la etiqueta clausura triádica. Mostrar todas las entradas
Mostrando entradas con la etiqueta clausura triádica. Mostrar todas las entradas

miércoles, 13 de mayo de 2020

Clausura triádica y homofilia como gestores de estructura núcleo-periferia

Efectos acumulativos de la clausura triádica y la homofilia en las redes sociales.

Aili Asikainen, Gerardo Iñiguez, Javier Ureña-Carrión, Kimmo Kaski y Mikko Kivelä

Science Advances  08 May 2020:
Vol. 6, no. 19, eaax7310
DOI: 10.1126/sciadv.aax7310


Resumen
La estructura de la red social a menudo se ha atribuido a dos mecanismos de evolución de la red: clausura triádica y elección homofílica, que comúnmente se consideran de forma independiente o con modelos estáticos. Sin embargo, los estudios empíricos sugieren que su interacción dinámica genera la homofilia observada de las redes sociales del mundo real. Al combinar estos mecanismos en un modelo dinámico, confirmamos la hipótesis de larga data de que la elección de la homofilia y la clausura triádica provocan homofilia inducida. Estimamos cuánto se amplifica la homofilia observada en las redes de amistad y comunicación debido a la clausura triádica. Encontramos que los efectos acumulativos de la amplificación de homofilia también pueden conducir a la estructura de redes núcleo-periferia ampliamente documentada y a la memoria de restricciones homofílicas (equivalente a histéresis en física). El modelo muestra que incluso un sesgo individual pequeño puede provocar cambios a nivel de red, como la segregación o el dominio del grupo central. Nuestros resultados destacan que los mecanismos a nivel individual no deben analizarse por separado sin tener en cuenta la dinámica de la sociedad en su conjunto.


Introducción

Uno de los rasgos más importantes de la socialidad humana es la homofilia (1), la tendencia de personas similares a conectarse entre sí debido a sus atributos biológicos y culturales compartidos, como el género, la ocupación o la afiliación política. Se ha observado homofilia en varias redes sociales (1–5), y es una fuerza importante detrás de varios problemas sociales apremiantes, como la desigualdad, la segregación y las cámaras de eco en línea (6–8). Por lo tanto, una comprensión cuantitativa exhaustiva de los mecanismos de red que conducen a la homofilia (9-12) es esencial para promover un flujo suficiente de información (1, 13) y la igualdad de oportunidades en las redes sociales de individuos con diversas preferencias personales.
La homofilia observada en las redes sociales a menudo se atribuye a la elección de la homofilia, definida por la preferencia de las personas al elegir con quién conectarse, o a la homofilia inducida, que surge de las limitaciones en las oportunidades de los individuos para hacer conexiones (2). Estos dos mecanismos y su importancia relativa han sido objeto de estudio en la investigación de redes sociales (14, 15). Sin embargo, como lo sugieren los resultados empíricos longitudinales (16, 17), los dos mecanismos de generación de homofilia no pueden separarse sin considerar la dinámica acumulativa de ventaja (10) que impulsa la evolución de las redes sociales: la elección de la homofilia crea circunstancias para la homofilia inducida, tales como grupos de personas similares que interactúan, que luego se refuerzan aún más en ciclos de elección e inducen homofilia. Si bien la dinámica de la homofilia se entiende bien en el caso de los modelos de punto de inflexión de la segregación residencial (18, 19), aún se necesita una comprensión similar de la dinámica en las redes sociales para validar y medir la amplificación de la homofilia (17).

Aquí, presentamos un modelo mínimo de evolución de las redes sociales para analizar en qué medida las restricciones estructurales causadas por la clausura triádica y la elección interactúan homofilia. El mecanismo de clausura triádica utiliza la red social existente para crear nuevas conexiones entre personas que comparten amigos comunes, conocidos u otras conexiones. Este mecanismo ha sido reportado como la restricción estructural más común (16) y puede explicar muchas características sobresalientes de las redes sociales empíricas. Estos incluyen una gran cantidad de triángulos cerrados entre conocidos y distribuciones de grados de cola gruesa (20–23). Por lo tanto, la clausura triádica debe considerarse como el mecanismo principal en la mayoría de los modelos dinámicos mínimos de redes sociales (20, 24, 25). En nuestro enfoque, se considera que los individuos pertenecen a cualquiera de los dos grupos (a y b) que representan los valores de un atributo de interés estático (género, clase, partido, etc.), y vuelven a conectar sus conexiones mediante dos mecanismos: clausura triádica (modelando la creación de enlaces a través de contactos actuales) y conexiones aleatorias [emulando cualquier mecanismo desconocido más allá de la clausura triádica, como la clausura focal en grandes focos (16, 26)]. La opción homofilia / heterofilia se implementa al aceptar nuevos enlaces con una probabilidad de sesgo que depende de la similitud de los atributos entre los individuos.

En este estudio, caracterizamos el rico tapiz del comportamiento emergente capturado por el modelo con un análisis de bifurcación de campo medio para diferentes tamaños de grupos relativos, probabilidades de clausuras triádicas y tasas de elección de homofilia. Medimos la cantidad de homofilia observada en la red, que interpretamos como la suma de la homofilia elegida (un parámetro en el modelo) más la homofilia inducida causada por la clausura triádica que actúa en una red social homofílica. Al ajustar los parámetros del sistema con datos empíricos sobre redes de amistad y comunicación, encontramos que, en las circunstancias correctas, incluso una pequeña cantidad de opciones de homofilia puede amplificarse en gran medida por la clausura triádica para producir grandes cantidades de homofilia observada. Además, encontramos que la interacción de la clausura triádica y la homofilia puede explicar la aparición de estructuras núcleo-periferia. Estos hallazgos sugieren que las observaciones de patrones de asociación homófilos en la sociedad no deberían explicarse únicamente sobre la base de una preferencia humana por la similitud, sino como una interacción en constante evolución entre las restricciones estructurales y la homofilia, una que requiere simulación computacional como parte central de el analisis.

Definición del modelo y parámetros

Introducimos un modelo de evolución de redes sociales con una interacción simultánea de clausura o cierre triádico y elección homofílica (ver Fig. 1, A a E para una ilustración y más detalles del modelo). El modelo está estilizado de tal manera que contiene un conjunto mínimo de mecanismos simples sobre cómo se hacen y se olvidan las relaciones sociales; Los detalles más allá de estos mecanismos centrales se modelan mediante una aleatoriedad uniforme para asumir la menor cantidad de información sobre ellos. La estructura social inicial es una red aleatoria con grupos de atributos estáticos a y b (de tamaños relativos na y nb, con na + nb = 1) distribuidos entre nodos de manera uniforme al azar e independientemente de la estructura de red inicial, de modo que haya una fracción Pab = Pba de enlaces entre grupos y fracciones Paa, Pbb dentro de cada grupo (Pab + Paa + Pbb = 1).





Fig. 1 Mecanismos de clausura triádica y elección homofílica.
(A) Un nodo focal seleccionado uniformemente al azar (nodo en el centro con límite verde) encuentra un vecino candidato ya sea (B) seleccionando un nodo uniformemente al azar con probabilidad 1 - c o (D) cerrando un triángulo con probabilidad c . (C y E) Para un nodo focal en el grupo i, el candidato vecino en el grupo j es aceptado con probabilidad de sesgo Sij (donde i, j ∈ {a, b}). Parametrizamos Sij con parámetros ajustables sa, sb de modo que
Saa = sa, Sbb = sb, Sab = 1 − sa y Sba = 1 − sb. Si se acepta el enlace potencial [línea discontinua en (B) y (D)], un enlace del nodo focal (seleccionado uniformemente al azar) se reemplaza por uno entre los nodos vecinos focales y candidatos. De lo contrario, no se vuelven a cablear los enlaces. (F) Probabilidad (T2) aa de elegir un vecino candidato con cierre triádico del mismo grupo que el nodo focal (a) en función de la homofilia observada oa = Taa para grupos de igual tamaño (na = nb) e igualmente conectados (Taa = Tbb y Tab = Tba = 1 − Taa). Si la red no se mezcla aleatoriamente (Taa ≠ 1/2), la probabilidad de cierre triádico eligiendo dos nodos del mismo grupo siempre es mayor que la misma probabilidad si la selección se realiza de manera uniforme al azar (1/2), lo que implica que El cierre triádico amplifica la homofilia observada existente en la red (o suprime la heterofilia). Sin embargo, el cierre triádico sin elección de homofilia no es suficiente para mantener la homofilia observada en la red, lo que haría que (T2) aa sea igual a la homofilia observada (las líneas punteadas y continuas se cruzan). Una excepción es el caso Taa = 1, donde existen dos componentes completamente separados, y el cierre triádico no puede crear enlaces entre ellos.

Desde su estado inicial, la red evoluciona con nodos que actualizan sus conexiones. En cada paso de tiempo, seleccionamos un nodo focal uniformemente al azar y un vecino candidato, que representa un encuentro social que podría conducir a una nueva relación social. El vecino candidato se elige por cierre triádico con probabilidad co uniformemente al azar de lo contrario [emulando cualquier otro mecanismo para la creación de enlaces más allá de la clausura triádica; (23, 27-30)]. El mecanismo de cierre triádico selecciona un vecino candidato muestreando aleatoriamente un vecino del nodo focal y luego un vecino del vecino muestreado. Si el enlace entre el nodo focal y el nodo candidato no se puede crear (porque crearía un enlace múltiple o un bucle automático, o porque el grado del nodo focal es cero), entonces no se realizan actualizaciones para el nodo focal en este paso

El enlace entre el nodo focal y el vecino candidato se crea con probabilidad Sab si el nodo focal está en el grupo a y el vecino candidato está en el grupo b. Los elementos Sab forman una matriz de sesgo 2 × 2 que especifica la cantidad de opciones de homofilia / heterofilia en la red social. Para simplificar, parametrizamos la matriz de sesgo como Saa = sa, Sab = 1 − sa, Sbb = sb, y Sba = 1 − sb, donde sa (sb) es la opción homofílica para el grupo a (b). De esta manera, cuando sa = sb = 1/2, todos los elementos de la matriz de sesgo también son 1/2, es decir, no hay elección de sesgo de homofilia. Multiplicar la matriz de sesgo por una constante cambia la velocidad de evolución de la red, pero no los puntos fijos de la dinámica. Tenga en cuenta que el sesgo depende solo de los grupos a los que pertenecen los dos individuos, lo que significa que los individuos tienen preferencias homogéneas de preferencia (31, 32).

Por último, como mantener las conexiones sociales requiere capacidad mental e inversión de tiempo, crear nuevas conexiones implica olvidar algunas de las antiguas (33). Modelamos este proceso eliminando aleatoriamente un enlace del nodo focal después de una creación exitosa del enlace. Esto mantiene el grado del nodo focal sin cambios (el individuo realiza la inversión de tiempo) pero altera los grados de los otros dos nodos afectados, cambiando así la distribución de grados de la red. Tenga en cuenta que la eliminación aleatoria de enlaces puede abrir triángulos, mientras que en realidad, los enlaces que están rodeados por triángulos tienen más probabilidades de ser enlaces fuertes (24) y, por lo tanto, es menos probable que se eliminen. Sin embargo, aquí optamos por la eliminación aleatoria de enlaces (29), que no implica estos supuestos adicionales de comportamiento social y es una opción típica en este tipo de modelos de redes sociales [junto con la eliminación aleatoria de nodos; (26, 27)].

Resultados

En nuestro enfoque, la interacción entre homofilia y cierre triádico (en una red social con dos grupos de atributos) forma un sistema dinámico en el que la evolución desde una red inicial arbitraria depende de los parámetros que regulan la elección homofílica (sa, sb) y el cierre triádico (c). Al igual que con cualquier otro modelo de red, el proceso estocástico asociado exhibe fluctuaciones aleatorias, pero la dinámica promedio de las cantidades de comportamiento clave, como la distribución de grados, el coeficiente de agrupamiento y, centralmente, la homofilia observada depende determinísticamente de los parámetros del modelo. Caracterizamos el comportamiento de la red siguiendo la dinámica de nuestro modelo usando una aproximación de campo medio y confirmamos nuestros resultados con simulaciones numéricas (ver Materiales y Métodos y los Materiales Complementarios).

La cantidad de homofilia que se puede observar directamente en la red modelo no es necesariamente la misma que el parámetro de homofilia elegido en el modelo. En una red con dos grupos de igual tamaño (na = nb), la homofilia observada dentro de los grupos a y b (denotado por oa y ob) es igual a la probabilidad de transición de que seguir un enlace de un grupo conduzca al mismo grupo (Taa y Tbb). Por lo tanto, cuando no hay cierre triádico (c = 0), la elección es homófilo igual a la fracción esperada de nodos vecinos en el mismo grupo (sa = oa = Taa y sb = ob = Tbb). Si uno de los grupos es más grande (na > nb) y no hay cierre triádico (c = 0), la fracción de vecinos en Taa, grupo a es más grande que el sesgo de homofilia elegido (sa). Es por eso que definimos una corrección de tamaño de grupo en la homofilia observada como


y equivalente para el grupo b. Tenga en cuenta que esta relación se simplifica a oa = Taa y ob = Tbb cuando los grupos de atributos son del mismo tamaño (ver Fig. 1F). La homofilia observada de tamaño corregido es igual a la elección de homofilia (oa = sa y ob = sb) cuando no hay cierre triádico (c = 0; ver Materiales y métodos). En el caso del cierre triádico arbitrario (c ≥ 0), definimos además la homofilia inducida ia tal que la homofilia observada es la suma de la homofilia inducida y la elección de la homofilia.



Consistentemente, para c = 0, tenemos ia = 0, y todo lo que se observa homofilia en la red social es elección homofílica.

Cuando los individuos forman nuevas aristas usando el mecanismo de cierre triádico en una red con patrones de conectividad homófilos existentes, se vinculan a su propio grupo incluso sin tener una opción explícita de sesgo de homofilia (Fig. 1F). Este proceso aumenta la homofilia observada (oa) en la red más allá de eso debido a la elección de la homofilia (sa), lo que a su vez aumenta la probabilidad de conexiones homofílicas en los próximos eventos de cierre triádico. Es decir, la homofilia observada existente originalmente debido a la elección de la homofilia crea homofilia inducida (más oportunidades para que personas similares se conozcan), lo que a su vez crea aún más homofilia inducida. Llamamos al resultado de esta amplificación homofilial de ciclo de ventaja acumulativa, ya que la cantidad de homofilia observada (oa) es mayor que la cantidad de homofilia elegida (sa) (vea la Fig. 2A para una ilustración). Los resultados de esta amplificación de homofilia acumulativa se muestran para grupos de igual tamaño y elección simétrica de homofilia (s = sa = sb) en la Fig. 2B. En el caso extremo de que no haya cableado aleatorio (falta de otros mecanismos de creación de enlaces), incluso un sesgo de homofilia de elección moderada (s ≥ 2/3) segregará la red social en grupos completamente desconectados (ver Fig. 2B para el campo medio solución y los Materiales suplementarios para una derivación de este resultado).



Fig. 2 Interacción entre cierre triádico y elección homofílica.
(A) Esquemas de los estados estacionarios a los que la red puede converger durante el proceso de recableado (puntos fijos estables de la dinámica del modelo basados ​​en un análisis de campo medio; ver los Materiales suplementarios). Las líneas continuas (discontinuas) representan una conectividad intragrupo e intergrupal grande (baja). El punto fijo de amplificación de homofilia 0 tiene muchos enlaces dentro de los grupos y unos pocos entre (valores altos de
Taa y Tbb). En el punto fijo núcleo-periferia + (-), el grupo grande (pequeño) forma el núcleo y atrae los enlaces del grupo periférico pequeño (grande): Tab y Tbb (Tba y Ta) son altos, mientras que Taa y Tba (Tbb y Tba) son bajos (consulte los Materiales complementarios para obtener detalles sobre la clasificación de puntos fijos). (B) Homofilia observada oa = Taa (fracción de vecinos en el mismo grupo de un nodo focal en el grupo a) al final de la dinámica en función de la elección homofilia s = sa = sb. Los tamaños de los grupos son iguales (na = nb), y la probabilidad de cierre triádico c es variada. Los cálculos de campo medio (las líneas continuas corresponden a puntos fijos estables y las líneas punteadas a las inestables) y las simulaciones numéricas (cruces) concuerdan muy bien (consulte los Materiales suplementarios para un análisis sistemático). Recuadro: Caso c = 0.9 donde existen dos puntos estables / inestables (líneas continuas / discontinuas). Como na = nb, los puntos fijos +/− son equivalentes, pero para una elección adecuada de homofilia (0.56 <s <0.70), un grupo se convierte en el núcleo y la otra periferia dependiendo de la red inicial y / o la posibilidad aleatoria.

Además de la amplificación de homofilia, el mecanismo de cierre triádico y la elección de homofilia también pueden conducir a una estructura social núcleo-periferia (34-36) donde el grupo central se conecta principalmente consigo mismo, mientras que el grupo periférico se conecta casi exclusivamente con el grupo central incluso en la presencia de elección homofílica (ver Fig. 2A para una ilustración de la estructura núcleo-periferia y la Fig. 2B insertada para los resultados analíticos y de simulación). Este efecto, aparentemente opuesto al impulso de los individuos por encontrar conexiones homófilas en el grupo periférico, se debe a la gran probabilidad de encontrar un vecino candidato en el grupo central al intentar cerrar triángulos (Fig. 1D). Esta probabilidad es mayor cuando la conectividad entre los dos grupos es débil, lo que explica el papel de la elección de la homofilia en la formación de la estructura núcleo-periferia (ver Materiales complementarios para un esquema similar a la figura 1F). La amplificación por homofilia y la periferia del núcleo son dos resultados competitivos de la interacción entre el cierre triádico y la elección por homofilia. Una estructura social núcleo-periferia es posible dentro de redes de otro modo simétricas con un alto cierre triádico cuando hay suficiente opción de homofilia para impulsar la estructura núcleo-periferia, pero no lo suficiente como para inclinar el equilibrio hacia dos grupos estrechamente interconectados. Alternativamente, puede aparecer una estructura núcleo-periferia cuando hay suficiente asimetría en la red social debido a los tamaños desiguales del grupo o los sesgos de elección de la homofilia (Fig. 3).




Fig. 3 Diagramas de fase de puntos fijos disponibles.
Las áreas de sombreado diferente corresponden a rangos de parámetros en los que existen varios puntos fijos (puntos estables 0, + y - o los puntos inestables correspondientes U0, U + y U−) (ver Fig. 2A). Tenga en cuenta que los puntos fijos inestables son puntos de silla de montar con conectividades relativas cualitativamente similares que sus variantes estables. (Arriba) La opción de homofilia es la misma para ambos grupos (s = sa = sb), y los puntos fijos se muestran en función de sy c. (Abajo) La elección de homofilia para los grupos es variada, y los puntos fijos se muestran en función de sa y sb. Aquí, la probabilidad de cierre triádico se fija en c = 0.95. (Izquierda) Los grupos son del mismo tamaño (na = nb). (Derecha) Los grupos tienen un tamaño desigual (na = 0.1). La línea discontinua corresponde a los valores de los parámetros en la figura 2B y el punto a las figuras 4A y 4B. Los resultados en el panel principal de la Fig. 2B están en la región blanca con un único punto fijo (0) (panel superior izquierdo).


El aumento de las estructuras sociales de amplificación de homofilia y núcleo-periferia depende no solo de los parámetros que regulan el cierre triádico y la elección de la homofilia, sino también de las condiciones iniciales y las fluctuaciones aleatorias de la evolución de la red, lo que significa que el sistema muestra memoria de restricciones estructurales anteriores o histéresis de homofilia (vea la Fig. 2B para ver un ejemplo donde cualquiera de los dos grupos puede convertirse en el núcleo, y la Fig. 3 para un análisis más sistemático). En otras palabras, si los parámetros del sistema cambian (es decir, la elección de la homofilia y la probabilidad de cierre triádico), la red social puede experimentar cambios dramáticos, no reversibles, de modo que volver a los parámetros anteriores no devuelve el sistema al mismo estado final (es decir, El mismo punto fijo). Esto sugiere que las redes sociales pueden tener memoria persistente de homofilia, con una estructura que depende tanto de los sesgos de homofilia de elección actuales como de su historia. Por lo tanto, especulamos que el momento de las intervenciones destinadas a reducir la homofilia observada o la formación de grupos centrales en, por ejemplo, una red social en línea puede ser crítico. Una vez que la red ha alcanzado un punto estable de su dinámica o está cerca de uno, puede ser mucho más difícil conducir el sistema a otro punto estable al intentar cambiar la elección de los individuos u otros parámetros.

Las escalas de tiempo en las que la red social se dirige hacia la amplificación de homofilia o una estructura núcleo-periferia varían mucho (Fig. 4A). La amplificación de homofilia generalmente es un proceso rápido, que requiere solo unos pocos eventos de cableado por enlace para que la red social alcance un punto estable. Por otro lado, una estructura social núcleo-periferia evoluciona lentamente hacia el equilibrio, e incluso si una red eventualmente se estabilizara en una estructura núcleo-periferia, puede exhibir primero una rápida amplificación de homofilia (Fig. 4B). Este resultado sugiere que incluso si una red social real (en la sociedad o en las plataformas en línea) siguiera con precisión nuestro modelo estilístico, podría no mostrar una estructura estable de periferia central completa, sino un estado transitorio que se desplaza lentamente hacia el dominio estructural de uno grupo sobre el otro. Si la red se dirige primero hacia la amplificación homofílica, el grupo que eventualmente se convierte en el núcleo puede depender puramente de la posibilidad aleatoria (Fig. 4A).



Fig. 4 Modelo de evolución temporal.
Distancia euclidiana δ en
(Taa, Tbb) -espacio entre el estado actual de la dinámica y los puntos fijos (A) + y (B) U0 en función del tiempo t (en unidades del número promedio de veces que se selecciona un enlace para volver a cablear ) para na = nb, c = 0.9 ys = 0.6 (línea vertical discontinua en la figura 2B insertada). Los marcadores son resultados de simulación y las líneas son soluciones de campo medio. Los colores corresponden a tres configuraciones de red iniciales diferentes. (B) La dinámica amplifica la homofilia primero al acercarse rápidamente al punto inestable U0 y desviarse de él después de ∼100 pasos de tiempo. (A) Las curvas azul y naranja se acercan lentamente al punto estable núcleo-periferia +. La curva verde se aproxima al otro punto estable núcleo-periferia (-).

Para estimar cuánto difiere la homofilia observada de la homofilia elegida en las redes sociales del mundo real, así como para encontrar el punto estable que mejor se corresponda con su estructura, ajustamos varios conjuntos de datos empíricos de interacciones sociales fuera y en línea a nuestro modelo de cierre triádico y elección homofílica (Fig. 5). Utilizamos dos enfoques para ajustar los datos: (i) resolver para la elección los parámetros de homofilia sa y sa a partir de los puntos fijos de las ecuaciones de campo medio, dada la matriz T en los datos y una probabilidad de cierre triádica c [denotamos estas soluciones sa (c) y sb (c)], y (ii) utilizando un método aproximado de cálculo bayesiano (ABC) (37) para encontrar estimaciones para los parámetros del modelo (denotado por y ). Para comparar fácilmente el efecto del cierre triádico a través de los conjuntos de datos, primero normalizamos la elección y observamos la homofilia de manera que 0 no implica homofilia / heterofilia en la red, y 1 implica la máxima homofilia ( y ). Luego definimos la amplificación de homofilia A como la diferencia relativa entre la elección normalizada y las homofilias observadas






(3) donde inducida homofilia i sigue la ecuación. 2. Tenga en cuenta que la homofilia observada es la misma que la estimación de campo medio para c = 0 (ver Materiales y Métodos para más detalles).



Fig. 5 Amplificación de la homofilia en las redes sociales del mundo real.
(Arriba) Amplificación de homofilia estimada A (véase la ecuación 3) para redes empíricas. Las líneas son ajustes de campo medio en función del cierre triádico c. Los puntos corresponden a los valores medios estimados de amplificación de homofilia utilizando un método ABC, representado en el cierre triádico medio estimado 〈c〉. Los enlaces, nodos y atributos en cada conjunto de datos son los siguientes: amistades de Facebook para usuarios por año de graduación en la mayor de las 100 redes (Facebook), enlaces entre blogs políticos por partido (Polblogs), amistades entre estudiantes por género (escuela), Amistades de Last.fm para usuarios por género (Last.fm), y vínculos entre personas en juntas directivas en Noruega en 2010 (Directores). El grupo más pequeño a se denota en rojo. (Gráficos de dispersión) Amplificación de homofilia estimada Aa y Ab, y la elección media estima homofilia ⟨sABCa⟩
y ⟨sABCb⟩ (ambos del método ABC) en las 100 universidades del conjunto de datos de Facebook, donde los dos grupos i = a, b (na <nb) son años de graduación. La red más grande está marcada con una cruz roja (consulte Materiales y métodos y la Tabla 1 para obtener detalles del conjunto de datos). (Inferior) Distribuciones estimadas para la elección de homofilia sABCa y sABCb utilizando el método ABC para el conjunto de datos del panel superior correspondiente (colores denotan grupo), donde las líneas verticales representan estimaciones medias (⟨sABCa⟩ y ⟨sABCb⟩).



En términos de ajustar el comportamiento de campo medio del modelo a los datos, tres redes muestran amplificación de homofilia en ambos grupos: una red de amistad de Facebook que consta de dos clases en una universidad de EE. UU. (38), una red de contacto de un día de estudiantes de primaria dividido por género (39), y una red de blogs políticos divididos por afiliación partidaria (40). El resto de ellos, una red de amistad en un sitio web para compartir hábitos de escuchar música (Last.fm) y una red de directores de la compañía (41), ambos divididos por género, muestran un patrón donde parte de la homofilia observada dentro de uno de los grupos podría explicarse por amplificación de homofilia, pero la elección de homofilia en los otros grupos podría subestimarse debido al mecanismo de cierre triádico. En el caso de la junta directiva, observamos la elección de la heterofilia dentro de los hombres y la elección de la homofilia dentro de las mujeres, lo que junto con el mecanismo de cierre triádico explica el núcleo de las directoras observadas en el estudio donde se introdujo esta red (41). En el procedimiento de ajuste de campo medio, la amplificación de homofilia máxima posible [A (c = 1)] supera el 50% para la red social de blogs políticos, la red de Facebook más grande y el consejo de administración. La estimación exacta de la elección depende de la tendencia latente de cierre triádico en la red (c). Sin embargo, la paridad de la amplificación [A (c)] es independiente de esta estimación, y el crecimiento de la amplificación es monótono en función de c.

La imagen cualitativa que obtenemos para las estimaciones de amplificación utilizando el método ABC es en su mayoría similar al proceso de ajuste de campo medio. Los cambios se producen principalmente en las escalas de los efectos para algunos conjuntos de datos, y en los datos de la escuela primaria, la amplificación casi inexistente ahora se estima como amplificación negativa. Además, el método ABC nos da una estimación de la probabilidad de cierre triádico (cABC〉), que varía de muy alta (para las redes de Facebook y blogs políticos) a media (para los otros conjuntos de datos). Las distribuciones posteriores completas para las variables de homofilia de elección tienen una buena cantidad de varianza, lo que significa que las estimaciones puntuales que damos son solo indicativas del comportamiento esperado (ver Fig.5 y los Materiales suplementarios para distribuciones posteriores para otros valores de parámetros). El método ABC también nos proporciona una distribución de posibles matrices T iniciales o, de manera equivalente, matrices P (consulte los Materiales suplementarios para ver las distribuciones relacionadas). Aunque para la mayoría de las redes la condición inicial es en gran medida irrelevante, para la red de blogs políticos, la homofilia observada debe ser alta en la condición inicial. Esto se debe a que la red de blogs políticos se encuentra en una parte de un espacio de parámetros con múltiples puntos fijos (es decir, histéresis de homofilia). Nuestro modelo sugiere que la red podría haber estado en un punto fijo núcleo-periferia si la red no hubiera evolucionado históricamente desde una situación estructuralmente polarizada (consulte los Materiales complementarios para más detalles).

Un análisis sistemático de 100 redes de Facebook (38) revela que la mayor parte de los valores de amplificación estimados por ABC son positivos, que van hasta el 60% observado para la mayor de estas redes (y más en algunos casos extremos). Tenga en cuenta que existen grandes diferencias entre las estimaciones de homofilia de elección ( y), y están altamente correlacionados (r de Pearson = 0,88), lo que puede indicar que la cantidad de opciones de homofilia que observamos en cada universidad es una característica de la universidad y no de la clase de los estudiantes. Los resultados en nuestros dos procedimientos de ajuste sugieren que usar la homofilia observada como un estimador ingenuo para la elección de la homofilia puede conducir a una sobreestimación o subestimación grave de la intensidad de la homofilia (incluso para una cantidad moderada de cierre triádico) en varias redes sociales del mundo real tanto en la sociedad como en las plataformas en línea.

Discusión

Nuestros hallazgos muestran que los patrones de asociación homófilos que se ven típicamente en las redes sociales empíricas no solo surgen debido a una preferencia individual por la similitud, sino que también son el resultado de un proceso de ventaja acumulativa que tiende a amplificar este sesgo intrínseco a la elección debido a la homofilia. al cierre triádico. Mediante un modelo mínimo de evolución de las redes sociales, encontramos límites en las cantidades de cierre triádico y la elección de la homofilia necesaria para que surja dicha amplificación de la homofilia. Esto corrobora teóricamente observaciones previas en redes organizacionales (42) y de comunicación (16, 17). En el caso genérico de una cantidad moderada de eventos de cierre triádicos y grupos de atributos de tamaño similar, la elección homofílica se amplifica mediante el cierre triádico a través de un mecanismo de punto de inflexión análogo al responsable de la segregación residencial en el modelo de Schelling (18), en el que la segregación toma colocar en la topología de la red social en lugar de en el espacio físico.

Además de la amplificación de la homofilia, nuestros resultados sugieren que la interacción entre el cierre triádico y la elección de la homofilia es una explicación plausible para el surgimiento de la estructura centro-periferia que se encuentra en las redes sociales, de comunicación, académicas, comerciales y financieras (34-36). En tales estructuras, el grupo central de individuos está tan bien conectado que seguir los enlaces a través del cierre triádico casi siempre conduce al mismo grupo, haciendo que el núcleo esté aún más conectado. Si bien el cierre triádico y la homofilia ya se consideran factores contribuyentes en la formación de comunidades (grupos cohesivos y surtativos densamente conectados), el impacto de los atributos de los nodos en la estructura núcleo-periferia está menos estudiado. Nuestro modelo implica que la transición dinámica a las redes núcleo-periferia es lenta y a menudo precedida por una amplificación homofílica rápida pero temporal. Esto puede explicar en parte por qué la literatura sobre redes sociales se ha centrado en redes agrupadas en lugar de otros tipos más raros de estructuras de escala intermedia.

Los efectos combinados del cierre triádico y la elección de la homofilia también incluyen la memoria de las restricciones homofílicas, es decir, sistemas con puntos estables múltiples y coexistentes para una amplia gama de tamaños de grupos relativos y cantidades de cierre triádico y elección de la homofilia. En otras palabras, incluso si se cambian las tendencias de elección de homofilia o de cierre triádico, una red social puede preservar la memoria de su configuración estructural actual. Esto hace que sea difícil alterar la forma de una red estable, por ejemplo, variando la opción típica de homofilia de sus individuos. Sobre la base de estos hallazgos, esperamos que, al planificar intervenciones externas para reducir la segregación social inducida por homofilia, se tomen medidas de acción más temprano que tarde, ya que la escala de intervenciones con un efecto significativo en la estructura de la red social aumenta con tiempo. Aún así, se necesita más investigación antes de que podamos ofrecer sugerencias concretas sobre estrategias de intervención.

Debido a que la elección de la homofilia no es directamente observable a partir de los datos estáticos de las redes sociales, es necesario inferirla a partir de la información disponible. Dicha inferencia siempre está sujeta a asumir un modelo para la creación de datos, y las estimaciones exactas para la elección de la homofilia siempre deben interpretarse teniendo esto en cuenta. Al ajustar la solución de campo medio del modelo a los datos, se supone que la red del mundo real está en un estado estable, ya que se basa simplemente en hacer coincidir las probabilidades de enlace (T) de los datos con los estados estables del modelo. El método ABC más elaborado implica más observables y un número finito de pasos de evolución. También se podría incluir el número de pasos t como un parámetro apropiado para investigar su efecto en la convergencia del método. Los resultados de los procedimientos de ajuste de campo medio y ABC coinciden cualitativamente entre sí en el sentido de que las conclusiones generales extraídas de ellos son las mismas. Sin embargo, los valores estimados puntuales son diferentes en muchos casos, y existe una cantidad notable de variación en las distribuciones posteriores de las estimaciones de parámetros para el método ABC. Esta variación podría reducirse al permitir tamaños de red más grandes (que están limitados por restricciones computacionales), al incluir diferentes estadísticas de resumen en la función de discrepancia, al ajustar aún más los parámetros del método ABC o al incluir mecanismos adicionales en el modelo. La aplicación de estos métodos a modelos de redes mecanicistas es un enfoque relativamente nuevo (43), y se pueden esperar nuevos desarrollos en esta área a medida que estos métodos maduren.
A diferencia de nuestro enfoque, los modelos estacionarios no mecánicos, como los gráficos aleatorios exponenciales (ERGM), también se pueden utilizar para estudiar la interacción entre el cierre triádico y la homofilia (44-46). La diferencia conceptual clave para nuestro enfoque es que los ERGM son modelos de red estática, que pueden usarse para equilibrar la tendencia hacia triángulos, enlaces homofílicos, triángulos homofílicos y muchas otras características de la red como factores que explican la estructura de la red. Nuestro enfoque es más bien un modelo de interacción acumulativa de dos mecanismos explícitos y microscópicos de evolución de red [tenga en cuenta, sin embargo, que algunos modelos de evolución de red microscópica cuidadosamente elaborados pueden converger, bajo ciertos supuestos, a ERGM como estados estables (46, 47) y ERGM a menudo se muestrean con los métodos de Monte Carlo de la cadena de Markov en los que las redes se vuelven a cablear (48)]. Esto significa que los ERGM no modelan explícitamente procesos acumulativos ni dicen nada sobre escalas de tiempo múltiples o estados metaestables, lo que encontramos como consecuencia de combinar el cierre triádico con un sesgo de homofilia de elección.

Nuestro enfoque supone que los atributos biológicos y culturales subyacentes a la homofilia son constantes en el tiempo. Si bien este supuesto es principalmente cierto para las características individuales a largo plazo, como el género o la religión, no lo es tanto para rasgos como la afiliación política, la ocupación y las opiniones. Las redes donde los enlaces y los atributos cambian de forma adaptativa entre sí (es decir, siguiendo la dinámica coevolutiva adaptativa) se han estudiado ampliamente para detectar fenómenos biológicos, económicos y sociales (49-51). Cuando se favorecen los enlaces entre nodos con atributos similares, la dinámica adaptativa se autoorganiza en redes heterogéneas donde los grupos de individuos que comparten atributos son estructuralmente distinguibles entre sí (52–56). Tal característica genérica de las redes adaptativas hace probable que nuestras observaciones de los efectos acumulativos del cierre triádico y la homofilia se mantengan incluso en el caso de atributos individuales dependientes del tiempo (57, 58). El estudio de una interacción adaptativa entre el cierre triádico y la homofilia es una línea digna de investigación futura que puede revelar ciclos de retroalimentación adicionales y complejos entre la estructura social y la evolución de los atributos.

La simplicidad de nuestro marco sugiere que la presencia de cierre triádico y elección de homofilia para un valor de atributo dado es suficiente para explicar algunas características sobresalientes de las redes sociales empíricas como la amplificación de homofilia y las estructuras núcleo-periferia. Sin embargo, los efectos de las características más realistas de la sociedad, como la existencia de más de dos valores para un solo atributo, restricciones estructurales más allá del cierre triádico y la coexistencia de varios atributos en una población [en el espíritu del modelo cultural de Axelrod difusión (59)], quedan por estudiar. Anticipamos que nuestros resultados promueven aún más interés en la simulación computacional basada en datos de las interacciones sociales y arrojan más luz sobre la relación entre el cierre triádico y la homofilia. Esta visión ayudará a los investigadores y a los responsables políticos a diseñar estrategias de intervención para disminuir los efectos más adversos de la toma de decisiones homofílicas, incluidas las estructuras sociales segregadas, como los lugares de trabajo específicos de género y los sistemas políticos partidistas.


Ver Materiales y métodos

lunes, 29 de agosto de 2016

ARS 101: Clausura triádica

Grafos para bases de datos para principiantes: Teoría de grafos y modelado predictivo

Conexión de nodos en una base de datos gráfica es fundamentalmente diferente de llenar una tabla con datos. Si usted es nuevo para representar gráficamente las bases de datos: Lee esto.

por Joy Chao ·- DZone

Los grafos están en todas partes, desde que ilustra las conexiones entre los caracteres de Juego de Tronos hasta el seguimiento de las interacciones intermediarios cientos de miles de servidores en una red pública.

A lo largo de esta serie blog, hemos hablado mucho sobre los detalles prácticos de trabajo con las bases de datos del gráfico. Ahora es el momento para hablar de la teoría de grafos, con su una aplicación mucho más práctico para la vida cotidiana.

Como un campo más desarrollado, la teoría de grafos nos ayuda a ganar la penetración en nuevos dominios. En combinación con las ciencias sociales, hay muchos conceptos que se pueden utilizar sin rodeos para obtener información de los datos del gráfico.

En este serie del blog “Graph Databases for Beginners”, hemos discutidos sobre why graphs are the future, why data relationships matter, the basics of data modeling, data modeling pitfalls to avoid,why a database query language matters, why we need NoSQL databases, ACID vs. BASE, a tour of aggregate stores, other graph data technologies, native versus non-native graph processing and storage, y algoritmos de búsqueda en grafos.
En el post de la semana pasada, hemos explicado los mecanismos transversales de menor nivel de algoritmos de grafos. Si usted no ha leído todavía, yo recomendaría hacerlo con el fin de entender mejor el orden superior de los análisis que vamos a discutir. Ahora vamos a echar un vistazo a algunos de los conceptos clave de la teoría de grafos social.

Las clausuras triádicas

Una de las propiedades más comunes de grafos sociales es el de clausuras triádicas. Esta es la observación de que si dos nodos están conectados a través de un camino con un tercer nodo mutuo, hay una mayor probabilidad de que los dos nodos se conviertan conectado directamente en el futuro.

En un entorno social, una clausura triádica sería una situación en la que dos personas con un amigo en común tienen una mayor probabilidad de encontrarse entre sí y convertirse en conocerse.

La propiedad de la clausura triádica es más probable que se confirmó cuando un gráfico que tiene un nodo A con una fuerte relación con otros dos nodos, B y C. Esto da a continuación, B y C Una probabilidad de una relación, ya sea débil o fuerte. Aunque esto no es una garantía de una relación potencial, que sirve como un indicador predictivo creíble.

Vamos a echar un vistazo a este ejemplo.





Por encima de una jerarquía organizativa en Alice maneja tanto Bob y Charlie. Esto es bastante extraño, ya que sería poco probable que Bob y Charlie sean no conocerse mientras que comparte el mismo administrador.

Tal como es, hay una gran posibilidad de que terminarán trabajando juntos debido a la propiedad de clausura triádica. Esto creará una relación cualquiera WORKS_WITH [Trabaja_con] (fuerte) o (débil) PEER_OF [Es_par_de] entre ellos dos, cerrando el triángulo - por lo tanto el término clausura triádica.





Balance estructural

Sin embargo, otro aspecto a considerar en la formación de clausuras triádicas estables es la calidad de las interacciones existentes en el grafo. Para ilustrar el concepto siguiente, asumen que la relación MANAGES [DIRIGE A] es algo negativo, mientras que las relaciones PEER_OF y WORKS_WITH son más positivas.

Basado fuera de la propiedad de clausura triádica, podemos suponer que podemos llenar la tercera relación con cualquier etiqueta, como todo el mundo que tiene gestionar entre sí como en la primera imagen de abajo o la situación extraña en la segunda imagen a continuación.





Sin embargo, se puede ver cómo esas situaciones incómodas de trabajo estarían en realidad. En la segunda imagen, Charlie encuentra a sí mismo tanto el par de un jefe y un compañero de trabajo. Sería difícil para Bob a encontrar la manera de tratar a Charlie - como un compañero o compañera de trabajo como el de pares de su jefe?

Tenemos una preferencia innata por la simetría estructural y estratificación racional. En la teoría de grafos, esto se conoce como equilibrio estructural.

Una clausura triádica estructuralmente equilibrado está hecha de relaciones de todos los sentimientos fuertes y positivos (tales como el primer ejemplo de abajo) o dos relaciones con los sentimientos negativos y una única relación positiva (segundo ejemplo).




Aprender a utilizar los conceptos de la teoría de grafos sociales y modelos de predicción para entender los datos conectados

Las clausuras equilibradas ayudan con el modelado predictivo en los grafos. La simple acción de búsqueda de posibilidades para crear cierres equilibradas permite la modificación de la estructura gráfica para el análisis de predicción precisa.

Los puentes locales

Podemos ir más allá y obtener una perspectiva más valioso en el flujo de las comunicaciones de nuestras organizaciones examinado puentes locales. Estos se refieren a un empate entre dos nodos en los extremos del puente local no están conectados de otro modo, ni comparten los vecinos comunes. Se puede pensar en puentes locales como las conexiones entre dos grupos distintos de los grafos. En este caso, uno de los lazos tiene que ser débil.

Por ejemplo, el concepto de vínculos débiles es relevante en algoritmos para la búsqueda de empleo. Los estudios han demostrado que las mejores fuentes de empleo provienen de conocidos más flexibles, más que amigos cercanos. Esto se debe a los amigos más estrechos tienden a compartir una visión del mundo similar (están en el mismo componente del grafo) pero los amigos más flexibles a través de un puente local son en una red social diferente (y están en un grafo de un componente diferente).





En la imagen de arriba, Davina y Alice están conectadas por un puente local, sino que pertenecen a diferentes componentes del grafo. Si Davina fueron a buscar un nuevo trabajo, que sería más probable encontrar una recomendación éxito de Alicia que de Frances.

Esta propiedad de los puentes locales son débiles es algo que se encuentra a través de grafos sociales. Como resultado, podemos hacer los análisis predictivos basados ​​en puente locales derivada empíricamente y fuertes nociones de clausuras triádicas.

Conclusión final

Si bien los grafos y nuestra comprensión de ellos tienen su origen en cientos de años de estudio, seguimos encontrando nuevas maneras de aplicar a nuestra vida personal, social y de negocios. La tecnología actual ofrece otro método para la comprensión de estos principios en la forma de grafos de base de datos moderna.

Como hemos visto a lo largo de la serie "Grafos de bases de datos para principiantes" del blog, simplemente hay que entender cómo aplicar algoritmos de teoría de grafos y técnicas de análisis con el fin de lograr nuestros objetivos. Tome una mirada retrospectiva a los demás puestos de esta serie y obtendrá las habilidades que necesita para aprovechar el poder de los gráficos.