jueves, 28 de mayo de 2015

Barabasi abre su empresa: Redes de proteínas

Cómo un emprendimiento intenta comprender la red de relaciones de enfermedades
por el Dr. Bertalan Mesko - Science Roll


En la oficina del sótano de Jeff Hammerbacher de la Escuela de Medicina Icahn de Mount Sinai, una supercomputadora llamada Minerva, nombre de la diosa romana de la sabiduría y la medicina, se instaló en 2013. En pocos meses Minerva generó 300 millones de nuevos cálculos para apoyar las decisiones de atención médica. El Dr. Joel Dudley, director de informática biomédica en la Escuela de Medicina Icahn, dijo que lo que están tratando de construir un aprendizaje del sistema de salud.

"Primero tenemos que recoger los datos en una gran población de personas y conectarse que con los resultados. Vamos a tirar de todo lo que pensamos que sabemos sobre la biología y vamos a mirar las mediciones primarias de cómo estas cosas se están moviendo dentro de una población grande. Finalmente, los datos nos dirán cómo la biología está cableada".
De La Guía para el Futuro de la Medicina

Cuando se reunieron y analizaron los datos de salud de 30.000 pacientes que se ofrecieron a compartir su información, resultó que podría haber nuevos grupos o subtipos de diabetes. Mediante el análisis de grandes cantidades de datos que podría ser posible identificar los genes que son únicos a los pacientes con diabetes en estos diferentes grupos, proporcionando potencialmente nuevas maneras de entender cómo nuestro fondo genómico y el medio ambiente están relacionados con la enfermedad, sus síntomas y tratamientos.

Analizando los datos de grande es clave para el futuro de la asistencia sanitaria. Pero no es sólo el poder computacional, sino un nuevo paradigma sobre cómo nos fijamos en las redes de enfermedades. Me encantó el libro, Burst, de Albert-László Barabási, el experto conocido en el mundo de medicina de red. Demostró que hay patrones ocultos detrás de todo, desde mensajes de correo electrónico a la ciencia.



Tuve la oportunidad de conocerlo en persona hace unas semanas y charlamos acerca de sus teorías de la medicina de la red durante una hora. Él piensa relaciones enfermedad de la enfermedad se pueden predecir y descubrieron a través de la red de proteínas, llamada interactoma que es incompleta en este momento. Él y su equipo piensan que hay huellas dactilares moleculares detrás de las enfermedades y las estructuras ocultas que sólo pueden ser descubiertos con algoritmos inteligentes y métodos bioinformáticos.


Mapa de las interacciones proteína-proteína en el asma. El color de un nodo significa el efecto fenotípico de la eliminación de la proteína correspondiente (rojo, letal; verde, no letal, de color anaranjado, crecimiento lento; amarillo, desconocido).

El sistema que han estado desarrollando es el objetivo de la interpretación de las expresiones de genes y datos del estudio de asociación amplia del genoma para la identificación de objetivos de drogas y re-propositivo. El nombre de la emocionante puesta en marcha de Barabási es DZZOM, derivada de su mapa llamado "Diseasome". Su enfoque y las herramientas son sin duda ofreciendo nuevas oportunidades para reclasificar la relación de la enfermedad desde una perspectiva de red y las interacciones a nivel molecular. Obviamente, las compañías biofarmacéuticas son los objetivos de cebadores para sus servicios.

Vamos a ver cómo se transforma la manera en compañías farmacéuticas desarrollar nuevos medicamentos y cómo afecta a la medicina todos los días. Hasta entonces, leer el artículo publicado en la revista Science.

lunes, 25 de mayo de 2015

ARS 101: Análisis de redes en organizaciones

Teoría y análisis de redes en las organizaciones

cómo las relaciones influyen en el comportamiento

Historia y orientación

La idea de las redes sociales y las nociones de la sociometría y sociogramas apareció hace más de 50 años. Barnes (1954) se le atribuye haber acuñado el concepto de redes sociales, una salida de su estudio de una parroquia isla noruega a principios de 1950.

Supuestos básicos y afirmaciones

Núcleo: El análisis de redes (teoría de redes sociales) es el estudio de cómo la estructura social de las relaciones en torno a una persona, grupo u organización afectan las creencias o comportamientos. Las presiones causales son inherentes a la estructura social. El análisis de redes es un conjunto de métodos para detectar y medir la magnitud de las presiones. El axioma de cada enfoque de red es que la realidad debe ser concebida e investigado desde el punto de vista de las propiedades de las relaciones entre y dentro de las unidades en lugar de las propiedades de estas mismas unidades principalmente. Es un enfoque relacional. En las ciencias sociales y la comunicación de estas unidades son unidades sociales: individuos, grupos / organizaciones y sociedades.
Afirmaciones: Rogers caracteriza a una red de comunicación como un conjunto de "individuos interconectados que están vinculados por flujos de comunicación estampadas" (1986). Una red de comunicaciones estudios de análisis de "los vínculos interpersonales creadas por la esquila de la información en la estructura de la comunicación interpersonal" (1986), es decir, la red.

El análisis de redes dentro de las organizaciones

Alcance:

En general, el análisis de redes se centra en las relaciones entre las personas, en lugar de en las características de las personas. Estas relaciones pueden comprender los sentimientos que la gente tiene uno para el otro, el intercambio de información, o cambios más tangibles como los bienes y el dinero. Mediante la cartografía de estas relaciones, el análisis de redes ayuda a descubrir los patrones de comunicación emergentes e informales presentes en una organización, que puede entonces ser comparada con las estructuras formales de comunicación. Estos patrones emergentes pueden ser utilizados para explicar varios fenómenos organizacionales. Por ejemplo, los empleados tienen lugar en la red de comunicaciones (como se describe por sus relaciones), influye en su exposición y control de la información (Burt, 1992; Haythornthwaite, 1996). Dado que los patrones de relaciones traer empleados en contacto con las actitudes y comportamientos de los otros miembros de la organización, estas relaciones también pueden ayudar a explicar por qué los empleados desarrollan ciertas actitudes hacia los acontecimientos de organización o asuntos relacionados con el trabajo (teorías que se ocupan de estos asuntos se llaman "contagio teorías ", cf. Ibarra y Andrews, 1993; Burkhardt, 1994; Meyer, 1994; Feeley y Barnett, 1996; Pollock, Whitbred y contratista, 2000). Recientemente hay un interés creciente por qué las redes de comunicación surgen y los efectos de las redes de comunicación (Monge y contratista, 2003). Además, hay una cantidad sustancial de la literatura disponible sobre cómo networkdata recogida dentro de las organizaciones, se puede analizar (cf. Rice & Richards, 1985; Freeman, blanco y Romney, 1992; Wasserman y Faust, 1994; Scott, 2000).

Aplicaciones:

Técnicas de análisis de redes se centran en la estructura de comunicación de una organización, que puede ser operacionalizado en varios aspectos. Características estructurales que se pueden distinguir y analizados mediante el uso de técnicas de análisis de redes son, por ejemplo, los patrones de comunicación (formales e informales) en una organización o la identificación de los grupos dentro de una organización (camarillas o grupos funcionales). También funciones relacionadas con la comunicación de los empleados se pueden determinar (por ejemplo, estrellas, porteros, y los aislados). Especial atención se puede dar a los aspectos específicos de los patrones de comunicación: los canales de comunicación y medios de comunicación utilizados por los empleados, la relación entre los tipos de información y las redes de comunicación resultantes, y la cantidad y las posibilidades de comunicación de abajo hacia arriba. Características adicionales que podrían, en principio, ser investigados utilizando técnicas de análisis de redes son la carga de comunicación según la percepción de los empleados, los estilos de comunicación utilizados, y la eficacia de los flujos de información.

Modelo Conceptual (de una sociedad red)

Redes de conexión individuos, grupos, organizaciones y sociedades.
Fuente: Van Dijk 2001/2003

Métodos favoritos

Entrevistas, encuestas.

Alcance y aplicación

Pensar en términos de redes y el método de análisis de redes han ganado terreno en muchas disciplinas, incluyendo la psicología social, la antropología, la ciencia política, y las matemáticas, así como las comunicaciones. El análisis de redes genera información sobre los siguientes tipos de funciones de red: el papel de miembros, el papel de enlace, el papel de la estrella, el papel aislante, el papel-frontera que abarca, el papel de puente, y el papel no participante. El análisis de redes se hace en las organizaciones, la sociedad, los grupos, etc. El modelo de red anima a los planificadores de comunicación e investigadores para utilizar las nuevas variables de causa / efecto en su análisis. Por ejemplo, las propiedades de la red de comunicaciones muy, tales como la conectividad, la integración, la diversidad y la apertura (Rogers y Kincaid, 1981).

Ejemplo

Rogers y Kincaid estudian en Corea cómo las mujeres en un pequeño pueblo se organizaron para mejorar las condiciones generales de vida para ellos y sus familias.

Referencias

Publicaciones clave en análisis de red 


  • Mouge, P. & Contractor, N. (2003). Theories of Communication Networks. Cambridge: Oxford University Press.
  • Berkowitz, S.D. (1988). Afterword: Toward a formal structural sociology. In: Wellman, B. & Berkowitz, S.D. (Eds.). Social Structures, A network approach (477-497). London: Jai Press.
  • Knoke, D. & Kublinski, J.H. (1982). Network Analysis. Beverley Hills: Sage Publications
  • Dijk, J.A.G.M. van (2001). Netwerken als Zenuwstelsel van onze Maatschappij. Oratie 1-11-2001. Enschede: Universiteit Twente.
  • Dijk, J.A.G.M. van (2001). Netwerken als Zenuwstelsel van onze Maatschappij. Tijdschrift voor Communicatiewetenschap, 30), 37-54.
  • Dijk, J.A.G.M.. van (2003). Outline of a Multilevel Theory of the Network Society, In press.
  • Rogers, E.M. & Kincaid, D.L. (1981). Communication Networks: Toward a New Paradigm for Research. New York: Free Press.
  • Barnes, J. (1954). Class and Committees in a Norwegian Island Parish. Human Relations, 7, 39-58.
  • Rogers, E. M. (1986). Communication Technology: The New Media in Society. New York: Free Press.


Publicaciones clave en análisis de redes dentro de las organizaciones


  • Burt, R.S. (1992). Structural holes: the social structure of competition. Cambridge, MA: Harvard University Press.
  • Haythornthwaite, C. (1996). Social network analysis: An approach and technique for the study of information exchange. Library and Infor­mation Science Research, 18, 323-342.
  • Ibarra, H., & Andrews, S. B. (1993). Power, social influence, and sense making: Effects of network centrality and proximity on employee perceptions. Administrative Science Quarterly, 38, 277-303.
  • Burkhardt, M.E. (1994). Social interaction effects following a technological change: a longitudinal investigation. Academy of Management Journal, 37, 869-898.
  • Meyer, G.W. (1994). Social information processing and social networks: A test of social influence mechanisms. Human Relations, 47, 1013-1048.
  • Feeley, T.H., & Barnett, G.A. (1996). Predicting employee turnover from communication networks. Human Communication Research, 23, 370-387.
  • Pollock, T.G., Whitbred, R.C., & Contractor, N. (2000). Social information processing and job characteristics: A simultaneous test of two theories with implications for job satisfaction. Human Communication Research, 26, 292-330.
  • Monge, P.R., & Contractor, N.S. (2003). Theories of communication networks. New York: Oxford University Press.
  • Rice, R.E., & Richards, W.D. (1985). An overview of network analysis methods and programs. In: B. Dervin & M.J. Voight (Eds.), Progress in communication sciences (pp. 105-165). Norwood, NJ: Ablex Publishing Co.
  • Freeman, L.C., White, D.R., & Romney, A.K. (1992). Research methods in social network analysis. New Brunswick, NJ.: Transaction Publishers.
  • Wasserman, S., & Faust, K. (1994). Social network analysis. Cambridge: Cambridge University Press.
  • Scott, J. (2000). Social Network Analysis: A handbook. Second edition. London: Sage.

domingo, 24 de mayo de 2015

Las redes de hongos conectan a todas las plantas

Las plantas hablan entre sí a través de una Internet de hongos
Oculto bajo sus pies hay una autopista de información que permite a las plantas comunicarse y ayudarse unos a otros. Está hecha de hongos

Nic Fleming - BBC Earth



Es una autopista de la información que acelera las interacciones entre una población grande y diversa de individuos. Permite que las personas puedan estar ampliamente separadas para comunicarse y ayudarse unos a otros. Pero también les permite cometer nuevas formas de delincuencia.
No, no estamos hablando acerca de la Internet, estamos hablando de los hongos. Mientras que las setas pueden ser la parte más familiar de un hongo, la mayor parte de sus cuerpos se componen de una masa de hilos delgados, conocidos como micelio. Ahora sabemos que estos hilos actúan como una especie de internet subterráneo, que une las raíces de diferentes plantas. Ese árbol en su jardín está probablemente conectado a un arbusto de varios metros de distancia, gracias a micelios.
Cuanto más aprendemos acerca de estas redes subterráneas, más nuestras ideas acerca de las plantas tienen que cambiar. No sólo están allí sentados en silencio cada vez mayor. Al vincular a la red de hongos que pueden ayudar a sus vecinos mediante el intercambio de nutrientes y la información - o sabotear plantas no deseadas mediante la difusión de los productos químicos tóxicos a través de la red. Este "Wide Web de los bosques", resulta que, incluso tiene su propia versión de la ciberdelincuencia.


El micelio de un hongo difusión a través del suelo (Crédito: Nigel Cattlin / Alamy)

Alrededor del 90% de las plantas de la tierra están en relaciones mutuamente beneficiosas con los hongos. El biólogo alemán del siglo 19 Albert Bernard Frank acuñó la palabra "micorrizas" para describir estas asociaciones, en el que el hongo coloniza las raíces de la planta.
Los hongos se han llamado la "internet natural de la Tierra'
En las asociaciones de micorrizas, hongos con plantas proporcionan alimentos en forma de hidratos de carbono. A cambio, los hongos ayudan a las plantas absorben el agua y proporcionan nutrientes como el fósforo y el nitrógeno, a través de sus micelios. Desde la década de 1960, ha quedado claro que las plantas micorrizas ayuda individuales crezcan.
Redes hongos también impulsar el sistema inmunológico sus plantas hospederas. Eso es porque, cuando un hongo coloniza las raíces de una planta, se dispara la producción de productos químicos relacionados con la defensa. Esto hace que las respuestas del sistema inmune después más rápido y eficaz, un fenómeno llamado "cebado". Simplemente conectando a las redes de micelio hace que las plantas más resistentes a las enfermedades.
Pero eso no es todo. Ahora sabemos que las micorrizas también conectar las plantas que pueden estar muy separados. Experto Hongo Paul Stamets los llamó "internet natural de la Tierra" en una charla TED 2008. El primero tenía la idea en la década de 1970 cuando estaba estudiando hongos usando un microscopio electrónico. Stamets notó similitudes entre micelios y ARPANET, el Departamento de versión temprana de Defensa de internet de Estados Unidos.
Los aficionados al cine pueden ser recordados de 2009 taquillera Avatar de James Cameron. En la luna boscosa donde la película tiene lugar, todos los organismos están conectados. Se pueden comunicar y gestionar colectivamente los recursos, gracias a "algún tipo de comunicación electroquímica entre las raíces de los árboles". De vuelta en el mundo real, parece que hay algo de verdad en esto.


Avatar: sorprendentemente precisa cuando se trata de árboles (de crédito: Fotos 12 / Alamy)

Ha tomado décadas para reconstruir lo que Internet puede hacer por hongos. Ya en 1997, Suzanne Simard, de la Universidad de British Columbia en Vancouver encontró una de las primeras piezas de evidencia. Ella demostró que Douglas árboles de abeto y papel de abedul pueden transferir carbono entre ellos a través de los micelios. Otros han demostrado ya que las plantas pueden intercambiar nitrógeno y fósforo, así, por la misma ruta.
Estas plantas no son realmente personas
Simard ahora cree grandes árboles ayudan pequeños, más jóvenes el uso de Internet por hongos. Sin esta ayuda, ella piensa que muchas plántulas no sobrevivirían. En el estudio de 1997, las plantas de semillero a la sombra - que son propensos a ser corto de los alimentos - consiguieron más carbono de los árboles de los donantes.
"Estas plantas no son realmente las personas en el sentido de que Darwin pensaba que eran individuos que compiten por la supervivencia del más apto", dice Simard en el 2011 el documental se comunican los árboles? "De hecho están interactuando entre sí, tratando de ayudarse unos a otros a sobrevivir."
Sin embargo, es controvertida la utilidad de estas transferencias de nutrientes son en realidad. "Desde luego, sabemos que sucede, pero lo que está menos claro es el grado en que sucede", dice Lynne Boddy, de la Universidad de Cardiff en el Reino Unido.


Las plantas de tomate pueden recibir señales de sus vecinos (Crédito: Tracy Gunn / Alamy)

Mientras que el argumento continúa, otros investigadores han encontrado pruebas de que las plantas pueden dar un paso más, y comunicarse a través de los micelios. En 2010, Ren Sen Zeng, de la Universidad del Sur de China Agrícola en Guangzhou encontró que cuando las plantas están unidas por los hongos dañinos, liberan señales químicas en los micelios que advierten a sus vecinos.
Las plantas de tomate pueden 'espiar' en las respuestas de defensa
El equipo de Zeng creció pares de plantas de tomate en macetas. Algunas de las plantas se les permitió formar micorrizas.
Una vez que las redes hongos habían formado, las hojas de una planta de cada par fueron rociados con Alternaria solani, un hongo que causa la enfermedad del tizón temprano. Bolsas de plástico herméticas fueron utilizados para prevenir cualquier señalización química sobre el suelo entre las plantas.
Después de 65 horas, Zeng trató de infectar a la segunda planta en cada par. Él encontró que eran mucho menos propensos a tizón, y tenían niveles significativamente más bajos de daño cuando lo hicieron, si tenían micelios.
"Sugerimos que las plantas de tomate pueden 'espiar' en las respuestas de defensa y aumentar su resistencia a las enfermedades contra potencial patógeno", Zeng y sus colegas escribieron. Así que no sólo haga lo micorrizas permiten plantas para compartir alimentos, ayudan a defenderse.


Pulgones se alimentan de plantas de guisante haba (crédito: Bildagentur-línea / McPhoto-Weber / Alamy)

No se trata sólo de tomates que hacen esto. En 2013, David Johnson, de la Universidad de Aberdeen y sus colegas demostraron que las habas también utilizan redes para recoger hongos en las amenazas inminentes - en este caso, pulgones hambrientos.
Johnson encontró que grandes plantas de frijol que no eran ellos mismos bajo el ataque de pulgones, pero estaban conectados a los que fueron a través de micelios de hongos, activaron sus defensas químicas contra el pulgón. Los que no tienen micelios no.
"Algún tipo de señalización que estaba pasando entre estas plantas sobre la herbivoría por áfidos, y esas señales estaban siendo transportados a través de las redes de micelio micorrizas", dice Johnson.


El Internet es también un paraíso para los criminales y piratas (Crédito: shotstock / Alamy)

Pero al igual que el humano internet, internet hongos tiene un lado oscuro. Nuestro Internet socava la privacidad y facilita delito grave - y con frecuencia, permite virus informáticos para difundir. De la misma manera, las conexiones por hongos plantas 'quiere decir que nunca son verdaderamente solo, y que los vecinos malévolos pueden hacerles daño.
Por un lado, algunas plantas se roban entre sí el uso de Internet. Hay plantas que no tienen clorofila, por lo que a diferencia de la mayoría de las plantas no pueden producir su propia energía a través de la fotosíntesis. Algunas de estas plantas, como la orquídea fantasma, obtener el carbono que necesitan de los árboles cercanos, a través de los micelios de hongos que ambos están conectados a.
Otros orquídeas solamente roban cuando les conviene. Estos "mixotrophs" pueden llevar a cabo la fotosíntesis, pero también "robar" de carbono de otras plantas que utilizan la red de hongos que los une.
Eso puede no sonar tan mal. Sin embargo, el delito cibernético planta puede ser mucho más siniestro que un poco de pequeños robos.


Una orquídea fantasma (Cephalanthera austiniae) (Crédito: Tom Hilton, CC por 2,0)

Las plantas tienen que competir con sus vecinos por recursos como el agua y la luz. Como parte de esa batalla, algunos productos químicos de liberación que dañar a sus rivales.
Este "alelopatía" es bastante común en los árboles, entre ellos acacias, sugarberries, sicomoros estadounidenses y varias especies de Eucalyptus. Ellos liberan sustancias que, o bien reducir las posibilidades de otras plantas están estableciendo, o reducir la propagación de microbios alrededor de sus raíces.
Científicos escépticos dudan de que la alelopatía ayuda a estas plantas hostiles tanto. Seguramente, dicen, los productos químicos nocivos serían absorbidos por el suelo, o descompuestos por microbios, antes de que pudieran viajar lejos.
Pero tal vez las plantas pueden solucionar este problema, mediante el aprovechamiento de las redes de hongos subterráneos que cubren grandes distancias. En 2011, el ecologista química Kathryn Morris y sus colegas se propusieron probar esta teoría.


Las caléndulas oro son claramente hostiles a sus vecinos (Crédito: Blickwinkel / Alamy)

Morris, ex Barto, creció caléndulas oro en recipientes con hongos micorrícicos. Las macetas contenían cilindros rodeados por una malla, con agujeros lo suficientemente pequeñas como para mantener las raíces fuera, pero lo suficientemente grandes como para dejar en micelios. La mitad de estos cilindros se volvió con regularidad para dejar de redes de hongos que crecen en ellos.
El equipo probó el suelo en los cilindros de dos compuestos hechos por las caléndulas, que pueden retardar el crecimiento de otras plantas y matar a los gusanos nematodos. En los cilindros donde se permitió a los hongos a crecer, los niveles de los dos compuestos fueron 179% y 278% más alto que en los cilindros sin hongos. Eso sugiere que los micelios realmente hicieron transportar las toxinas.
Posteriormente, el equipo creció plántulas de lechuga en el suelo de ambos conjuntos de contenedores. Después de 25 días, los que crecen en el suelo toxina más rica pesaron 40% menos que aquellos en el suelo aislado a partir de los micelios. "Estos experimentos muestran las redes fúngicas pueden transportar estos productos químicos en concentraciones suficientemente altas como para afectar el crecimiento de la planta", dice Morris, que se basa ahora en la Universidad de Xavier en Cincinnati, Ohio.
En respuesta, algunos han argumentado que los productos químicos pueden no funcionar tan bien fuera del laboratorio. Así Michaela Achatz de la Universidad Libre de Berlín en Alemania y sus colegas buscó un efecto similar en la naturaleza.


Un árbol de nogal negro (Juglans nigra) (Crédito: foto-zona / Alamy)

Uno de los ejemplos mejor estudiados de la alelopatía es el árbol de nogal negro americano. Inhibe el crecimiento de muchas plantas, incluyendo alimentos básicos como las papas y pepinos, por la liberación de una sustancia química llamada jugalone de sus hojas y raíces.
Achatz y su equipo colocaron macetas alrededor de los árboles de nogal, algunas de las cuales las redes hongos podían penetrar. Esas vasijas contenían casi cuatro veces más que las ollas jugalone que fueron rotados para mantener fuera a las conexiones por hongos. Las raíces de las plántulas de tomate plantadas en el suelo jugalone ricos pesaron en promedio 36% menos.
Algunas plantas especialmente astutos incluso podrían alterar la composición de las comunidades fúngicas cercanas. Los estudios han demostrado que knapweed manchado, avena loca esbelta y soft brome se pueden todos cambiar el fúngica maquillaje de los suelos. Según Morris, esto podría permitirles orientar mejor las especies rivales con productos químicos tóxicos, favoreciendo el crecimiento de los hongos a los que se pueden conectar tanto.
Los animales también pueden aprovechar la internet por hongos. Algunas plantas producen compuestos de atraer bacterias y hongos a sus raíces, pero estas señales pueden ser recogidos por los insectos y gusanos en busca de raíces sabrosas para comer. En 2012, Morris sugirió que el movimiento de estos productos químicos de señalización a través de micelios de hongos puede anunciar de forma inadvertida la presencia plantas para estos animales. Sin embargo, ella dice que esto no se ha demostrado en un experimento.


Los árboles y otras plantas están vinculados subterráneo (de crédito: Todas las fotos / Alamy)

Como resultado de este creciente cuerpo de evidencia, muchos biólogos han comenzado a usar el término "Wide Web de los bosques" para describir los servicios de comunicaciones que los hongos proporcionan a las plantas y otros organismos.
"Estas redes hongos hacen que la comunicación entre las plantas, incluidas las de las diferentes especies, más rápido y más eficaz", dice Morris. "Nosotros no pensamos en ello porque por lo general sólo podemos ver lo que está por encima del suelo. Pero la mayoría de las plantas se pueden ver están conectados bajo tierra, no directamente a través de sus raíces, sino a través de sus conexiones de micelio."
El Internet hongos ejemplifica una de las grandes lecciones de ecología: aparentemente organismos independientes a menudo se conectan, y puede depender el uno del otro. "Los ecologistas han sabido desde hace tiempo que los organismos son más interconectado e interdependiente", dice Boddy. El wide web de los bosques parece ser una parte crucial de cómo se forman estas conexiones.

domingo, 17 de mayo de 2015

Añadiendo la estructura de red a la difusión de información

Presentación de Pound: Proceso para Optimización y Comprensión de Difusión de Red
Viendo el bosque desde los árboles.

Dao Nguyen y Andrew & Adam Kelleher

Los análisis web tradicionales proporcionan una visión limitada sobre la web social. Pueden "empaquetar" a los espectadores de una historia de acuerdo a desde donde se hace clic, y nos dicen cuántos hay en cada paquete. Esa información es valiosa y está especialmente adaptada a un mundo de "pre-compartir". Pero los análisis web tradicionales son fundamentalmente incapaces de captar lo que realmente sucede en la red social en la actualidad; borran su estructura de árbol inherente.



Como una de las principales organizaciones de noticias sociales y de entretenimiento, BuzzFeed tiene su contenido compartido por decenas de millones de personas cada mes. Más del 75% de nuestros 200M de usuarios mensuales provienen de fuentes sociales sociales u oscuros. Esta escala proporciona una oportunidad única para aprender acerca de la estructura de árbol de la difusión de la red de contenido social. ¿Qué sucede cuando usted pia algo y un seguidor lo recoge y lo comparte en Facebook, y luego uno de sus amigos lo publica en un blog, y luego un lector de correos electrónicos de TI a sus amigos? ¿Qué podemos aprender de cómo el contenido realmente mueve a través de la web social?

¿Qué es Pound?

Pound es una nueva tecnología, patentada que capta cómo las historias BuzzFeed propagan en la web social. De ello se desprende propagaciones de un partícipe a otro, a través de todas las visitas posteriores, incluso a través de redes sociales y plataformas de uno-a-uno de intercambio como Gchat y correo electrónico.
Pound es el Process for Optimizing and Understanding Network Diffusion [Proceso de Optimización y Comprensión de la Red de Difusión].
Pound  no almacena los nombres de usuario o cualquier información de identificación personal (PII) con los acontecimientos de las acciones. Cada nodo en el gráfico compartir es anónimo. No somos capaces de averiguar que un usuario está mirando a los datos del gráfico. Los datos de Pound se recogen sobre la base de un hash oscilante, anónimo en la URL del partícipe como un código UTM.
La recopilación y almacenamiento de este tipo de datos de difusión de la red era un desafío de ingeniería fuerte. Pound, bajo una carga típica, es capaz de manejar más de 10.000 peticiones web por segundo antes de escalar. Como resultado, ahora almacenar más datos en Pound en un solo mes que todos los otros datos que hemos recopilado previamente para la optimización del contenido desde el inicio de BuzzFeed.
El conocimiento que tuvo lugar en este conjunto de datos sin precedentes podría ayudarnos a entender nuestro contenido mejor, comprender mejor a nuestros lectores, y entender la web social mejor. Armado con esa comprensión, podemos tener mayor alcance y mayor impacto para nuestros lectores y en el mundo.

Tres cosas que hemos aprendido a partir de datos de Pound hasta ahora


1. Se trata de los bosques, no los árboles.

Al principio pensamos que los datos podrían ser representados en un solo diagrama de "árbol" como la de arriba. Pero rápidamente nos dimos cuenta de que todos los envíos que tiene cientos o miles de partícipes iniciales, cada uno la raíz de su propio árbol. El gráfico de Pound para cada historia por lo tanto se parece más a un bosque de un árbol. Y en este bosque, los árboles pueden parecer radicalmente diferente. Algunos son de grasa (un montón de nodos intermedios), algunos son finas; algunos son profundos (un montón de intercambio de cascadas), algunas de ellas poco profunda; algunos tienen propagaciones entre redes, otros no. La estructura del bosque y sus árboles nos dice con gran detalle sobre cómo se propaga cada puesto.

2. Las redes sociales y las promociones deben ser valorados por el conjunto de su cascada de aguas abajo.


En febrero de este año, BuzzFeed publicó un post sobre un vestido. Ha sido visto más de 38 millones de veces.
Los datos mostraron Pound, posiblemente por primera vez en la historia, cómo un post viral se extendió a través de millones de partícipes a través de redes sociales, sistemas de mensajería, sitios de noticias y blogs.


Análisis y visualización de Adam Kelleher

La imagen de arriba es el gráfico de difusión de la red que tiene sus raíces en la página principal de Facebook BuzzFeed. Eso significa que muestra todos los espectadores aguas abajo de las promociones del puesto "vestido" en esa página. La mayoría de los nodos son de color azul oscuro, lo que significa que hace clic de Facebook. Los nodos blancos son los espectadores hacen clic de una fuente no social, como un blog o un sitio de noticias. También hay algunos pequeños nodos de luz azul en la esquina inferior izquierda que representan los espectadores de Twitter. Este grupo es principalmente Facebook (azul oscuro), lo cual tiene sentido porque el "partícipe inicial" era un mensaje de Facebook.


Análisis y visualización de Adam Kelleher

La visualización de arriba es el gráfico de difusión de la red con raíz en la cuenta de Twitter principal BuzzFeed, lo que significa que muestra todo el tráfico de aguas abajo de los seis tweets publicados por la cuenta de la vinculación a la historia "vestido". Hay unos cuantos racimos de luz azules dominadas por Twitter, pero muchos más azul oscuro Facebook dominadas queridos. También hay grupos blancos de tamaño considerable que representan las personas que recogen la historia y que enlazan con él desde un sitio web como un blog o publicación. De hecho, los clics de Twitter representan sólo una cuarta parte del total de las visitas posteriores arraigadas en la cuenta BuzzFeed Twitter!
Presentación de Pound: Proceso para Optimización y Comprensión de Difusión Red



Análisis y visualización de Adam Kelleher

El GIF anterior zoom para ver grupos sucesivos de redes de intercambio dentro de ese grupo principal de Twitter. Compartiendo saltos de Twitter a una publicación, de vuelta a Twitter, en una publicación diferente, y así sucesivamente.

3. Contenido patrocinado se comparte y se re-compartida al igual que el contenido editorial.

Hemos sabido durante mucho tiempo, pero los datos de Pound lo demuestra. He aquí un ejemplo. Equipo de Servicios Creativos de BuzzFeed asoció con Target para escribir “I Tried The Fanny Basket And It Saved My Life” justo antes del Día de los Inocentes. La entrada se ha publicado bastante éxito con más de 400.000 visitas. Echemos un vistazo a algunos de sus visualizaciones Pound.



La visualización de arriba muestra una profundidad impresionante de intercambio social: la cuota inicial llevado a siete niveles adicionales de propagación, para una profundidad máxima de ocho. (En comparación, que Twitter clúster del puesto "vestido" tuvo una profundidad máxima de 11.) Cada círculo de nodos representa una red de intercambio orgánico, o un grupo de personas que vieron el cargo como resultado de una participación orgánica. Al igual que con el post "Dress", un grupo blanco en el centro representa una publicación descubrir la historia y la vinculación a ella en su sitio.


Visualización por Adam Kelleher

Uso del zoom en este grupo capta capas y capas de grupos en red compartiendo orgánicamente este post patrocinado. Es el equivalente social del marketing boca-a-boca. Pound hace medible boca-a-boca. (Y una vez que es medible, podría ser optimizable!)

¿Qué sigue para la Pound?

Estamos muy entusiasmados con las posibilidades de utilización de Pound! Éstas son sólo algunas ideas que hemos discutido.

  • ¿Podemos proponer historias que no apelar sólo a usted, sino también a sus amigos y seguidores?
  • ¿Podemos utilizar los datos de Pound a las fuentes de pruebas A / B? ¿Podemos hacer que el sitio y las aplicaciones mejor no sólo para los lectores, sino también para sus amigos - y por lo tanto aumentar el impacto de nuestro sitio?
  • ¿Qué tan efectivas son las promociones específicas, no sólo en función del tráfico de primer orden, pero sobre todo el intercambio de aguas abajo y el tráfico que resulta?
  • ¿Podemos predecir el alcance potencial de una historia basada en su contenido u otras características al respecto?
  • ¿Podemos filtrar el efecto de grandes sitios o celebridades promover nuestro contenido, aprenden lo que la gente común como realidad, y producen más del contenido adecuado para todos?

Por último, vamos a hacer todo lo anterior para contenido patrocinado? De hecho, actualmente estamos buscando socios beta que nos ayuden a pensar sobre cómo los datos de Pound se pueden beneficiar los anunciantes y sus audiencias. ACTUALIZACIÓN 28/04: Estamos buscando específicamente para socios beta entre nuestros anunciantes que trabajan con nosotros en una alianza iterativo para crear continuamente contenido y aprender de los resultados de datos.
Estaremos compartiendo más durante 2015 en todo, desde los desafíos de ingeniería y arquitectura de datos de cómo vamos a utilizar para hacer Pound BuzzFeed mejor para nuestros lectores. No tenemos todas las respuestas a estas fascinantes preguntas todavía, pero estamos trabajando duro en ellos!

sábado, 16 de mayo de 2015

Relaciones entre los miembros del G-20

El descubrimiento de la relación de los miembros del G-20 el uso de minería de datos
Publicado por Leandro Guerra - Data Science Central


Se necesita sólo una pequeña charla conmigo para saber que soy un fan de los mercados financieros y muchos temas relacionados con la economía. Hoy quiero mostrar una aplicación que implica noticias en la web, Python, MongoDB y el Gephi, un software para la visualización y manipulación de las redes sociales.
Nuestro objetivo es verificar que la cantidad de apariciones conjuntas de los países del G-20 (en concreto Brasil) publicados en las noticias relacionadas con el mercado financiero puede reflejar los datos del Ministerio de Fomento, Industria y Comercio Exterior de Brasil. Para aquellos que no están familiarizados con el término, el G-20 (20 principales economías) es un grupo formado por los ministros de economía y presidentes de bancos centrales de 19 economías principales, además de la Unión Europea. El grupo fue establecido en 1999 como consecuencia de distintas crisis económicas de la década de 1990, y es una especie de foro de cooperación y consultas sobre cuestiones financieras internacionales. Los países miembros son (en orden alfabético):
Argentina, Australia, Brasil, Canadá, China, Francia, Alemania, India, Indonesia, Italia, Japón, República de Corea, México, Rusia, Arabia Saudita, Sudáfrica, Turquía, el Reino Unido, los Estados Unidos y la Unión Europea.
En la tabla de abajo tenemos los 30 principales destinos de las exportaciones brasileñas en base a datos del Ministerio de Fomento, Industria y Comercio Exterior de Brasil, refiriéndose a febrero de 2014.



Vamos a ir a los datos. Con un lector RSS desarrollado en Python y MongoDB, analicé el contenido de 1.000 noticias (número arbitrario) para encontrar si alguno de los países del G-20 tenían sus nombres mencionados juntos en la misma noticia. Hay un excelente vídeo publicado en TED - "¿Quién controla el mundo" - Que muestra en un buen nivel de detalle la definición de lo que es una red compleja. Por lo tanto, insertamos los datos recogidos en Gephi para crear nuestra red de relaciones entre los países. Como resultado, tuvimos la siguiente red asignada que muestra la relación (y su intensidad, según el grosor de los bordes) de los países del G-20 en nuestro contexto.



Los nombres de los países están en portugués porque la noticia era demasiado. Como nuestro objetivo era tener a Brasil en el centro de atención y las fuentes de noticias estaban todos brasileña, tenemos el país como el nodo principal de nuestra red. Podemos comprobar, por el grosor de los bordes, que Brasil está fuertemente relacionado con China, EE.UU., Japón y Alemania. Si nos fijamos en la tabla de destino de exportación más, vemos que estos países son, respectivamente, el primero, segundo, quinto y sexto destinos de nuestras exportaciones.
Un análisis más cuidadoso muestra que Brasil, en las noticias de nuestra base de datos, se relaciona con casi todos los países, a excepción de Arabia Saudita e Inglaterra (pero que de alguna manera tiene una relación representada por el Reino Unido). Es decir, de los 30 mejores destinos de nuestras exportaciones, solamente Arabia Saudita no estaba relacionado. Se demuestra que la conclusión en la siguiente gráfica, destacando las relaciones de Brasil (Inglaterra y Arabia Saudita están más distantes y con un color suavizado).



A pesar de tener las noticias nacionales como fuente primaria de datos, podemos ver la influencia de los Estados Unidos, la economía más grande del mundo, en su relación con los demás países (excepto Arabia Saudita, pero tal vez por la cantidad de nuestros datos).
Teniendo en cuenta todos estos datos, llegamos a la conclusión de que las actuales relaciones en noticias económicas en realidad reflejan los datos de nuestras relaciones comerciales. Tal vez no fue diferente, pero es una manera de mostrar cómo todo está conectado y, de hecho, dado que los mercados son eficientes (hay mucha discusión aquí y tiendo a estar en desacuerdo con la teoría), tenemos que las relaciones comerciales se reflejarán de alguna manera en el comportamiento de los agentes del mercado y, en consecuencia, se verá reflejado en los precios de los activos financieros.

jueves, 14 de mayo de 2015

Estructura de difusión de información ideológica por Facebook

La exposición a diversa información en Facebook
por Eytan Bakshy, Solomon Messing, Lada Adamic
Research Facebook




Como la gente cada vez más a las redes sociales para las noticias y la información ciudadana, se han planteado interrogantes acerca de si esta práctica lleva a la creación de las "cámaras de eco", en el que las personas están expuestas únicamente a la información de personas con ideas afines [2]. Otra especulación se ha centrado en si los algoritmos utilizados para clasificar los resultados de búsqueda y mensajes de redes sociales podrían crear "burbujas de filtro", en el que se salió a la superficie sólo el contenido ideológicamente atractivo [3].

La investigación que hemos llevado a cabo hasta la fecha, sin embargo, va en contra de esta imagen. Un trabajo de investigación anterior 2012 llegó a la conclusión de que mucha de la información que estamos expuestos y compartir proviene de lazos débiles: a los amigos con los que interactuamos con menos frecuencia y tienen más probabilidades de ser diferente para nosotros que nuestros amigos cercanos [4]. Otra investigación sugiere que los individuos son más propensos a involucrarse con contenido contrario a sus propios puntos de vista cuando se presenta junto con la información social [5].

Nuestra última investigación, publicada hoy en la revista Science, cuantifica, por primera vez, exactamente la cantidad de personas podrían ser y son expuestos a noticias e información ideológicamente diversa en los medios sociales [1].

Hemos encontrado que las personas tienen amigos que reclaman una ideología política contraria, y que el contenido del News Feed de la gente reflejan puntos de vista diversos. Mientras que las News Feed [Noticias RSS] emerge contenido que está un poco más en consonancia con la ideología propia de una persona (en base a las acciones de esa persona en Facebook), de quiénes es amigo y qué contenido que hagan clic en son más consecuencias que la clasificación de las noticias RSS en términos de la cantidad de contenido diverso que encuentro.

Específicamente, encontramos que entre los que sí informan una afiliación liberal o conservador,
  • En promedio, 23 por ciento de los amigos de las personas reclamar una ideología política contraria.
  • Por el contenido de las noticias duras que los amigos de las personas comparten, el 29,5 por ciento de los que corta a través de líneas ideológicas.
  • Cuando se trata de lo que la gente ve en el News Feed, el 28,5 por ciento de las noticias dura encontró cortes a través de líneas ideológicas, en promedio.
  • 24,9 por ciento del contenido de las noticias duras que la gente realmente hace clic en fue transversal.

Compartiendo noticias en Facebook

Durante los seis meses entre julio de 2014 y enero de 2015, más de 7 millones de enlaces web distintos (URL) eran compartidos por la gente en Facebook en Estados Unidos. Estábamos interesados ​​en aprender cómo mucha gente se expusieron a "noticias duras" - historias sobre la política, los asuntos mundiales y la economía, en lugar de "noticias blandas" - historias de entretenimiento, celebridades, y el deporte - y si esta información se alineó principalmente con audiencias liberales o conservadores. Para ello, hemos entrenado una máquina clasificadora de vectores soporte que utiliza las primeras palabras de artículos vinculados para cada URL compartida en Facebook. Esto nos permitió identificar más de 226.000 artículos de noticias duras únicas que habían sido compartidos por lo menos 100 veces.

A continuación, hemos caracterizado el contenido, ya sea conservador o liberal. Nueve por ciento de los usuarios de Facebook en el auto-reporte de su afiliación política de Estados Unidos en sus perfiles. Hemos trazado las afiliaciones más comunes a una escala de cinco puntos que van desde -2 (muy liberal) a 2 (muy conservador). Al promediar las afiliaciones de los que compartieron cada artículo, podríamos medir la "alineación" ideológica de cada historia. Para que quede claro, esta partitura es una medida de la * alineamiento ideológico de la audiencia * * que comparte un artículo *, y no es una medida de sesgo político o inclinación del artículo. Este cálculo se describe en la siguiente ilustración.


Ilustración de la alineación de la forma ideológica de contenido se mide. Para cada elemento compartido, promediamos la afiliación política de los individuos que comparten. Por ejemplo, en el ejemplo más arriba a la izquierda, el artículo fue compartida por cinco personas, tres quienes se identificaron como liberales, uno como un moderado, y uno como conservador, produciendo un promedio de -2/5.
Cuando promediamos esta medida para cada historia de un dominio determinado sitio web, podemos ver diferencias clave en fuentes de medios ideológicamente alineados conocidos: FoxNews.com está alineado con los conservadores (As = +.80), mientras HuffingtonPost.com está alineado con los liberales (As = -.65). Hubo polarización sustancial entre las noticias duras compartido en Facebook, con la relación más frecuentemente compartida claramente alineados con poblaciones mayormente liberales o conservadores, como se muestra a continuación.

Esta figura muestra que la mayoría de los enlaces a determinados artículos "noticias duras" son compartidos ya sea principalmente por los liberales (puntuación de alineamiento cercano a -1) o por los conservadores (alineación de puntuación cerca de 1), pero rara vez por ambos por igual.
El uso de los métodos descritos anteriormente, nos volvimos a medir el grado en que las personas podían ser, y estamos expuestos a la información ideológicamente diversa en Facebook.

Estructura de red e ideología

Homofilia, la tendencia de los individuos similares a que se asocien entre sí ("pájaros del mismo plumaje vuelan juntos") es un fenómeno social robusto. Los amigos son más propensos a ser similares en edad, nivel educativo, ocupación y geografía. No es sorprendente encontrar que el mismo es válido para la afiliación política en Facebook. Podemos ver cómo los liberales y los conservadores tienden a conectar a las personas con afiliaciones políticas similares basadas en la muestra del ego-redes representadas en las visualizaciones de abajo.

Ejemplo de Redes sociales para un liberal, un moderado, y un conservador. Los puntos son amigos de los individuos, y las líneas designan amistades entre ellos.
Sin embargo, entre los que informan su ideología, en promedio, alrededor del 23 por ciento de sus amigos reportan una afiliación en el lado opuesto del espectro ideológico. A partir de la figura de abajo, podemos ver que hay una amplia gama de diversidad de red. La mitad de los usuarios tienen entre entre 9 y 33 por ciento de los amigos de las ideologías opuestas, mientras que el 25 por ciento tiene menos de 9 por ciento y el 25 por ciento restante tienen más de 33 por ciento.

Porcentaje de los amigos de las ideologías entre liberales y conservadores opuestos.


El flujo de información en Facebook

La diversidad de la gente encontrar contenido no sólo depende de quiénes son sus amigos, sino también qué información los amigos compartir y la interacción entre las personas y de noticias de Facebook. Noticias RSS que muestra todo el contenido compartido por sus amigos, pero el contenido más relevante se muestra primero. Exactamente lo historias gente haga clic en depende de la frecuencia con que utilizan Facebook, qué tan bajo que se desplazan en el News Feed, y las decisiones que toman sobre qué leer.


Ilustración de cómo el proceso de exposición consta de tres fases: (1) la noticia de que su cuota de amigos (Potencial de red), (2) Puntuación y el tiempo que las personas toman para desplazarse gobierna lo que ven en sus Noticias Externas (Expuestas), ( 3) accediendo al artículo real (seleccionada).

Cómo la gente mucho contenido transversales encuentran depende de quiénes son sus amigos y qué información comparten esos amigos. Si la gente fuera de adquirir información de otras personas al azar, aproximadamente el 45 por ciento de los liberales contenido estaría expuesto a que sería de corte transversal, en comparación con el 40 por ciento para los conservadores. Por supuesto, las personas no encuentran información al azar en entornos fuera de línea ni en Internet.

¿Qué parte del contenido transversal que comparten tus amigos aparece en el News Feed? Las personas son elegibles para ver todo el contenido compartido por sus amigos en News Feed, pero como la gente no tiene suficiente tiempo en el día para ver todo, que ordenar el contenido a mostrar a la gente lo que es más relevante para ellos. Se encontró que el 23 por ciento de las noticias compartida por amigos liberales es transversal, mientras que lo que se ve en el News Feed es un 22 por ciento. Esto corresponde a una razón de riesgo de un 8 por ciento, lo que significa que la gente era un 8 por ciento menos propensos a ver los artículos compensatorios que han sido compartidos por los amigos, en comparación con la probabilidad de ver artículos ideológicamente consistentes que han sido compartidos por los amigos. Por otra parte, 34 por ciento del contenido compartido por los conservadores es ideológicamente transversal, frente a 33 por ciento en realidad se ve en el News Feed, correspondiente a una relación riesgo de 5 por ciento.

¿Cuánto transversal contenido que aparece en Noticias RSS qué la gente realmente haga clic en? Mientras que el 22 por ciento del contenido visto por los liberales fue transversal, se encontró que 20 por ciento del contenido que realmente hace clic en era transversal (intencionadas son un 6 por ciento menos propensos a hacer clic en los artículos que aparecieron en su News Feed compensatorios, en comparación con la probabilidad de que al hacer clic en los artículos ideológicamente coherentes que aparecieron en su News Feed). Los conservadores vieron 33 por ciento de contenido transversal en News Feed, pero en realidad han hecho clic en un 29 por ciento (correspondiente a una razón de riesgo de 17 por ciento).

La diversidad de contenidos (1) compartida por otros aleatorios (al azar), (2) compartido por amigos (potenciales de la red), (3) en realidad aparece en Noticias Externas de la gente (expuestos), (4) hace clic en (seleccionado).
Cuando miramos a la gente "en el margen" de encontrarse con noticias duras en Facebook, vemos más evidencia del importante papel juega la elección individual. Tome las personas cuyos amigos comparten al menos una constante y una historia transversal --- 99 por ciento de ellos fueron expuestos a por lo menos un artículo ideológicamente alineados, y el 96 por ciento encontrado al menos un elemento ideológicamente transversal en News Feed. Cuando nos fijamos en que se hace clic a través de contenido de noticias duras, se encontró que el 54 por ciento más de la mitad --- --- clic sobre contenido ideológicamente transversal, aunque menos que el 87 por ciento que hace clic en el contenido ideológicamente alineados.

Proporción de personas con al menos una transversal y la historia alineados (1) compartido por amigos (potenciales), (2) en realidad aparece en Noticias Externas de la gente (expuestos) (3) hace clic en (seleccionado). *

Discusión

Al mostrar que las personas están expuestas a una cantidad sustancial de los contenidos de los amigos con los puntos de vista opuestos, nuestros hallazgos contrastan las preocupaciones de que la gente pueda "lista y hablan sólo a la de ideas afines" mientras está en línea [2]. La composición de nuestras redes sociales es el factor más importante que afecta a la mezcla de contenido encontrado en las redes sociales con la elección individual también juega un papel importante. Clasificación News Feed tiene un menor impacto en la diversidad de la información que vemos desde el otro lado.

Creemos que este trabajo es sólo el comienzo de una larga línea de investigación sobre cómo las personas están expuestas a y consumen medios en línea. Para obtener más información, consulte nuestro documento, que está disponible en acceso abierto en ScienceExpress:

Exposure to Ideologically Diverse News and Opinion. E. Bakshy, S. Messing, L. Adamic. Science.

Referencias


[1] Exposure to Ideologically Diverse News and Opinion. E. Bakshy, S. Messing, L. Adamic. Science, 2015.
[2] C. R. Sunstein, Republic.com 2.0 (Princeton University Press, 2007).
[3] E. Pariser, The Filter Bubble: What the Internet Is Hiding from You (Penguin Press, London, 2011).
[4] E. Bakshy, I. Rosenn, C. Marlow, L. Adamic, The Role of Social Networks in Information Diffusion, Proceedings of the 21st international conference on World Wide Web Pages. (2012).
[5] S. Messing, S. J. Westwood, Selective Exposure in the Age of Social Media: Endorsements Trump Partisan Source Affiliation when Selecting News Online, Communication Research (2012).

domingo, 10 de mayo de 2015

Un simulación para encontrar una pareja sin ninguna capacidad de sociabilidad

Un simulador de evolución revela el secreto de apareamiento sin habilidades sociales
Sin las habilidades sociales, la única manera de conocer a un compañero es por casualidad completa. ¿Verdad? No, de acuerdo a un nuevo modelo que simula la forma en genes de un individuo pueden interactuar con el medio ambiente.




Encontrar una pareja sexual es un asunto complejo para los seres humanos. En su forma más simple, requiere dos participantes dispuestos a estar presentes en el mismo lugar al mismo tiempo. Y como era de esperar, los humanos han desarrollado sofisticadas habilidades sociales para coordinar sus movimientos para este propósito (como lo han hecho muchos organismos).

Pero ¿y si los participantes no tienen las habilidades sociales y por lo tanto son incapaces de coordinar de esta manera? ¿Cómo participantes que carecen de habilidades sociales se aparean alguna vez? Esa es una pregunta importante, y no sólo para los seres humanos con habilidades sociales pobres. De hecho, muchos organismos simples se reproducen sexualmente, pero no parecen tener las habilidades sociales para coordinar sus movimientos.

Este enigma se llama el problema de la coordinación social y sociólogos han desconcertado de largo sobre cómo las especies socialmente cuestionadas de sobrevivir.

Hoy tenemos una respuesta gracias a la obra de Chris Marriott de la Universidad de Washington en Seattle y Jobran Chebib en la Universidad de Zúrich, en Suiza. Estos chicos han creado un modelo informático que simula la interacción entre los organismos, sus genes y el medio ambiente en el que existen.

Este modelo muestra cómo las personas sin habilidades sociales todavía pueden aparearse con éxito y ofrece una visión única de la forma en habilidades sociales con el tiempo pueden evolucionar en este tipo de poblaciones.

Una parte clave del nuevo modelo es su capacidad para simular la interacción entre la composición genética de una población de individuos y su entorno. Y lo hace de una manera inteligente.

En el nuevo modelo, el "medio ambiente" consiste en una red de nodos conectados al azar. Un individuo puede explorar este mundo al saltar de un nodo a otro utilizando los enlaces entre ellos.

Las personas que aumentan la energía en cada nodo, pero lo utilizan a medida que se mueven. La ganancia o pérdida de energía neta cada día determina si la criatura vive o muere.

Al mismo tiempo, una persona con suficiente energía puede disfrutar de relaciones sexuales con otra criatura que pasa a estar en el mismo lugar, siempre que éste también tenga la energía suficiente. Esto da como resultado el nacimiento de una nueva criatura con características de ambos padres. Las personas que no tienen relaciones sexuales también pueden reproducirse asexualmente.

La forma en que más individuos eligen sus rutas es importante. Cada criatura hace esto usando la información codificada en su "genoma": una larga secuencia de rutas posibles a través del entorno de un lugar a otro.

En una ubicación específica, el individuo busca en su genoma para las rutas asociadas con esa posición. A continuación, elige la ruta que maximice sus futuros recursos, y esto determina dónde se mueve al lado.

Esto tiene consecuencias importantes para una población emergente. Marriott y Chebib empiezan por la liberación de un solo individuo en este entorno. Es obvio que no puede tener relaciones sexuales y así se reproduce asexualmente, produciendo otra persona con el mismo genoma.

Dado que ambos individuos tienen el mismo genoma, se mueven a través del entorno de la misma manera, la producción de otros individuos con el mismo genoma o tener relaciones sexuales para producir individuos con genomas similares.

Después de muchas generaciones, el resultado es un grupo de individuos con genomas similares que se mueven a través del entorno de la misma manera. En otras palabras, una manada.

Esto lleva a un patrón de cría llamado cruzamiento, donde los individuos se aparean con otros similares en lugar de socios aleatorios. Eso es una simple consecuencia de ser parte de una manada con patrones de comportamiento similares.

Las personas también tienden a regresar a sus lugares de nacimiento, ya que esta información se codifica automáticamente en sus genomas. Así es como surge filopatría natal.

Todo esto está en marcado contraste con las poblaciones de individuos con diferentes genomas que se dejan caer en el medio ambiente de forma aleatoria. Estos individuos tienden a morir, ya que sólo se reúnen otros individuos por completo oportunidad. Así que la reproducción sexual es rara.

Y cuando ocurre, tiende a crear individuos con genomas similares que terminan produciendo rebaños y disfrutando de apareamiento selectivo y filopatría natal exactamente de la misma manera que las menos diversas poblaciones.

Lo extraordinario es que todos estos comportamientos emergen de la interacción entre la genética de los individuos y su entorno. No hay habilidades sociales involucrados en absoluto.

"Encontramos tres tipos de organización social que ayuda a resolver este problema social de coordinación (pastoreo, apareamiento selectivo y filopatría natal) emergen en poblaciones de agentes simulados sin mecanismos sociales disponibles para apoyar a estas organizaciones", dicen Marriott y Chebib.

Eso es fascinante trabajo y no sólo porque muestra cómo se puede producir el apareamiento entre individuos sin habilidades sociales. Marriott y Chebib especulan que la aparición de estas conductas de apareamiento proporciona un entorno en el que las habilidades de coordinación social, con el tiempo pueden evolucionar. "Llegamos a la conclusión de que los orígenes no sociales de estas organizaciones sociales en torno a la reproducción sexual pueden proporcionar el medio ambiente para el desarrollo de soluciones sociales a los mismos y diferentes problemas", dicen.

Muchas criaturas aprenden habilidades sociales de otros individuos o están bajo la presión social de un tipo u otro a comportarse de una manera específica. Pero nadie ha sido nunca seguro de cómo han surgido debido a la naturaleza de pollo y el huevo del problema de estas habilidades: no se puede aprender las habilidades sociales a menos que seas parte de un grupo, y no puede ser parte de un grupo a menos que tenga las habilidades sociales.

Marriott y Chebib han encontrado un camino a través de esta paradoja sobre la base de la relación entre los genes y el medio ambiente. ¿El siguiente paso? Ver si las habilidades de coordinación en redes sociales evolucionan en las poblaciones que reproducen. ¡Estaremos observando!

Ref: arxiv.org/abs/1504.06781 : Finding a Mate With No Social Skills

viernes, 8 de mayo de 2015

Recolección de datos para identificar grupos de pares adolescentes

¿Densidad o distinción? El papel de la estructura de datos y métodos de detección de grupo al describir grupos de pares de adolescentes

Scott D. Gest, gest@psu.edu
Universidad del Estado de Pennsylvania [1]

James Moody, jmoody77@soc.duke.edu
Universidad de Duke

Kelly L. Rulison, klr250@psu.edu
Universidad del Estado de Pennsylvania

Journal of Social Structures

Resumen: A pesar del interés interdisciplinario en la influencia social entre grupos de pares adolescentes, variaciones significativas en la recolección y análisis de datos de la red de pares no se han explorado, por lo que es difícil separar las diferencias sustantivas y metodológicas en los estudios de la influencia de pares. Analizamos dos tipos de datos de la red (amistades auto-reportadas y los informes de varios informantes de niños que "pasan mucho tiempo juntos") con tres métodos de identificación de estructuras de grupo (dos enfoques grafo teóricos y análisis de componentes principales) para explorar las diferencias sustantivas en los resultados. Entonces vinculamos estas diferencias de nuevo a las características de las redes subyacentes, lo que les permitimos una mayor penetración en el problema general de la identificación de los grupos de datos de la red. Encontramos que los diferentes enfoques analíticos aplicados a los mismos datos de la red producidos soluciones grupo moderadamente concordantes, con concordancias más altas para datos de múltiples informantes. Los mismos enfoques analíticos aplicados a diferentes datos relacionales (en los mismos nodos) producen la concordancia más débil, lo que sugiere que la estructura de datos subyacente puede ser más relevante de enfoque analítico en la contabilización de los resultados diferentes entre los estudios. La similitud de comportamiento entre los miembros del grupo fue mayor para los enfoques que se apoyan directamente sobre la densidad de los lazos directos.

I. Introducción

La investigación sociológica y psicológica de los grupos de pares adolescentes a menudo se ha procedido a lo largo de vías paralelas, la exploración de fenómenos similares, pero dentro de las tradiciones distintas para recopilar y analizar datos de la red de pares. Basándose en una rica tradición de la teoría de análisis de redes sociales en general y métodos (Doreian, Kapuscinski, Krackhardt, y Szczypula, 1996; Freeman, 2003; Friedkin & Cook, 1990; Moody, 2001a) sociólogos han estudiado la estructura de los grupos de pares adolescentes y su cambio dinámico en el tiempo (Doreian et al., 1996; Hallinan y Tuma, 1978; Hallinan, 1978; Haynie, 2001; Holanda y Leinhardt, 1977; Moody, 2001b), así como la influencia social y de difusión de los procesos (Cohen, 1977; Giordano , Cernkovich, Groat, Pugh y Swinford, 1998; Jussim y Osgood, 1989). Del mismo modo, los psicólogos han construido sobre teorías enfatizando pares como contextos de desarrollo individual (Hartup, 1996; Kindermann, 1996; Sullivan, 1953) para el estudio de la estructura y el cambio en diádica y redes de grupos (Berndt y Hoyle, 1985; Cairns, Leung, Buchanan y Cairns, 1995; Farmer, Estell, obispo, O'Neal, y Cairns, 2003>; Urberg, Degirmencioglu, Tolson, y Halliday Scher, 1995) y la influencia de los compañeros en la adaptación individual (Berndt, 1982, 1992; Cairns y Cairns , 1994; Hanish, Martin, Fabes, Leonard y Herzog, 2005; Kindermann, 1993).

A pesar de este interés en paralelo, hay relativamente pocos-citas cruzadas en las principales revistas sociológicas y de desarrollo que se ocupan de los procesos de grupo de pares. Esto es lamentable porque diferentes recopilación de datos y tradiciones analíticas han surgido en los dos campos, por lo que es difícil de integrar los hallazgos y la desaceleración de la transferencia de conocimientos e innovaciones de un campo a otro. Nuestro objetivo en este trabajo es contribuir a una integración productiva de estas tradiciones utilizando datos exclusivos de un solo entorno para explorar la comparabilidad de los grupos de pares identificados cuando se analizan dos procedimientos de recolección de datos de la red de pares adolescentes comunes con tres algoritmos de identificación de grupo común.

En el contexto de pares, los procedimientos de recolección de datos suelen variar a lo largo de tres dimensiones: el significado sustantivo de un vínculo social (amistad / afecto frente a la interacción), el nivel de análisis (díada vs. grupo) y el informante (autoinforme versus múltiples -informant). Estas tres dimensiones permiten muchas estrategias de medición distintos, pero por razones conceptuales y prácticos de dos estrategias de medición han ganado amplio uso: auto-informes de amistades diádicas e informes de varios informantes de los grupos de interacción basado. Del mismo modo, mientras que el número de algoritmos de agrupamiento encontrado en la literatura es grande, la identificación de ejes de principio de diferencia es más difícil. Dos enfoques generales comunes en la literatura son algoritmos de grafos teórica basada en la densidad de la red social de la tradición y algoritmos basados ​​en patrones correlacionados de los vínculos sociales de la tradición de estudios de desarrollo.

Mientras que otros han estudiado un conjunto más amplio de algoritmos de agrupamiento (Freeman, 2003), nos centramos en estos enfoques disciplinarios básicos para ayudar a la comparabilidad de acogida a través de una amplia brecha literatura y para ayudar a comparaciones de grupos de enlace directamente a las características de la estructura de la red. La comparación de los algoritmos de agrupación plantea un difícil trampa de diseño de la investigación: si cada enfoque es maximizar eficazmente su grupo-definición específica, se corre un riesgo claro de la simple comparación definiciones incompatibles - es decir, no hay un indicador externo clara de la verdadera solución. Sin embargo, en ausencia de una métrica externa, siendo capaz de comparar diferentes soluciones de primera continuación, vincular esas diferencias en los patrones de gráficos subyacentes ayuda a profundizar en el significado sustantivo de diferencias de definición de lo contrario implícitos incorporados en la agrupación de los algoritmos. En el contexto de un grupo de pares adolescentes explorado aquí, esperamos que las diferencias en el tipo de datos afectarán a la transitividad, la densidad y la cohesión estructural (estructura de ruta) de la gráfica, y por lo tanto dar lugar a diferencias en cómo los tres algoritmos asignan nodos para grupos. Sustancialmente, esperamos que estas comparaciones proporcionarán un primer paso para establecer el grado en que los estudios de "redes de pares" en diferentes de medición y análisis tradiciones identifican fenómenos similares.

Enfoques para recolectar detps de redes de pares de adolescentes

Las díadas de amistadas auto-reportadas. Preguntar a los adolescentes a nombrar sus amigos es quizás el procedimiento de medición más común tanto en la sociología y la psicología. Debido a que las amistades suelen definirse como relaciones voluntarias basadas en gusto, este procedimiento puede ser visto como un caso especial de la definición de los vínculos sociales significativos en términos de cercanía, afecto o cariño, que tiene largas raíces tanto sociológica (Homans, 1950; Sampson, 1969 ) y la investigación en el desarrollo (Bukowski, Newcomb y Hartup, 1996). Algunos investigadores subrayan este punto preguntando a los adolescentes a nombrar a sus "mejores" o "amigos cercanos" o preguntando a los adolescentes para nombrar compañeros de clase que les gusta o se sienten cerca. Los teóricos del desarrollo han sostenido durante mucho tiempo que los sentimientos de amistad o cercanía motivan intentos de entender y acomodar las preocupaciones del amigo, proporcionando así un proceso de influencia de los compañeros (Hartup, 1996; Newcomb y Bagwell, 1995; Sullivan, 1953). Debido a los sentimientos de agrado o afecto son inherentemente subjetiva, auto-informes son vistos como el método definitivo para identificar las preferencias de amistad adolescentes.

Existe una considerable variabilidad dentro y entre las disciplinas de la manera investigadores analizan auto-informes de amistades. Los psicólogos suelen centrarse en diadas amistad y por razones teóricas suelen restringir la atención a las opciones de la amistad recíprocos (Berndt y Murphy, 2002; Hartup 1996), aunque algunos también consideran nominaciones no recíprocos (Hektner, Agosto y Realmuto, 2000; Mrug, Hoza y Bukowski , 2004;. Snyder, Horsch, y Childs, 1997) y estructuras de los grupos más grandes (Urberg et al, 1995). En contraste, los sociólogos a menudo se centran en la estructura del grupo y por lo general se ven a las asimetrías en las nominaciones como indicadores de la jerarquía del grupo y el estado, aunque algunos permanecen también se centró en diadas (Hallinan y Tuma, 1978; Hallinan, 1978) o en las candidaturas recíprocos (Coleman, 1961 ).

Grupos de interacción basado en multi-informantes. Un segundo procedimiento de medida que cada vez más se está utilizando en la investigación psicológica consiste en pedir a todos los adolescentes en una red social para identificar compañeros de clase que "cuelgan alrededor mucho juntos" (Cairns, Perrin y Cairns, 1985; Cairns, Cairns, Neckerman, Gest y Gariepy, 1988). Al igual que con las amistades de auto-reporte, este procedimiento representa una perspectiva particular sobre la naturaleza de las relaciones sociales, el nivel correspondiente de análisis y el informante más adecuado. Preguntar a los adolescentes a identificar sus compañeros que "cuelgan alrededor mucho juntos" significa que los lazos sociales se definen en términos de frecuencia de interacción. Esto tiene sentido desde la perspectiva de las teorías de aprendizaje social (Cairns, 1979; Patterson, 1974, 1982), que sugieren que los comportamientos sociales se establecen, mantienen y cambian a través de instancias repetidas de modelado y refuerzo que se producen en las interacciones sociales. Por ejemplo, la cantidad de interacciones niñas en edad preescolar 'con sus compañeros agresivos predijo aumenta con el tiempo en su propia conducta problema (Hanish et al., 2005); y la cantidad de conversaciones amistad muchachos adolescentes delincuentes 'que implicó un enfoque bien organizada en actividades antisociales predijo la persistencia de patrones antisociales (Dishion, Nelson, Invierno, y Bullock, 2004).

La naturaleza visible de las interacciones sociales sugiere que los informes se pueden obtener de cualquier persona con acceso a la configuración de interacción pertinentes. Ciertamente auto-informes de los patrones de interacción son factibles y cara válido (Bagwell, Coie, Terry, y Lochman, 2000). Observaciones investigador directos también pueden ser muy eficaces con niños pequeños (Hanish et al, 2005; Ladd, 1983; Strayer & Santos, 1996; Vaughn y Waters, 1981.), Pero son caros de recopilar y tienen dos desventajas durante la adolescencia: algunas importantes configuración de interacción pueden ser inaccesibles para los investigadores (por ejemplo, pasillos, autobuses), y las que están disponibles (por ejemplo, aulas) pueden ser engañosos debido a las fuertes restricciones que imponen a los patrones de interacción (Feld, 1981). En contraste, los compañeros pueden ser vistos como expertos participantes-observadores en la red social de los adolescentes con acceso exclusivo a una serie de ajustes pertinentes. En un procedimiento desarrollado por Cairns (que se describe en detalle más adelante), todos los compañeros en una red se le pide identificar compañeros de clase que "cuelgan alrededor juntos mucho", y los múltiples informes se resumen en un simétrico "matriz de co-nominación." El uso de información de múltiples informantes para construir una red global se desarrolló independientemente en la línea de investigación sobre las estructuras sociales cognitivas. (CSS; Krackhardt, 1987) El método Cairns difiere del enfoque CSS en que los informantes ("perceptores" en términos CSS) son no se limita a informar sobre la pertenencia al grupo común, sino más bien se les permite informar sobre cualquier relación que conecta a otros en la red.

Auto-informes de diadas amistad e informes de varios informantes de los grupos de interacción basados ​​son conceptual y operacionalmente distintas maneras de evaluar las redes de pares adolescentes. Los dos enfoques difieren en cómo definen la base de las relaciones sociales (cercanía vs. interacción), el nivel de análisis en el que se produce la recogida de datos (díada vs. grupo) y el informante (auto vs. multi-informante). Las estructuras de datos resultantes son muy diferentes: auto-informes de amistades producen una matriz de adyacencia dirigido mientras que los grupos sociales de múltiples informantes producen una matriz de co-nominación simétrica. Estas diferencias de datos a menudo resultan en diferentes grados de densidad y transitividad. El grupo-base de los resultados de datos de múltiples informantes en gráficos similares a la proyección de un modo de gráficos de dos modos, con tríadas significativamente más cerrados que los gráficos de auto-reporte, que tienden a ser más escasa. Cada enfoque es una estrategia conceptualmente coherente para la identificación de "grupos de pares adolescentes", pero no es en absoluto evidente que grupos derivados de subjetivamente percibidos, los lazos de amistad diádicas son equivalentes a las derivadas de consensualmente percibidas, patrones de interacción de grupo visible. Cuando los investigadores utilizan estas dos estrategias diferentes para identificar los "grupos de pares", están estudiando la misma cosa?

Enfoques para la identificación de estructuras de grupo

Las similitudes en los patrones de lazos. Hay una larga tradición de la agrupación de individuos que comparten patrones similares de los vínculos sociales. Red investigadores sociales tempranas utilizaron análisis de componentes principales o análisis factorial centroide para identificar grupos (factores) de la interacción (por ejemplo, Wright y Evitts, 1961) y las matrices de nominación (por ejemplo, Bock y Husain, 1952; MacRae, 1960). Más recientemente, un número creciente de investigadores del desarrollo han utilizado algoritmos basados ​​en la correlación para identificar los grupos de pares de los informes de múltiples informantes (Boivin y Hymel, 1997; Cairns et al, 1985, 1988;. Estell, Cairns, Farmer & Cairns, 2002; Farmer et al, 2003;. Rodkin, Agricultor, Pearl, y Van Acker, 2000; Xie, Cairns y Cairns, 1999). Un grupo ha utilizado director factorización eje para identificar los grupos de una matriz de adyacencia (Bagwell et al., 2000). El análisis de componentes principales (PCA) se ha aplicado también a co-nominación matrices (Gest, Rulison y Welsh, 2005). Estos enfoques comparten la premisa de que los grupos pueden ser conceptualizados como individuos cuyos patrones de nominaciones amistad recibidos o cuyo perfil de los compañeros de nominaciones con sus compañeros son similares (es decir, correlacionados). Estos enfoques tienen vínculos claros con las tradiciones de bloque de modelado arraigadas en CONCOR (White, Boorman, y Breiger, 1976), donde los actores se clasifican como semejantes si tienen patrones similares de nominación a / de otros en la red. Una de las ventajas potenciales del enfoque PCA, como se hará evidente más adelante, es que un elemento de equivalencia estructural informa a la construcción de grupos primarios, que permite una para identificar grupos que son tanto interna densa y de manera similar situado en el gráfico en general.

Enfoques directos. El campo red social ha identificado muchos enfoques para encontrar grupos primarios en las redes (Frank, 1995; Fershtman, 1997; Burt, 1978; Freeman, 1992; Richards, 1995; Seidman y Foster, 1978). Una división básica en tales métodos es entre aquellos que identifican características exactas teoría de grafos y los que buscar el gráfico para identificar una solución iterativa. Muchos métodos gráfico-teórico para la búsqueda de grupos primarios tienen el reto en los entornos donde los datos están desordenados, lo que resulta en tareas que no son robustos a los tipos de datos que los analistas suelen encuentran (ver Moody, 2001a para una revisión). Estos métodos también suelen identificar grupos que en gran medida se superponen. Trabajos recientes sobre la cohesión estructural ha tenido esta característica como una fuerza de la modelo, en el que los componentes de k-conectada tener una estructura solapamiento estrictamente definido e interpretable y son más robustos para la calidad de datos a medida que aumenta k-cohesión. [2]

El enfoque alternativo ha sido identificar grupos basados ​​en un proceso de búsqueda y la agrupación, utilizando algoritmos que tratan de generar grupos con densidad relativamente alta en grupo. Los algoritmos exactos varían significativamente. Una línea de trabajo hace que muchas asignaciones de nodos a los grupos en los intentos de minimizar una función de coste (Borgatti, Everett, y Freeman, 1999; Guimera y Amaral, 2005). Gran parte de la investigación sobre los algoritmos de detección de grupo ha sido identificar maneras de semilla o acelerar este tipo de búsquedas, con algunos muy sofisticados de reconocimiento de patrones enfoques siendo más popular (Richards, 1995; Fershtman, 1997). Aunque a menudo con éxito en pequeños grupos, estas soluciones iterativas pueden ser muy lento en grandes redes. Trabajos recientes han intentado identificar los procesos de búsqueda, ya sea directamente en los gráficos, como extensiones de los procesos de recocido simulado (Guimera y Amaral, 2005) o en las estadísticas de resumen generados por la estructura de la red (Moody, 2001a) que permiten búsquedas de redes muy grandes. Por último, una tercera línea de investigación se ha adoptado un enfoque de modelado estadístico, utilizando algoritmos de búsqueda guiadas basadas en un modelo de lazo probabilidad (Frank, 1995). Estos modelos trabajan en la lógica de que los grupos deben centrarse en los lazos, por lo que la probabilidad de un empate entre i y j (pij) es una función de un parámetro en la partición de grupo, y los nodos están malabares a través de particiones hasta que se maximiza ese parámetro.

El Estudio Actual

Hasta donde sabemos, dentro de la literatura en las redes sociales de pares adolescentes, no hay reportes empíricos que comparan las soluciones grupales obtenidos al aplicar el factor de análisis y algoritmos de agrupamiento gráfico-teórico a dos de los tipos más comunes de datos de la red de pares. Para empezar a vincular estos diferentes de recopilación de datos y analíticos tradiciones, utilizamos un solo conjunto de datos para identificar los grupos de pares adolescentes basado en dos tipos de datos de la red de pares (amistades auto-reporte y grupos de interacción basada en múltiples informantes) con cada uno de los tres identificación de grupo métodos (análisis de componentes principales y dos algoritmos de grafos teórico).

II. Métodos


Los participantes

Los datos fueron proporcionados por 134 (62 niñas, 72 niños) de los 150 estudiantes (89%) que participaron en el sexto grado en una escuela secundaria que sirven a una comunidad pequeña, de la clase obrera en el centro de Pensilvania. Estos datos nos permitió describir las redes de pares de 148 (68 niñas, 80 niños) de los 150 estudiantes (ver más abajo). Los estudiantes de la escuela con los resultados cerca del promedio estatal en las pruebas de logros, aunque las tasas de pobreza en la comunidad superaron el promedio estatal. Casi todos los estudiantes (99%) eran de raza caucásica, lo que refleja la demografía de la comunidad. Este proyecto fue un componente de un Estudiantes Escuelas / Healthy Segura donativos obtenido por el distrito escolar de los Departamentos de Educación, Justicia y Salud y Servicios Humanos. Antes de la encuesta estudiantil octubre, los padres se enviaron cartas describiendo el proyecto con un formulario para firmar si no desean que su hijo participe. Los estudiantes cuyos padres no volvieron una forma exonerarlos de les hizo el proyecto para completar una encuesta grupo administrado con una duración aproximada de 45 minutos. Los estudiantes son libres de negarse a participar en la encuesta.

Datos de redes de pares

Amistades auto-reportadas. Construimos grupos de amistad de los informes de las amistades de los estudiantes. Se pedirá a los estudiantes: "Algunos niños tienen un montón de amigos, algunos niños tienen una amiga y algunos niños no tienen un amigo. ¿Y usted? Enumere los nombres de los amigos que tiene en su grado. "Los estudiantes recibieron una lista con los nombres de todos los estudiantes del sexto grado, organizado por aula. Espacio se proporcionó a los estudiantes a la lista de hasta diez nombres, aunque algunos estudiantes enumeran varios más que eso (rango: 0-31 nominaciones). Estos datos se organizan en una matriz de adyacencia. Para los principales análisis de componentes, entramos queridos a lo largo de la diagonal (MacRae, 1960).

Grupos de múltiples informantes. Construimos grupos de varios informantes, utilizando el método socio-cognitivo Mapa de Cairns (SCM). Se pedirá a los estudiantes: "¿Hay algunos niños en el grado que cuelgan alrededor juntos mucho? Enumere los nombres de los niños en cada uno de los diferentes grupos en tu grado. Trate de pensar en tantos grupos como sea posible. "El espacio se proporciona para que los estudiantes enumeran hasta nueve grupos con un máximo de diez personas por grupo y los estudiantes eran libres para listar a sí mismos en un grupo. Dos estudios observacionales confirman que la frecuencia de ser nombrado para el mismo grupo se correlaciona con tasas de interacción observables (Cairns et al, 1985;. Gest, Agricultor, Cairns y Xie, 2003). Por ejemplo, los estudiantes de cuarto y séptimo grado interactuaron con los miembros de sus grupos de varios informantes a tasas de tres a cuatro veces más altas que con otros compañeros del mismo sexo (Gest et al., 2003). En el presente estudio, todas las nominaciones fueron organizados en una matriz de co-nominación simétrica en la que las células fuera de la diagonal indican el número total de veces que dos individuos fueron nombrados al mismo grupo. Los valores a lo largo de la diagonal indican el número total de veces que un niño determinado fue nombrado a ningún grupo social. Los estudiantes no están obligados a clasificar todos los compañeros en grupos, así que había variabilidad en la frecuencia con diferentes adolescentes fueron nombrados para grupos.

El comportamiento social, las actitudes educativas y los logros. Examinamos la homogeneidad del grupo con respecto a cuatro medidas de comportamiento social y las actitudes educativas y los logros. Siguiendo los procedimientos habituales en la literatura del desarrollo de las relaciones entre pares (Coie, Dodge y Copotelli, 1982), nos preguntamos cada adolescente para nombrar el compañeros s / él le gustaba más y los compañeros s / le gustaba lo más mínimo. El número de veces que cada adolescente fue nombrado como gustado más y menos se anotó y estar normalizados dentro de género. La diferencia entre las puntuaciones de cada uno de los adolescentes normalizados le gustaba más y estandarizados querido menos se calcula como un índice de preferencia social por pares, y esta partitura en sí se estandarizó en el género (M = 0, SD = 1, inclinación = 0,04). La agresión se midió con cinco elementos valorados por los profesores en una escala de 5 puntos (a = 0,92; 1 = bajo, 5 = alto). Para captar mejor las puntuaciones altamente sesgadas sobre la agresión, cada niño fue clasificado como no agresivo (76,6% de la muestra con la media de las puntuaciones <2,0 en la escala de 5 puntos), moderadamente agresivos (14.6% con puntuaciones medias entre 2 y 3) o Muy agresivo (8,8% con puntuaciones medias superiores a 3,0). Gusto por la escuela se midió con un solo elemento medido en una escala Likert de 5 puntos ("Me gusta ir a la escuela"; M = 3,31, SD = 1,32, Skew = .29). Promedio de calificaciones (GPA) se calculó como el promedio de calificaciones de los estudiantes en Lectura, Estudios Sociales, Matemáticas y Ciencias durante el periodo de calificación primero (M = 3,40, SD = 0,66, Skew = -1,01).

Análisis de Componentes Principales (PCA)

Se aplicaron análisis de componentes principales a ambos tipos de datos de la red de pares. En primer lugar, hemos extraído todos los factores [3] que tenía valores propios superiores a 1,0, lo que resulta en 39 factores para la amistad de datos auto-reporte y 38 factores para los datos de la red de múltiples informantes. Los factores con valores propios de menos de 1 no fueron extraídos debido a que estos factores explican menos variación en la solución de una sola variable. En segundo lugar, hemos aplicado una rotación Varimax y luego determinamos si cada factor se define por al menos tres individuos cuya principal carga (> 0,30) estaba en ese factor. Necesitábamos tres individuos por factor porque la definición teórica de un grupo requiere al menos tres miembros y requiere cargas factoriales anterior 0.30 para asegurar que cada individuo comparte al menos 9% de su varianza con el grupo. [4] Cuando uno o más factores no cumplían estos criterios, nos re-encontramos con el PCA extraer un factor menor, resultando en 24 factores (grupo) soluciones para ambos tipos de datos de la red. Este proceso, junto con el uso de la rotación Varimax, nos ha permitido obtener la máxima diferenciación mientras sigue identificando grupos empíricamente fiables y conceptualmente significativas. Algunos adolescentes tuvieron cargas factoriales significativas en más de un factor que podría interpretarse como un reflejo de la pertenencia a más de un grupo, pero para efectos de comparar soluciones de agrupación a través de métodos, se asignan tales "dual-miembros" al grupo de los que tuvieron la carga más alta.

Técnicas Grafo-teóricas

Utilizamos dos métodos de detección de grupo basadas en la red social para comparar con la rutina PCA: (. Borgatti et al, 1999) recursivas Barrio Medios (RNM) enfoque de Moody (2001a) y las facciones (FAC) la rutina de UCINET VI. El enfoque RNM fue elegido debido a su vinculación teórica a los problemas de fondo de efectos de pares y la rutina FAC porque es comúnmente disponibles y por lo tanto susceptibles de ser utilizados por otros. Al igual que la rutina de PCA, ambos enfoques son "indirecta", en el que no buscan un determinado patrón gráfico teórico (como camarillas), pero en lugar de utilizar la red observada para generar una puntuación de costo / similitud que se agrupa o maximizada. Estos tipos de rutinas indirectos son útiles, ya que muchos de los enfoques teóricos gráfico directa (como la búsqueda de camarillas o k-núcleos) son o muy lento algorítmicamente o tiene dificultades sustantivas que identifican grupos primarios.

Rutina RNM Moody fue diseñado originalmente como un medio eficaz para agrupar muy grandes (10.000 nodos>) las redes, pero su fundamento teórico en los modelos de influencia pares (Friedkin, 1998; Friedkin y Cook, 1990) sugiere que debería ser sustantivamente útil para entornos en los que influencia de los compañeros es la preocupación central. La rutina de RNM utiliza un procedimiento de dos pasos. En el primer paso, uno simula un proceso de influencia de los pares de variables aleatorias k. La influencia de los pares de simulación luego ajusta la puntuación de cada persona en cada variable aleatoria para igualar el (tie-fortaleza ponderado) media de las personas a las que están conectados. Debido a que las variables originales no están correlacionados, densos racimos de nodos llegan a ocupar posiciones únicas en el espacio k-dimensional definido por la distribución resultante de variables aleatorias. En el segundo paso, se utiliza el análisis de conglomerados (aquí usamos método de la varianza mínima de Ward) para identificar grupos en función de las variables de influencia resultantes. El número de grupos se determina mediante el examen de los cambios en las estadísticas de ajuste (en este caso hemos utilizado (índice 1972) la segregación de Freeman como nuestro guía), de tal manera que dos grupos inicialmente distintas se unen si al hacerlo significativamente mejora el ajuste para ambos grupos. Además, los grupos pequeños o desconectados fueron examinados manualmente para ver si los nodos estarían mejor clasificados por la colocación de estos nodos en un "entre" posición de grupo. [5]

Las búsquedas de rutina del CAA para grupos con una estructura "-camarilla como". Una estructura perfectamente camarilla similar tendría grupos que están completamente conectados internamente (todos atado a todos los demás) y no hay lazos fuera de los grupos. Por lo tanto, los recuentos de rutina díadas nulos dentro de los grupos y lazos fuera de los grupos como desviaciones de lo ideal y ajusta los límites del grupo para reducir al mínimo el número de tales desviaciones. Al igual que con muchos de los algoritmos de detección de grupo, hay que determinar el número de facciones inicialmente. Los exámenes iniciales de estos datos mostraron que el enfoque RNM fue encontrar un menor número de grupos que el enfoque PCA, por lo que elegir 20 grupos como un número que "dividir la diferencia" entre los otros dos enfoques.

Tanto para el RNM y las rutinas del CAA, se trataron los datos como simétrica, pero ponderamos lazos recíprocos más de lazos asimétricos. [6] Para la nominación de datos multi-informante, se utilizó el número de veces que cada par fue nominado como estar en el mismo grupo que la base para el peso lazo. Carreras FAC iniciales sugirieron que el predominio de la denominación única menudo no concordantes estaba arrojando los resultados, por lo que limitan el análisis de pares con 2 o más compañeros de nominaciones.

Comparando resultados alternativos

Parte de la dificultad en la búsqueda de grupos primarios en las redes es definir exactamente qué características representan un grupo primario. Si bien los avances teóricos y algoritmos se han hecho en la identificación de aspectos particulares de la estructura de la red que aclaran nuestro entendimiento de los grupos primarios [como la cohesión estructural (Moody y Negro, 2003), la corbata fuerza (Freeman, 1992), la agrupación y la distancia (Holanda y Leinhardt , 1970; Holanda y Leinhardt, 1971; Watts, 1999) y la proporción de en grupo a las relaciones fuera del grupo (Fershtman, 1997; Guimera y Amaral, 2005)], no hay acuerdo unificado sobre lo que se considera una "camarilla -como "subgrupo. En la configuración sustantiva de interés aquí, esperamos que los grupos de pares primarios a ser pequeñas y muy unida. En general, también esperamos que sean en gran medida distinta, [7] con las relaciones / interacciones caer de manera desproporcionada en el grupo principal. Utilizamos seis medidas para examinar cómo "muy unida" y distintas soluciones de grupo son para ambos tipos de datos.

Los grupos muy unidos primarios es probable que sean relativamente densa y tienen muchas tríadas cerrados que sostienen el grupo local juntos. En general, la densidad de la red es el valor medio de las relaciones tomadas sobre todas las díadas posibles. Medimos la densidad relativa como la densidad de los lazos que caen dentro del grupo dividido por la densidad de los vínculos que se encuentran fuera de los grupos. Para dar cuenta de la estructura del grupo, así como el volumen (Freeman, 1992), utilizamos dos medidas basadas en la tríada. Tríadas cerrados capturan los casos en que los amigos de los amigos son amigos (relaciones transitivas), y esperamos que sustantivamente grupos de amistad primarias se caracterizan por un número relativamente alto de tríadas cerrados. La relación de transitividad se define como la proporción de todas las tríadas potencialmente cerrados que en realidad están cerrados. Se calcula como la proporción de todos los caminos de dos pasos (IAJ, JAK) que también son caminos directos (Îak). Se define la relación de transitividad relativa como la relación de transitividad calculado sólo entre dentro del grupo díadas sobre la relación de transitividad de toda la red. Idealmente, los grupos deben encierran tríadas cerrados, así cualquier caso de un límite del grupo de la separación de una tríada cerrada es una desviación del modelo de tipo ideal. Por lo tanto Medimos la proporción de todos tríadas cerrados (T300) que caen totalmente dentro del grupo para capturar la frecuencia con soluciones de grupo encapsulan tríadas cerradas. [8]

El carácter distintivo de un grupo se mide por la frecuencia de relaciones comprendidas en lugar de entre los grupos. Utilizamos el índice de segregación Freeman (1972), la proporción de todos los lazos que caen fuera de los grupos, y el índice de modularidad (Newman y Girvan, 2004), tres medidas de distinción grupo. Freeman razonó que si un grupo de partición era irrelevante, a continuación, las relaciones deben ser distribuidos al azar a través de las fronteras de grupo. Índice de segregación de la red de Freeman se calcula como la diferencia entre el número de relaciones a través del grupo observados y el número de relaciones a través del grupo esperados al azar, dividido por el número de relaciones a través del grupo esperados al azar. Cuando el valor es 1,0, todas las relaciones entran en grupos separados. Cuando el valor es 0, entonces las relaciones se distribuyen al azar entre los grupos. La estadística de la modularidad (Newman y Girvan, 2004) sigue una lógica similar y será 0 si los vínculos están distribuidos al azar. La ventaja de la puntuación de la modularidad es que la medida alcanza un valor máximo claro cuando los lazos son más propensos a caer dentro de los grupos, por lo que es ideal para la comparación de carácter distintivo del grupo a través de soluciones. Por último, la proporción de los lazos que quedan fuera de los grupos proporciona una fácil interpretación (aunque no calibrada contra el azar) métrica para la gran cantidad de relaciones a través del grupo.

El tamaño del grupo entra en nuestra consideración tanto sustantiva y metodológicamente. Al fondo, los grupos primarios de los niños tienden a ser pequeñas (Rubin, Bukowski y Parker, 1998) y por lo tanto cualquier solución que genera grupos muy grandes carece de un cierto nivel de validez aparente. Sin embargo, también esperamos un grupo para tener un cierto carácter extra-individual que se extiende más allá de cualquier miembro individual (Simmel, 1950; Moody y White, 2003). La colección más pequeña que puede existir independiente de cualquier solo actor es la tríada, y por lo tanto los grupos se define típicamente como que tiene 3 o más nodos. Metodológicamente, la distribución de tamaños de grupo afecta a todos los demás parámetros utilizados para definir los grupos. Por un lado, si todos los nodos se repartieron en un solo grupo, entonces no habría ningún vínculo fuera del grupo y todas las tríadas caerían dentro del grupo (no habría, por supuesto, haber reducción de datos que aquí tampoco!).


Estrategia Analítica

III. Resultados


Breve descripción de Peer red de datos


Informes de amigos y grupos. En promedio, los adolescentes enumeran 9.72 amigos (SD = 3,95) e identificados 3,76 grupos (SD = 2,01) con 4,60 individuos por grupo (SD = 2,10) (es decir, un total de 17.26 miembros del grupo). Más de la mitad de todos los amigos de auto-reporte (59,4%) y más de la mitad de todos los compañeros nominados a los grupos sociales (51,1%) estaban fuera de la propia aula del adolescente, lo que confirma que la red social se considera adecuada a nivel de toda la grado.

Estadísticas de grafos. Los datos del grupo de múltiples informantes demostraron una alta densidad de lazos (0.486) y transitividad (0.571). Esto sugiere amplia "clusteredness" para ser explotado por cada método de agrupación, que es de esperar, ya que los datos genera lazos entre todos los pares nombrados como miembros del mismo grupo. Por el contrario, los datos de amistad auto-reporte tenían menor densidad (0.121) y (0.302) marca transitividad. Esto hará que la búsqueda de grupos consistentemente más difícil que con los datos de varios informantes, ya que habrá menos agrupación de los algoritmos para explotar.

Sociogramas. Siguiente construimos sociogramas que ilustran cada tipo de datos de la red. En cada sociograma, posición en el plano xy se determina mediante un algoritmo de diseño automático fuerza dirigida implementada en Pajek (Batagelj y Mrvar, 2001). Para estos diseños, los vínculos sociales son análogos a los muelles, con valores más fuertes que indica un tirón más fuerte entre los nodos. Como tal, dos nodos que están conectados tenderá a ser cerca uno del otro, mientras que los nodos que están desconectados estarán más separados. En un sentido típico-ideal, si la red se compone de grupos muy distintos (y las nominaciones refleja estos grupos), entonces la figura contendría "grumos" distintas para cada grupo.

Figura 1. Nominaciones Auto-reportadas de Amistad 


Las líneas azules gruesas son correspondidos nominaciones amistad, gris fina son nominaciones asimétricos. Letras identifican nodos particulares para comparar con la Figura 2.

En la Figura 1, cada nodo representa un estudiante y cada línea representa una nominación amistad. Para el presente análisis, las relaciones asimétricas (líneas delgadas) cuentan menos que los lazos simétricos (líneas gruesas). Esta figura muestra que las candidaturas de amistad entre los alumnos de 6to grado están fuertemente condicionados por el sexo. Más allá de esta fuerte segregación sexual, la red no sugiere muchos grupos pequeños, especialmente entre los varones. En cambio, tanto el macho y la hembra lados de la red tienen una estructura de "centro-periferia", con un pequeño número de individuos que no tienen lazos recíprocos, y un gran grupo de personas que están fuertemente conectados. Las hembras en la red son un poco más diferenciado, con lo que parece ser dos o tres "grumos" superpuestas que se extienden a lo largo del eje "norte-sur". Además, hay dos pequeños grupos en la parte "sureste" de la figura sin conexiones recíprocos con el resto de la red, pero un vínculo entre ellos. Estos fueron los estudiantes que pasaron parte de su día en un aula de Educación Especial: a pesar de ser "integrado" en las aulas de Educación General para gran parte de la jornada escolar, amistades de estos niños fueron en gran medida independiente del resto de la nota.



En la Figura 2, cada línea indica el número de veces que dos estudiantes (nodos) fueron nombrados como miembros del mismo grupo. El espesor y la sombra de la línea corresponde a la frecuencia de co-nominación al mismo grupo. Aunque el número de compañeros de nominaciones que unen nodos individuales fue de 1 a 33, para mayor claridad estos valores se agruparon en seis rangos. Hay tres impresiones inmediatas dadas por esta figura. En primer lugar, hay grupos claros con acuerdos muy fuertes (líneas gruesas), sobre todo entre las mujeres, lo que indica un consenso sustancial entre los estudiantes con respecto a los patrones de interacción de sus compañeros. En segundo lugar, hay grandes diferencias individuales en el máximo número de compañeros de nominaciones que unen un estudiante dado a otros estudiantes: el número máximo de compañeros de nominaciones se centra alrededor de 10 (media = 11,1, mediana = 9,0), pero 39 (27,1%) estudiantes nunca fueron nombrados más de 5 veces con cualquier par, mientras que 18 (12,5%) estudiantes alcanzaron más de 20 compañeros de nominaciones con al menos uno de sus compañeros. En tercer lugar, los amplios vínculos en los niveles bajos (las líneas muy delgadas que conectan un amplio conjunto de nodos a través del gráfico) sugiere que algunas personas proporcionan informes idiosincrásicos de los grupos que están en desacuerdo con el consenso del grupo.

En general, los dos sociogramas corresponden muy de cerca en términos de la forma general, la separación de machos y hembras, y la ubicación de los nodos individuales (catorce de los cuales están etiquetados, A través de N, en cada gráfico). [10] Los dos grupos de alumnos de educación especial en la porción sur de la gráfica (incluyendo nodos G, J y K), por ejemplo, contienen miembros casi idénticos. Además, 3 de los 4 nodos masculinos en la sección "femenina" de la gráfica la amistad (incluyendo nodos E y I) están igualmente más estrechamente asociado con el lado femenino de la gráfica multi-informante. En ambos gráficos, muchachos L y M ocupan posiciones similares en grupos fuera del grupo principal de los niños, mientras que las niñas HF y BC se encuentran en posiciones paralelas dentro de los grupos relativamente fundamentales de las niñas. Niños N y D residen en la periferia de ambos gráficos, mientras que A es chica periférica en el gráfico de amistad pero más cerca del núcleo de la gráfica multi-informante.

La correspondencia entre la amistad y nominaciones múltiples informantes. Pusimos a prueba el grado en que el número de veces que dos personas fueron nominados como salir nominaciones amistad juntos predichos. Modelamos la probabilidad de una nominación amistad, el control de las medidas de la red y de participación de grupo, incluyendo: número de amigos con nombre, número de nominaciones amistad recibidas, número de nominaciones de grupo recibida y la composición por sexo de la díada. Debido a que la variable dependiente es dicotómica (nominado o no), se utiliza un modelo de regresión logística. Los resultados (Tabla 1) muestran claramente que el número de veces que una díada está nominado a un mismo grupo predice fuertemente una nominación amistad.

Tabla 1. Regresión logística de Nominación Amistad en Multi-informante Compañeros de nominaciones (odds ratio entre paréntesis)
Variable
Model 1
Model 2
Model 3
Model 4
Intercept
-4.87
-6.31
-6.54
-6.28
# of friends named by ego (ODG)
0.138
(1.15)
0.145
(1.16)
0.144
(1.16)
0.145
(1.16)
# of times alter was named as a friend (IDG)
0.146
(1.16)
0.144
(1.16)
0.144
(1.16)
0.153
(1.17)
# of times ego named as a group member (ego visibility)
-0.015
(0.989)
-0.011
(0.989)
-0.01
(0.989)
-0.01
(0.989)
# of times alter named as a group member (alter visibility)
-0.008
(0.992)
-0.008
(0.992)
-0.007
(0.993)
-.009
(0.991)
Same sex dyad

1.84
(6.355)
2.05
(7.76)

Both Male



1.74
(5.71)
Both Female



2.04
(7.69)
Number of Co-Nominations
0.603
(1.83)
0.508
(1.66)
1.09
(2.99)
0.506
(1.66)
Group x Same Sex


-0.610
(0.544)






Pseudo R2
0.37
0.423
0.428
0.424
Note.  All variables are statistically significant at the .0001 level.

Después de controlar la composición por sexo de la díada, por cada vez que se dice que las probabilidades de un aumento nominación amistad por 1,66 el par de pertenecer al mismo grupo. Este efecto difiere en composición de género. En concreto, un compañero de candidatura es más probable para predecir una amistad cuando la díada es cruz-sexo, aunque la relativa rareza de estas nominaciones hace que esta búsqueda de algo menos importante. Como se esperaba, los controles para la expansividad de red (ODG) y el atractivo (IDG) también son importantes. Aunque estadísticamente significativa sencilla visibilidad de cualquiera de las partes, realmente no importa mucho (los odds ratios están cerca de 1.0). Para simplificar la interpretación de este coeficiente, la Figura 3 parcelas de la probabilidad predicha de una nominación amistad por una díada entre personas del mismo sexo, por el número de veces que son nombrados como miembros de un mismo grupo (estimaciones basadas en el modelo 2). [11] Esta cifra indica que (en estos datos) la probabilidad de que una amistad de auto-reporte alcanza el 50% en el número de múltiples informantes interacción compañeros de nominaciones llega a alrededor de 7, y supera el 95% cuando el número de compañeros de nominaciones alcanza alrededor de 13.




Comparabilidad de soluciones de grupo

Tabla 2. Comparabilidad de soluciones de grupo 


Self Nominations
Multi-Informant Nominations


RNM
FAC
PCA
RNM
FAC
PCA
Self Nom
RNM
---
0.328
0.362
0.417
0.392
0.316
FAC
0.861
---
0.475
0.464
0.498
0.465
PCA
0.873
0.949
---
0.584
0.572
0.465
Mult Nom
RNM
0.881
0.942
0.958
---
0.687
0.695
FAC
0.872
0.947
0.957
0.965
---
0.665
PCA
0.862
0.948
0.948
0.969
0.966
---
Nota. Los valores por encima de la diagonal son los Rand estadística probabilidad ajustada (Morey y Agresti, 1984). Los valores por debajo de la diagonal son la estadística Rand simple, sin ajustar por casualidad. La interpretación de la estadística de Rand es la probabilidad de que un par elegido al azar será clasificado de manera similar por las dos particiones. La interpretación de la Rand ajustado es la diferencia porcentual entre el número de acuerdos observadas y el número de acuerdos de azar.
A continuación examinó las similitudes entre la agrupación de algoritmos para ambos tipos de datos. Tabla 2 contiene los coeficientes emparejan Rand describen la comparabilidad de las particiones de nodos a través de las seis combinaciones diferentes de datos de red y el algoritmo de identificación de grupo. Los coeficientes positivos a través de todas las comparaciones indican que las particiones se correlacionaron significativamente, pero las diferencias que se producen son sistemáticos. Acuerdo general es más alta en las tres soluciones de múltiples informantes (media = 0,97 Rand, Rand ajustado = 0,68) que a través de las tres soluciones amistad auto-reporte (media R = 0,89; AR = 0,39). Este efecto principal de los datos de la red es bastante grande, y en gran parte debido a la clara agrupación evidente en la matriz multi-informante. Efectivamente, los subgrupos de la red multi-informante son objetivos mucho más fácil golpear que en la red de amistad menos agrupado, por lo que las diferencias en la agrupación de los algoritmos tienen menos probabilidades de conducir a soluciones de agrupación divergentes.

Dentro de la red de amistad, la solución RNM es menos similar al de los otros dos (AR: RNM, FAC = 0,33; RNM, PCA = 0,36) de lo que son el uno al otro (FAC, PCA = 0,48). Esto sugiere que los tres métodos difieren en sus estrategias básicas que, como veremos más adelante, el comercio fuera, las agrupaciones más grandes distintivos (RNM) y las agrupaciones más pequeñas con mayor densidad en grupo (FAC, PCA). En general, los grupos derivados de los datos de amistad auto-reporte con un algoritmo particular eran tan similares a los grupos derivados de los datos de múltiples informantes (cuadrante superior derecho del cuadro 2; mediana AR = 0.47), ya que eran el uno al otro (AR rango de 0,33 hasta 0,48).

Desde la perspectiva de la comparación de los resultados entre diferentes combinaciones de técnicas de recolección de datos y estrategias analíticas, estos resultados envían una señal mixta. Por un lado, el acuerdo significativa oportunidad ajustados en todos los seis soluciones indica que los investigadores usando una amplia gama de métodos (medidas algoritmos *) son de hecho describiendo fenómenos similares. Por otra parte, en comparación con los datos de la amistad de auto-reporte, los datos de varios informantes más agrupados producen agrupaciones mucho más consistentes a través de varios métodos analíticos. Pasamos ahora a los detalles de los tipos de grupos identificados por cada enfoque.

Las diferencias en las características estructurales de soluciones de grupo


Tabla 3. Características estructurales de grupos
Type of Network Data
Group Identification Procedure
Recursive Neighborhood Means
FAC
Principal Components Analysis
Gender x Homeroom

Self-Reported Friendships
Density = .12
Transitivity Ratio = .57




   # of Groups
10 + 14  between
20*
24 + 3 unclassified

   Size: M (SD)
13.3 (11.6)
7.3 (1.9)
6.04 (2.22)

   Min  -  Max
5 - 43
5  - 12
3 – 12

   Groups of size = 3
0
0
3

   Relative Density
9.76
11.43
13.61
7.84
   Relative Transitivity
1.58
2.56
2.60
2.14
   Prop. closed triads in same group
0.60
0.27
0.24
0.21
   Freeman Segregation
0.57
0.32
0.33
0.311
   Modularity
0.46
0.30
0.31
0.41
   Proportion of ties out-of-group
0.346
0.641
0.636
0.636






Multi-informant Groups
Density .49
Transitivity Ratio = .57




   # of Groups
20+9 between
20*
24 + 1 unclassified

   Size: M (SD)
6.95 (3.03)
7.4 (2.6)
6.13 (2.44)

   Min  -  Max
4 – 14
5 – 13
3 – 11

   Groups of size = 3
0
0
4

   Relative Density
27.22
30.83
29.72
10.87
   Relative Transitivity
1.54
1.66
1.67
1.54
   Prop. closed triads in same group
0.41
0.52
0.31
0.21
   Freeman Segregation
0.56
0.58
0.53
0.394
   Modularity
0.52
0.53
0.50
0.36
   Proportion of ties out-of-group
0.399
0.383
0.439
0.556
* Number of groups is definitional

Tabla 4. Conducta de homogeneidad intragrupo



Type of Network Data


Group structure Index
Self-Reported Friendships
Multi-Informant Groups
Group Identification Procedure
Recursive Neighborhood Means
Like Going to School
.080 / .066 a
.228
Peer Social Preference
.142 / .143
.281**
Teacher-rated Aggression
.048 / .088
.204
Grade Point Average
.080 / .226*
.224
FAC
Like Going to School
.126
.220
Peer Social Preference
.197
.342***
Teacher-rated Aggression
.171
.229*
Grade Point Average
.247+
.246*
Principal Components Analysis
Like Going to School
.235
.276*
Peer Social Preference
.366***
.317**
Teacher-rated Aggression
.403***
.439***
Grade Point Average
.332**
.289*
p < .05. ** p < .01. *** p < .001.
Note. Effects of group membership (Partial eta-squared) after controlling for gender. For the RCN self-reported friendship solution, values after the slash are the partial eta-squared values after removing group 1.

La Tabla 3 contiene las estadísticas de la estructura del grupo de los seis soluciones de agrupamiento y, por comparación, las estadísticas de una sencilla agrupación atributo basado en el sexo y el aula. Tabla 4 contiene estimaciones del grupo de la homogeneidad del comportamiento. A continuación se resumen brevemente los resultados de las redes de múltiples informantes antes de examinar razones de la variabilidad en las soluciones para los datos de la amistad.

Tabla 3 contiene las estadísticas de la estructura del grupo de los seis soluciones de clustering y, por comparación, las estadísticas de una sencilla agrupación atributo basado en el sexo y el aula. Tabla 4 contiene estimaciones del grupo de la homogeneidad del comportamiento. A continuación se resumen brevemente los resultados de las redes de múltiples informantes antes de examinar razones de la variabilidad en las soluciones para los datos de la amistad.

Estructuras Grupo Multi-informantes. Los tres métodos producen grupos de tamaño similar de los datos de múltiples informantes. Los tamaños de grupo promedio fueron muy similares para RNM y FAC (6,95 vs. 7,40) con una distribución similar de tamaño del grupo (intervalo de 4 a 14 para RNM; 5 a 13 para FAC), y grupos de PCA eran sólo un poco más pequeño (M = 6,13 , rango de 3 a 11). Grupo tight-knittedness era muy similar a través de soluciones, con la densidad relativa de los lazos de fuera del grupo en grupos más o menos tres veces mayor para las soluciones de RNM, FAC y PCA (27.22, 30.83, 29.72) que para una partición que refleja la división por género y salón hogar (10,87). Diferenciación Grupo también fue similar en las soluciones.

Las estimaciones del grupo de la homogeneidad de comportamiento fueron generalmente confiable y moderada en magnitud para cada solución. Dada la similitud en las particiones, fue sorprendente que la homogeneidad fue consistentemente mayor para los grupos de PCA que para los grupos RNM, con homogeneidad de los grupos FAC a niveles intermedios. Los niveles sustancialmente más altos de similitud en el comportamiento agresivo de los grupos de PCA se debió en gran parte a un subgrupo de 13 niños, 5 de los cuales eran muy agresivos (que representan casi la mitad de los estudiantes altamente agresivas en todo el grado). RNM y FAC colocan los 13 individuos en el mismo grupo, mientras que la ACP les separa en un grupo de 8 que contenía los 5 individuos altamente agresivos y un grupo de 5 chicos no agresivos. La explicación más probable para las diferencias modestas en la similitud de los otros comportamientos es que PCA producida agrupaciones ligeramente más pequeñas, pero examinamos esta cuestión con más detalle en el contexto de las soluciones de redes de amistad, que diferían sustancialmente más en formas adicionales. En esta etapa, la característica más notable de datos multi-informante fue que tres procedimientos de identificación de grupo distintos producen soluciones que eran altamente comparables en términos de características estructurales, la colocación de los individuos en grupos, y estimaciones de la homogeneidad del comportamiento.

Estructuras de grupo de amistad auto-reportadas

Tamaño. Al igual que con los datos de la red de múltiples informantes, las soluciones RNM y Facción tendieron a producir grupos de amistad de más de la solución de PCA. FAC y PCA producen tamaños de los grupos que eran muy similares a los obtenidos cuando el método comparable se aplicó a los datos multi-informante (FAC: M = 7,3 para los datos de amistad, M = 7,4 para los datos multi-informante; PCA: M = 6,0 y M = 6.1, respectivamente). La solución amistad RNM genera un grupo masculino de 43 nodos. Este cluster grande domina la solución RNM, y parece conducir un número de las diferencias reportadas en la estructura del grupo a continuación. Cuando este grupo se excluye de la consideración, la solución para los datos de RNM amistad produce grupos solamente un poco más grande que los de datos de múltiples informantes (M = 8,5 vs. M = 6,95).

Densidad interna. La solución PCA produce grupos con la densidad más alta y transitividad interna, con los grupos FAC de ser bastante similar. Más específicamente, la densidad relativa de los lazos de la PCA, FAC y grupos RNM fue de 13,6, 11,4 y 9,8, respectivamente, y la relación de transitividad dentro del grupo para cada era 2.60, 2.56 y 1.58. Una vez más, gran parte de la diferencia en este "tight-knittedness" para la solución RNM es atribuible al gran grupo de 43 nodos. Cuando se excluye que grupo, los indicadores de densidad interna son más similares para los grupos RNM restantes.

Diferenciación. Los grupos RNM fueron más altamente diferenciados que los grupos de PCA o FAC. El sesenta por ciento de las tríadas cerrados caen dentro de los grupos RNM, mientras que la mayoría de las tríadas cerrados tanto en el PCA y rutinas FAC límites del grupo transversales, lo que sugiere que la solución RNM construye con eficacia grupos a fin de tener relativamente menos contactos con otros grupos. Esto es evidente en las otras estadísticas de agrupamiento grupo también. El índice de segregación para la solución RNM es de 0,56, frente a 0,32 y 0,33 para las soluciones del CAA y PCA, respectivamente y la puntuación de la modularidad de RNM es 0.456, frente a los 0,299 y 0,311 para la FAC y PCA, respectivamente. Del mismo modo, mientras que el 64% de los lazos quedan fuera de los grupos de las FAC y PCA, sólo el 35% de los lazos quedan fuera de los grupos de RNM.

Homogeneidad del comportamiento. Las tres soluciones producidas variando las estimaciones de la homogeneidad del comportamiento. El orden de estas diferencias fue el mismo que para los datos multi-informante: PCA produce las estimaciones más grandes de homogeneidad, FAC producido estimaciones intermedia, pero a menudo estadísticamente insignificante, y RNM produce generalmente estimaciones estadísticamente insignificantes y más débil, que aumentó sólo modestamente cuando el se excluyó gran grupo integrado por 43 personas. Dentro de los métodos, las estimaciones basadas en la PCA de homogeneidad fueron comparables para la amistad y de datos de múltiples informantes, pero para ambos FAC y (especialmente) RNM, las estimaciones de la homogeneidad eran claramente más alta para los datos de múltiples informantes.

Resumen. Los datos amistad auto-reporte de menos agrupados produjeron resultados que variaron más en todo método analítico que lo hicieron los datos de múltiples informantes. En estas circunstancias, el procedimiento RNM logra su ventaja relativa en la diferenciación a costa de los grupos menos muy unidas. Es decir, parece que el procedimiento de RNM tiende a favorecer a grupos distintos, incluso si son menos densos internamente, mientras que las soluciones de PCA y FAC vuelven grupos que son internamente muy densa y transitiva, pero que también tienen muchos lazos y tríadas cerrados que quedan fuera de los grupos respectivos. Estas diferencias se correlacionaron con las estimaciones de la homogeneidad de comportamiento.

Una mirada más cercana

¿Qué explica las diferencias en los resultados de partición para los datos de la amistad de auto-reporte? Figura 4 a continuación ofrece una comparación intuitiva de la RNM y soluciones de PCA. [12] El panel A presenta las parcelas de sombra para la superposición de tareas (primera matriz) y los datos en bruto utilizados para generar las soluciones de clúster (segunda matriz). El alto nivel de acuerdo a los datos de varios informante es evidente por el hecho de que la mayoría de las celdas en la primera columna son negro - lo que indica que la pareja fue clasificado en el mismo grupo de ambas soluciones. La matriz se ha permutado para tirar racimos a lo largo de la diagonal. Los lugares donde los algoritmos se pierda uno al otro son de color gris (el par se agrupan por un algoritmo, pero no a la inversa). Se puede ver que cuando los algoritmos "perdidas" tendían a ser en regiones muy similares de la gráfica. Por ejemplo, la mayor cantidad de desajuste entre las dos soluciones se produjo en la celda diagonal por bloques en la parte inferior derecha de esta imagen, donde ambos coincidieron en la colocación de pares de dos secciones más pequeñas, pero no están de acuerdo sobre el resto de los pares. Si nos fijamos en la región correspondiente de los datos en bruto, vemos que esta sección tenía niveles muy altos de candidaturas conjuntas. La tendencia de PCA para recoger grupos densos en lugar de distintas explica la diferencia en las dos soluciones.




Consideremos ahora el caso de auto-nominación en el panel B. El acuerdo global inferior es evidente en el mayor número de células grises, pero nota también la mayor diversidad de distribución empate en los datos en bruto en la segunda matriz. La región de mayor desacuerdo es en la parte inferior derecha de la matriz de adyacencia. Aquí vemos que la ACP y RNM de acuerdo en la asignación de pares de esos nodos con los lazos más fuertes, pero PCA dividir el conjunto en muchos grupos pequeños y RNM los mantuvo juntos. Este es exactamente el equilibrio entre la distinción y la densidad aludido anteriormente.

Este equilibrio se hace más evidente si nos acercamos en la región de la red de amistad auto-reporte en donde la mayoría de los tres enfoques no están de acuerdo: la gran 'maraña' de las relaciones recíprocos en el lado masculino de la figura 1. Figura 5 parcelas de los 60 nodos implicados en este conjunto, la identificación de los grupos con cuatro métodos diferentes. Para facilitar la comparación, las cifras utilizan el mismo diseño para cada solución, pero los colores y regiones sombreadas encapsulan nodos de acuerdo a cómo cada algoritmo agrupan el conjunto de datos. [13] La figura incluye las tres rutinas de agrupamiento indirectos en comparación aquí, así como un cohesiva bloqueando rutina descrita por Moody & White (2003), que ayuda a informar por qué los otros tres soluciones difieren. Para ayudar a visualizar los resultados de clúster, los nodos del mismo color están envueltos en una región semi-transparente con sombra del mismo color que los nodos.



Los tres métodos de agrupación están de acuerdo exactamente en agrupar a los siete nodos en la parte superior de la figura y tener asignaciones relativamente similares de los nodos alrededor de la estrella de nueve personas en el extremo derecho de la figura. Estos centro de nueve nodos alrededor de un actor central, y cada solución encuentra un grupo en torno a este actor, aunque difieren ligeramente en su composición exacta. La sección amarilla en la solución de RNM, sin embargo, domina la mayor parte de este subgrafo. Si se fijan bien en las tres soluciones, se ve poco acuerdo sobre la ubicación de los nodos dentro de este conjunto. [14] La solución FAC cruza la sección lazo más fuerte de múltiples maneras (otros diseños, que no peso lazos por ejemplo correspondido, hacer no ayuda aquí). La solución ACC, divisiones más compactos, pero una serie de puntos reparten el grueso de este enredo. El enfoque RNM simplemente lo llamó un solo grupo.

¿Por qué es tan difícil para dividir sistemáticamente esta sección? La respuesta está en el bloqueo directo dado en el panel inferior derecha de la figura 5. En lugar de identificar los grupos primarios, aquí contamos con un bloqueo de cohesión de la gráfica. Un bloque cohesionado contiene nodos que se encuentran de manera similar en la estructura de ruta de nodo independiente (en este caso basado únicamente en la red de gala correspondido). Si un componente es k-conectado, entonces la gráfica no puede ser dividido en piezas separadas a menos que al menos nodos k se eliminan (Moody & White 2003). Todos los nodos son parte de la 1-componente, pero anidado dentro de este conjunto es un bicomponente de 47 personas, dos de 3 componentes (tamaño 4 - el corazón de la sección de todos los métodos están de acuerdo en, y tamaño 35 - la región de naranja grande), y el núcleo de esta red es un 22-persona 4-componente (sección verde oliva) que admite que no hay k-componentes ligados más fuertemente. [15]

Conectividad Node proporciona un límite natural para los grupos primarios, como los puntos de corte en el gráfico proporcionan una partición clara de bordes en conjuntos distintos. Puesto que no hay división natural en la estructura de cohesión a explotar, las divisiones resultantes se basan en otras características del gráfico. [16] FAC parece incorporar débiles lazos, mientras que la solución de PCA parece utilizar tanto la información lazo débil y sacar provecho de la aumento de la correlación que viene de dos actores no ser conectados a terceros similares. Este elemento de la equivalencia estructural es evidente en el trío rosa claro compuesto por actores todos conectados a una estrella central (es decir, en otro grupo), y tal vez sugiere un mecanismo para explicar la mayor homogeneidad dentro del grupo. RNM, en cambio, se centra en gran medida de carácter distintivo del grupo, a partir de estos cutponts, y por lo tanto no intenta dividir este grupo.

IV. Conclusión y Discusión

¿Son los investigadores que utilizan diferentes métodos de recopilación de datos y diferentes técnicas de análisis para encontrar adolescentes "grupos de pares" el estudio de la misma cosa? Nuestros resultados sugieren que (estos datos) todos los métodos a encontrar grupos más o menos similares, pero que: (a) las diferencias que aparecen son sistemática y fuertemente afectado por el método de recogida de datos, dependiendo más en el algoritmo de detección de grupo para amistad autoinformada datos; (B) cuando los algoritmos de detección diferentes, que el comercio de la medida en que detectan grupos son distintos del resto de la red en lugar de internamente denso y (c) los algoritmos favoreciendo lazos internamente densos identifican grupos con mayor similitud de comportamiento.

Con respecto a los datos, los datos de varios informante produce blancos más fáciles para cualquier algoritmo de clúster. Tenemos la sospecha de que la diferencia sustancial en el "clusteredness" de la amistad de auto-reporte y datos multi-grupo informante sigue en gran parte de las diferencias en el nivel en que las afiliaciones son reportados (diadas vs. grupos). Las listas de amistades diádicas no implican vínculos directos entre los amigos de la lista. Por el contrario, registró las respuestas a nivel de grupos están completamente conectados (y distinta) camarillas, por lo que las redes resultantes tienen que parecerse a los solapamientos de camarillas. Las diferencias en la clusteredness de los dos tipos de datos se magnifican aún más por el hecho de que los adolescentes enumeran casi el doble de los pares en respuesta a los grupos cuestionan (M = 17,3) como lo hicieron cuando se enumeran sólo a sus propios amigos (M = 9.72) . Por último, es posible que existan diferencias en la transitividad de los patrones de interacción (peer-percibida) y (auto-reporte) lazos afectivos: en otras palabras, los sentimientos de amistad pueden ser organizados más difusa que los patrones de interacción percibidos por sus compañeros. Dentro de estos datos, no podemos desentrañar cómo cada uno de estos factores (grupo-vs-diada; multi-vs-auto-informantes; interacción vs-cercanía) contribuyeron a la mayor clusteredness de los datos de varios informantes, pero juntos claramente dado lugar a diferencias sustanciales en las estructuras de datos de los que proceden los grupos.

En la comparación de los algoritmos de detección, el procedimiento de RNM está sesgado hacia la identificación de los grupos que son distintos el uno del otro, mientras que FAC y PCA encontrar grupos que son más internamente denso, incluso si no son fuertemente distinto de otros grupos en la red. La tensión entre el carácter distintivo de grupo (RNM) y la densidad interna (FAC, PCA) es más evidente cuando la estructura de la red no se presta a un conjunto de grupos claramente diferenciados, como con los datos de la amistad (Figura 5). El hecho de que los grupos más pequeños, más densas identificados por FAC y PCA son más comportamiento homogéneo de las agrupaciones más grandes identificados por RNM sugiere que están haciendo diferenciaciones no aleatorias dentro de la gran "maraña" de las relaciones. La tensión entre los algoritmos de agrupación que hacen hincapié en el carácter distintivo sobre la densidad interna puede reducirse permitiendo que los grupos se superponen. En el procedimiento de PCA, por ejemplo, cargas importantes sobre dos factores pueden interpretarse como ejemplos de la pertenencia a dos grupos superpuestos: permite explícitamente como "doble pertenencia" probablemente disminuir el número de tríadas cerrados que se dividen cuando estas personas se ven obligadas a ser miembros de un solo grupo.

Es de destacar que el comportamiento fue mayor similitud dentro de los grupos identificados por PCA que dentro de los grupos identificados por los otros dos algoritmos. ¿Por qué esto es cierto, sobre todo teniendo fundamento teórico de RNM en los modelos de influencia de los compañeros? Dos explicaciones merecen un examen más detenido. En primer lugar, PCA utiliza un perfil puntuación de similitud (la correlación de los lazos a través de todos los actores), que es una medida clásica de la equivalencia estructural. Encontrar un efecto conductual más fuerte de grupos de PCA en los otros dos algoritmos sugiere el trabajo futuro podría centrarse en los mecanismos basados ​​en roles que se relacionan con la posición de un grupo en la estructura general de la red (Burt, 1978, 1987; Friedkin, 1984; Mizruchi, 1993) . En segundo lugar, podría ser que las díadas, en lugar de grupos, son la unidad relevante por la influencia en la adolescencia temprana. Investigadores del Desarrollo han sugerido que la dinámica a nivel de grupo y la influencia comienzan durante la adolescencia (Rubin et al., 1998), pero la investigación sistemática aclarar exactamente cuando estos procesos surgen que falta. Si influencias a nivel díada prevalecen en la adolescencia temprana, entonces la ligera ventaja en fuerza diádica identificado dentro de los grupos de PCA hace que sea una mejor representación de esos procesos.

La rutina RNM implementa un modelo de comportamiento que asume la misma influencia de los lazos ponderados de manera similar, pero trabajos recientes sociológico sobre la influencia social (Friedkin, 1998; Friedkin y Johnsen, 1997; Haynie, 2001) sugiere que los compañeros se cuentan diferencialmente en función de su posición. Una manera de probar esta hipótesis sería generar similitud resultados RNM que interactúan con la posición de los compañeros, dando mayor peso a los actores centrales o el número de terceros comúnmente unir cada par. Investigadores del desarrollo se están moviendo en una dirección similar al considerar estrategias que diferencialmente peso pares en la red social basada en la información sobre los dos lazos de amistad y la frecuencia de interacción (Kindermann, 1996). Por ejemplo, el peso extra podría ser asignado a amigos dentro de los grupos de interacción basados, o amigos recíprocos podría ser ponderado de acuerdo con el número de compañeros que informan que "cuelgan alrededor juntos mucho."

¿Qué recomendaciones generales sobre la recopilación de datos y el método de detección de grupo se pueden hacer de esta comparación? En primer lugar, está claro que los resultados de pertenencia a grupo dependen en gran medida el método de recogida de datos y parece que la característica más relevante del método depende del nivel de densidad y transitividad / agrupación que genera. En segundo lugar, mientras que nos encontramos con un amplio consenso general entre los métodos y los datos, cuando estos métodos de agrupación no están de acuerdo, que tiende a ser a lo largo de una dimensión de distinción frente a la densidad. Con los datos de amistad auto-reporte normalmente dispersas y menos en clúster, los investigadores deben reconocer este desacuerdo probable a través de métodos y proporcionar una justificación teórica clara de por qué la densidad sería preferible a la distinción (o viceversa). Los investigadores podrían buscar idealmente evidencia de la generalización de las conclusiones sustantivas mediante la comparación de las conclusiones sustantivas en varios algoritmos de agrupación aplicado a la misma red o el mismo algoritmo de agrupación aplicado a través de múltiples redes. Cuando no son convincentes razones conceptuales o logísticos para medir grupos de pares en términos de amistades de auto-reporte, a continuación, la recogida de datos en forma de grupos de múltiples informantes probablemente proporcionar una base más sólida para la identificación de grupo.

Las investigaciones futuras deberían explorar más a fondo varias cuestiones que estaban más allá del alcance de estos análisis. Fundamentalmente, si la similitud entre pares y la influencia operan principalmente a nivel diádico en la adolescencia temprana, podría ser más eficiente para centrarse en estos lazos directos y renunciar a la identificación de las estructuras de los grupos en total? ¿En qué etapa en el desarrollo de estructuras de grupo no agregan poder explicativo más allá de los lazos directos? ¿Cómo podrían permitir la superposición entre los grupos afectan las diferencias entre las soluciones de grupo y estimaciones de similitud de comportamiento? ¿Cómo podría la información sobre las amistades y las relaciones sociales de interacción basado combinarse para ponderar compañeros diferencialmente en función de su probable influencia? Teniendo en cuenta que tanto los investigadores de la red de desarrollo y sociológicos han articulado preguntas similares y las posibles soluciones a estas preguntas, continuó la fertilización cruzada de métodos conceptuales, metodológicos y analíticos debe producir beneficios para ambos campos.