sábado, 29 de marzo de 2014

¿Pueden predecirse las cascadas en Facebook?

La naturaleza curiosa de las cascadas de compartir en Facebook
La mayoría del contenido en Facebook se comparte un par de veces, pero algunos pueden ser millones de veces compartida. Ahora científicos de la computación están empezando a comprender la diferencia.




Una de las características definitorias de contenido social es la forma en imágenes, vídeo y texto es compartida entre muchos usuarios. Inevitablemente, parte del contenido se hace más popular que otros y esto lleva a las cascadas en el que el número de publicaciones compartidas puede ser enorme. Aunque la mayoría de las piezas de los medios de comunicación tienen sólo unas pocas acciones, algunas se ha compartido muchos millones de veces.

Así que hay mucho interés en saber cómo predecir algo que es probable que sea muy popular en comparación con algo que no es. En la cara de ella, es fácil pensar que la predicción de la popularidad de los contenidos es casi imposible. Eso es porque depende de muchos factores que son difíciles de medir, como la naturaleza de los contenidos y la conectividad de las personas que lo ven.

Sin embargo, varios equipos han afirmado haber encontrado la manera de predecir de un puesto eventual de popularidad mediante el análisis de su popularidad poco después de su publicación. Sin embargo, dada la ausencia de una manera confiable de hacer esto en la web, se puede juzgar por sí mismo lo bien que estos mecanismos deben trabajar.

Hoy en día, tenemos una opinión diferente sobre el tema de la previsibilidad gracias al trabajo de Justin Cheng de la Universidad de Stanford en California, así como un par de amigos en Facebook y la Universidad de Cornell. Estos chicos muestran por qué su popularidad es tan difícil de predecir en el abordaje convencional de estudiar las primeras etapas de la popularidad.

Pero al mismo tiempo, que muestran que diversas características de una cascada se pueden predecir con exactitud notable y que esto se puede utilizar para hacer juicios exitosos sobre el comportamiento futuro de cascadas, una vez que han comenzado. El resultado es una visión mucho más profunda de la naturaleza de las cascadas de lo que podría pensarse inicialmente posible.

Cheng y colegas llegan a sus conclusiones mediante el análisis de la forma en que las fotografías fueron compartidos en Facebook durante un período de 28 días después de su carga inicial en junio de 2013. Los miró por encima de 150 000 fotos que fueron juntos ha compartido más de 9 millones de veces. Los datos les dijeron que las personas (nodos) volvió a compartir cada fotografía y en qué momento y esto les permitió reconstruir exactamente las redes por las que se produjeron las publicaciones compartidas.

En el pasado, los investigadores han observado cómo comienzan las grandes cascadas y luego trató de utilizar esa información para detectar grandes cascadas en el futuro, con resultados mixtos.

Cheng y colegas adoptan un enfoque diferente. Comienzan con una foto que se ha vuelto a compartir un cierto número de veces, digamos k. A continuación, determinar la probabilidad de que esta foto será compartida dos veces tantas veces. En otras palabras, su tarea consiste en predecir si la cascada se duplicará en tamaño.

Eso es una buena opción de la pregunta porque la distribución de tamaño de la cascada sigue un cierto tipo de ley de energía. Esta ley asegura que para cascadas de un dado tamaño, la mitad será más del doble en tamaño, mientras que la otra mitad no. Así que para decidir si una cascada dado se duplicará, una estimación aleatoria recibirá la respuesta correcta alrededor de la mitad de las veces.

La pregunta es si es posible distinguir características del conjunto de datos que permiten un algoritmo de aprendizaje de máquina para hacer algo mejor que esto. Así Cheng y sus amigos usan una porción de sus datos para entrenar a un algoritmo de aprendizaje automático para buscar características de cascadas que hacen predecible.

Estas características incluyen el tipo de imagen, ya sea un primer plano o al aire libre o tener un título y así sucesivamente, el número de seguidores del cartel original tiene, la forma de la cascada que se forma, ya sea un gráfico simple estrella o estructuras más complejas ; y, finalmente, la rapidez con la cascada tiene lugar, su velocidad.

Después de haber entrenado su algoritmo, la usaban para ver si se podía hacer predicciones sobre otras cascadas. Comenzaron con imágenes que habían sido compartidos sólo cinco veces, así que la pregunta era si finalmente se compartirían más de 10 veces.

Resulta que este es sorprendentemente predecible. " Para esta tarea, adivinar al azar obtendría un rendimiento de 0,5, mientras que nuestro método logra un rendimiento sorprendentemente fuerte : la precisión de clasificación de 0.795 ", dicen.

Y algunas de las características de la cascada de unos mucho mejores predictores y otros. De hecho, el rendimiento temporal de la cascada, la rapidez con que se propaga, es el mejor indicador de todos. Así que algo se propaga rápidamente, para empezar, es probable que se propague más.

Otro factor importante son los temas mencionados en el título asociado con una imagen, por ejemplo si el interés periodístico o asociado con un meme actual.

Cheng y coautores también dicen que es más fácil hacer una predicción que el número de re-acciones aumenta." Esto demuestra que más información es siempre mejor : cuanto mayor es el número de publicaciones compartidas observadas, mejor es la predicción ", dicen.

Y es por eso que los esfuerzos anteriores han fracasado - que en gran parte siempre comienzan con muy poca información.

Existen limitaciones para el trabajo, por supuesto. La más obvia es que se hizo sólo con las fotos compartidas en su totalidad dentro de Facebook. Puede ser que compartidas en Facebook son algo diferentes de los que ocurren en otros lugares en la web y que las fotos son tratados de manera diferente de los enlaces de la historia, por ejemplo.

Pero Cheng y coautores confían en que gran parte de lo que encontraron serán útiles en otros lugares. "A pesar de estas limitaciones, creemos que los resultados dan ideas generales que serán de utilidad en otros ámbitos ", dicen.

Y deja mucho de interés para otros investigadores a seguir. Cheng y colegas han tropezado con una rica veta de información sobre la naturaleza de las cascadas en las redes sociales. Y hay más oro que las colinas de Thar.

Ref : arxiv.org/abs/1403.4608 : ¿Puede predecirse las Cascadas?

MIT Technology Review


viernes, 28 de marzo de 2014

ARS 101: Mark S Granovetter

Mark Granovetter


Nacimiento 1 de junio de 1943 (70 años)
Nacionalidad Estadounidense.
Campo Sociología.
Alma máter Universidad de Stanford.

Mark Granovetter es un sociólogo estadounidense de la Universidad de Stanford.1 Elaboró varias teorías sobre sociología moderna en los años 70. Dentro de sus estudios sobre redes sociales y en la sociología económica, cabe destacar "la fuerza de los lazos débiles" o también conocida como la teoría de “la fuerza de los vínculos débiles”, enunciada en 1973. Pese a ello, esta teoría está vigente en pleno siglo XXI, y valorando la evolución de la sociedad, cada vez más.
En esta teoría Granovetter argumenta cómo la coordinación social se ve más influida de lo que valoramos habitualmente por vínculos débiles establecidos con anterioridad con otros actores con los que se tiene poco o ningún contacto, carencia de vínculos emocionales y escasos lazos relacionales y no tanto como creemos por lazos más fuertes como puede ser la familia o amigos.
Granovetter comprobó cómo se depende mucho más de lo que apreciamos de estos grupos, en especial en actividades como la búsqueda de trabajo o a la hora de organizar proyectos. Esta teoría cada día cobra más vigencia, y es que la relevancia de las redes sociales así como las redes profesionales favorecen este hecho.

Algunas publicaciones

  • Getting A Job: A Study of Contacts and Careers. Cambridge, Mass: Harvard University. 1974. ISBN 978-0-674-35416-6
  • «Threshold Models of Collective Behavior». American Journal of Sociology 83 (6):  pp. 1420–1443. 1978. doi:10.1086/226707.
  • «The Strength of Weak Ties: A Network Theory Revisited». Sociological Theory 1:  pp. 201–233. 1983. doi:10.2307/202051.
  • - Reimpreso en Social Structure and Network Analysis. Sage. 1982. ISBN 978-0-8039-1888-7
  • «Economic Action and Social Structure: The Problem of Embeddedness». American Journal of Sociology 91 (3):  pp. 481–510. 1985. doi:10.1086/228311.
  • «Problems of Explanation in Economic Sociology». Networks and Organizations: Structure, Form, and Action. Boston, Mass: Harvard Business School. 1992. ISBN 978-0-87584-324-7
  • «The Impact of Social Structure on Economic Outcomes». Journal of Economic Perspectives 19:  pp. 33–50. 2005. doi:10.1257/0895330053147958.
  • «Structure and tie strengths in mobile communication networks». Proceedings of the National Academy of Sciences 104 (18):  pp. 7332–7336. 2007. doi:10.1073/pnas.0610245104. PMID 17456605. Bibcode: 2007PNAS..104.7332O.: estudio que confirma la hipótesis de Granovetter en una red de comunicaciones móviles.

martes, 25 de marzo de 2014

Redes económicas de la Mafia

Red económica de la delincuencia organizada revelada
Un enfoque basado en la teoría de redes revela el patrón de vínculos entre las empresas controladas por la mafia involucrados en el crimen organizado y el resto de la economía por primera vez.




La teoría de redes ha revolucionado la comprensión de la economía en los últimos años. Ya no es la economía de un agitado misteriosa masa gobernada por leyes arcanas con poca evidencia práctica para apoyarlos.

En lugar de ello, la economía es una red de empresas que están vinculadas si se produce una transacción financiera entre ellos. Este enfoque ha dado los economistas una visión única de la forma en que las diferentes partes de la economía dependen unos de otros y cómo el dinero, los recursos y los flujos de información a través del mundo de los negocios.

Pero aquí hay una pregunta interesante: ¿cómo el crimen organizado que en todo esto? Hoy tenemos una respuesta de todo tipo gracias a la obra de Stefano Gurciullo en la University College de Londres. Gurciullo ha estudiado las redes económicas de las empresas en una región de Sicilia, Italia, destacando el papel de las empresas que se sabe están asociados con la mafia local.

Él dice que los resultados revelan una interesante propiedad de las empresas que participan en el crimen organizado. Ellos tienden a estar involucrados en sectores con buenas conexiones de la economía y las empresas mafiosas mismas tienden a estar entre los más conectados en toda la economía.

Gurciullo basa su trabajo en los datos recogidos por la policía antimafia italianos en 2002. Se centra alrededor de Porto Empedocle, una ciudad de unos 17.000 habitantes en el sur centro de Sicilia. En 2002, su economía consistía en 1.380 empresas de las cuales el 30 por ciento tienen cuatro o más empleados y sólo el 0,05 por ciento tienen más de 10 empleados.

Estas empresas operan en 29 sectores económicos, que van desde el hotel y la hospitalidad de la construcción a las telecomunicaciones. Con mucho, los mayores sectores por el número de empresas son los comercios al por menor y al por mayor, dando a entender que la principal fuente de ingresos de la población local es a través del comercio local.

Las pruebas reunidas por la policía antimafia italiana demuestra claramente la implicación de la mafia en el sector de la construcción de esta economía. Esta evidencia muestra una violenta lucha por el control y eventual monopolio de esta industria. Las empresas controladas por la mafia obligadas las empresas locales para comprar materias primas a partir de ellos y extorsionaron dinero de protección a la vez.

La evidencia incluye incluso una conversación grabada en la que dos empresarios mafiosos planeaban matar al director general de un competidor potencial. Sin embargo, finalmente descartó este enfoque debido a la atención que atraería a la policía y porque se creía que esta medida debía reservarse para situaciones más graves.

El enfoque de Gurciullo consiste en trazar las relaciones entre los distintos sectores económicos, prestando especial atención a la relación entre la industria de la construcción, sabe que tiene la participación de la mafia, y otros sectores. Luego trazó la red de vínculos entre las empresas pertenecientes al sector de la construcción.

Los resultados muestran una tendencia clara. "Los sectores penetrado por el crimen organizado muestran un mayor que promedio del Índice de centralidad y concentración", dice.

Lo que es más, las empresas específicas involucradas en el crimen organizado tienden a tener un lugar especial en la red. "Por lo menos una de las firmas que experimentan Mafioso infiltración posee el más alto grado nodal de la sub-red del sector", dice.

Eso tiene sentido. Las Naciones Unidas define el crimen organizado como : "un grupo estructurado de tres o más personas existente durante un período prolongado de tiempo y que tienen el propósito de cometer delitos graves mediante una acción concertada mediante la intimidación, la violencia, la corrupción u otros medios con el fin de obtener, directa o indirectamente, un beneficio financiero o material."

Es evidente que una operación criminal de este tipo sólo puede tener éxito si se vincula a muchas otras empresas. Así que no es de extrañar que las empresas controladas por la mafia se sientan en el centro de una red económica.

Por supuesto, hay limitaciones para este tipo de estudio. La primera es que es sólo un ejemplo; quizás otros ejemplos líderes del crimen organizado a los diferentes tipos de redes.

Otra limitación es que los datos es poco probable que sea completa. Tal vez hay otras empresas que participan en la delincuencia organizada que la policía no registraron dar sólo una visión parcial de la repercusión en la red.

Sin embargo, a pesar de sus limitaciones, el trabajo proporciona una interesante visión de la naturaleza de la delincuencia organizada y su papel dentro de las redes que subyacen a nuestras economías.

Y es evidente que trabajar para el futuro. Una pregunta interesante es por qué la mafia se concentra en la construcción cuando hay otros sectores de la economía que están más altamente conectados dentro de la red, como la venta al por menor y al por mayor.

Tal vez la respuesta tiene que ver con el valor de los trabajos. Los proyectos individuales de construcción a menudo pueden tener valores medidos en millones de euros. Pero las ofertas importantes en los sectores de venta al por menor y al por mayor son probablemente valen mucho menos.

Los datos de Gurciullo no incluye ningún estudio del valor monetario de las empresas. Pero esta vía podría ser una fructífera línea de investigación para el futuro.

El trabajo de Gurciullo también es valiente. Dada la naturaleza de los datos, la dificultad en la obtención de los tipos y de las personas involucradas, esto es potencialmente una peligrosa investigación a la cual abocarse y un trabajo valiente para estar seguro.

Ref : arxiv.org/abs/1403.5071  : La infiltración de la delincuencia organizada en la economía privada legítima : un enfoque de análisis de red empírica

MIT Technology Review

jueves, 20 de marzo de 2014

Jerarquías emergentes de un juego en red

Cómo los mundos de juegos virtuales están revelando la naturaleza de las jerarquías humanas
La forma más jugadores forman en grupos de juegos en línea revela que las jerarquías son un producto inevitable de la condición humana, dicen los científicos de la complejidad.





Uno de los objetivos de la antropología es entender la forma en que los humanos interactúan para formar grupos. De hecho, los antropólogos saben desde hace tiempo que las sociedades humanas son altamente estructurados.

Pero exactamente qué tipo de estructuras forman y en qué medida estos grupos dependen del medio ambiente sigue siendo objeto de mucho debate. Así que una pregunta interesante es si los seres humanos forman el mismo tipo de estructuras en los mundos en línea como lo hacen en la vida real.

Hoy en día, obtener una respuesta gracias a la labor de Benedikt Fuchs en la Universidad Médica de Viena en Austria y un par de amigos. Estos chicos han estudiados los grupos humanos forman al jugar un juego en línea multijugador masivo llamado Pardus .

Su conclusión es que los seres humanos forman naturalmente en una jerarquía de tipo fractal en el que las personas pertenecen a una variedad de grupos en diferentes escalas. De hecho, la formación de jerarquías parece ser una parte innata de la condición humana.

En Pardus, los jugadores exploran un universo futurista al interactuar y competir en una economía impulsada por el jugador. Desde 2004, cuando el juego se puso en marcha, unas 400,00 personas se han unido a este mundo. Estos jugadores pueden marcar otras personas como amigos, forman colectivos para mejorar su competitividad y que pertenecen a otras facciones.

Pero lo más importante, lo que los jugadores hacen es registrado en el juego, lo que lo ha hecho a los investigadores estar tan interesados en analizarlo.

Fuchs y colegas descargan más de tres años del valor de estos datos, incluyendo la información completa sobre las redes sociales creadas por la comunicación, el comercio con y "el gusto " a otros jugadores. Después de haber reconstruido estas redes y cómo varían con el tiempo, Fuchs y coautores determinaron su complejidad usando una medida conocida como orden Horton- Strahler.

Este es un método matemáticos usan para medir la complejidad de un árbol ramificado. Asigna una orden para cada parte del árbol en función del número de "niños" que se ramifican fuera de ella.

Las ramas están en el extremo de las ramas, sin hijos, y así tener la orden más baja de 1. Las ramas de la jerarquía se numeran según el número de hijos que tienen. Esto permite que partes de la jerarquía en muy diferentes partes del árbol a ser comparados.

El ordenamiento de Horton-Strahler se utiliza regularmente para medir la complejidad de ramificación de todo, desde los ríos y afluentes de los lenguajes de programación de alto nivel. Y en las redes sociales, por supuesto.

Fuchs y colegas aplicaron exactamente este proceso a las redes en Pardus y encontraron una jerarquía de ramificación de siete niveles. El primer nivel son los propios individuos, el nivel dos resulta ser pequeños grupos de personas que se han marcado como amigos y se han comunicado recientemente.

A continuación se muestran las personas vinculadas de forma más débil , que pueden haber, una vez comercializados o marcados como amigos, pero no comunicados con regularidad. Estos aparecen en la tercera orden.

Los jugadores también pueden formar alianzas, grupos formales que adquieren ciertos privilegios de juego. Estos aparecen en el cuarto orden. Luego están las facciones más grandes que se forman las órdenes de cinco y seis. El séptimo orden comprende todos en todo el juego.

Lo interesante de estas órdenes no es sólo su existencia, sino su escala con respecto al otro. "Sorprendentemente, los jugadores en línea muestran el mismo tipo de capas jerárquicas estructuradas como las sociedades estudiadas por los antropólogos, en los que cada una de estas capas es de tres a cuatro veces el tamaño de la capa inferior," dicen Fuchs y colegas.

Eso es un resultado interesante. Que la misma jerarquía emerja en muy diferentes situaciones sugiere que todo lo que produce este efecto es independiente del medio ambiente. En otras palabras, debe ser una propiedad innata de la conducta social humana.

Fuchs y colegas van aún más lejos. "Nuestros hallazgos sugieren que la organización jerárquica de la sociedad humana está profundamente anidado en la psicología humana", dicen.

Una conclusión interesante. La pregunta ahora es cómo profundizar aún más en esta psicología para embromar aparte con más detalle.

Ref : arxiv.org/abs/1403.3228 : Fractal organización multi - nivel de los grupos humanos en un mundo virtual

sábado, 15 de marzo de 2014

Redes de pases de fútbol

Análisis de las redes de distribución de balón en fútbol: pases de juego y pases de adaptación

Isidro Maya Jariego, María Rocío Bohórquez Gómez-Millán


Este artículo propone distinguir los pases de juego y los pases de adaptación al juego en las aplicaciones del análisis de redes sociales al estudio del fútbol. Las redes de pases de balón permiten describir y evaluar las configuraciones tácticas en el desarrollo de un partido (Bundio y Conde, 2007; Cotta, Mora, Merelo-Molina y Merelo, 2011). El equipo es analizado como una red en la que los jugadores son los nodos y los pases de juego son lazos dirigidos. Los patrones de interacción entre jugadores revelan procesos emergentes que trascienden las estadísticas individuales de corte tradicional. Pese a que las primeras aplicaciones utilizan la matriz bruta de pases de balón, la diferenciación de las relaciones entre jugadores en función del tipo de tarea desarrollada muestra con más claridad los elementos tácticos del juego (Maya Jariego y Bohórquez, 2011). Para ilustrarlo utilizamos datos del Real Betis Balompié en la final de Copa de S. M. El Rey de 2005 y del encuentro Getafe CF – Sevilla FC en la final de Copa de 2007. Tanto los indicadores de centralidad como las pruebas no paramétricas muestran una clara diferenciación entre la red de pases de juego y la red de pases de adaptación. Los resultados permiten interpretar el desarrollo táctico del partido, que comparamos con la descripción basada en estadísticas individuales de corte tradicional.


viernes, 14 de marzo de 2014

Importando datos de redes sociales en NodeXL

Cómo importar datos en NodeXL

NodeXL ofrece múltiples formas de importar datos para el análisis. De hecho, puede ser la única herramienta que ofrece tan vastas opciones para un usuario final. Cuando se presiona el botón de importación que se encuentra en la esquina izquierda de la cinta NodeXL, se le presentará con varias opciones (como se da en la figura a continuación) que se describirá más adelante en el tutorial.

 
Fig: Importando datos en Node XL

Las formas de importar datos se ha dividido en cinco categorías principales que se explicarán más adelante

1)    Importación desde otras herramientas de Análisis de Redes Sociales

Puede importar un archivo guardado de herramientas de análisis de redes sociales como Pajek o UCINET.

2)    Importación de un libro ya existente

Si usted tiene un libro ya existente con la lista de amigos y su relación entre sí, es posible importar el libro y lo utilizan a visualizar su red.

3)    Importación desde redes de Emails

Usted puede importar directamente la red de correo electrónico si utiliza un cliente de correo electrónico como Outloook, Thunderbird, etc, que tienen la indización habilitado en Microsoft Windows.

4)    Importar desde Twitter o YouTube / Flickr

El plugin te da opción de importar a la red de su página y el canal en sitios de redes sociales.

5)    Importar usando los importadores de terceros

Estos importadores como Net Social Importer, VOSON te dan muchas opciones sobre cómo importar datos y hasta qué nivel.

Para saber más sobre "Cómo importar datos a NodeXL", pasar por el siguiente vídeo: