viernes, 16 de mayo de 2014

Sen (2014): Los superdifusores de información en redes

La ciencia emergente de superspreaders (y cómo saber si usted es uno de ellos)
Nadie ha descubierto la manera de detectar los esparcidores más influyentes de información en una red real. Ahora que parece que va a cambiar con consecuencias importantes, sobre todo para los propios superspreaders.




¿Quiénes son los esparcidores de información más influyentes en una red? Esa es una pregunta que los vendedores, los bloggers, los servicios de noticias e incluso los gobiernos les gustaría contestar. Entre otras cosas porque la respuesta podría proporcionar formas de promover productos de forma rápida, para aumentar la popularidad de los partidos políticos por encima de sus rivales y para sembrar la rápida difusión de noticias y opiniones.

Así que no es sorprendente que los teóricos de redes han pasado algún tiempo pensando en la mejor manera de identificar a estas personas y comprobar cómo la información que reciben podría extenderse alrededor de una red. De hecho, se han encontrado una serie de medidas que punto los llamados super difundidores (superspreaders), personas que difunden información, ideas o incluso la enfermedad de manera más eficiente que cualquier otro.

Pero hay un problema. Las redes sociales son tan complejos que los científicos de la red no han sido capaces de poner a prueba sus ideas en el siempre ha sido muy difícil de reconstruir la estructura exacta de las redes de Twitter o Facebook, por ejemplo - que el mundo real. En su lugar, han creado modelos que imitan a las redes reales de ciertas maneras y probado sus ideas sobre estos en su lugar.

Pero hay cada vez más pruebas de que la información no se propaga a través de redes reales de la misma manera como lo hace a través de estos idealizados queridos. La gente tiende a transmitir la información sólo cuando están interesados ​​en un tema y cuando están activos, factores que son difíciles de tener en cuenta en un modelo puramente topológica de una red.

Así que la pregunta de cómo encontrar los superspreaders permanece abierta. Eso parece que va a cambiar gracias a la obra de Sen Pei en la Universidad de Beihang en Pekín y algunos amigos que han realizado el primer estudio de superspreaders en redes reales.

Estos muchachos han estudiado la forma en los flujos de información en torno a las diversas redes que van desde la red de blogs Livejournal a la red de la publicación científica en la Sociedad Americana de Física de, así como en los subgrupos de las redes de Twitter y Facebook. Y han descubierto que el indicador clave que identifica superspreaders en estas redes.

En el pasado, los científicos de la red han desarrollado una serie de pruebas de matemáticas para medir la influencia que tienen los individuos sobre la difusión de información a través de una red. Por ejemplo, una medida es simplemente el número de conexiones de una persona tiene a otras personas en la red, una propiedad conocida como su grado. La idea es que las personas más altamente conectados son los mejores en la difusión de información.

Otra medida utiliza el famoso algoritmo PageRank que Google desarrolló para el ranking de páginas web. Esto funciona mediante la clasificación de alguien más altamente si están conectados a otras personas de alto rango.

Luego está "centralidad de intermediación", una medida de la cantidad de los caminos más cortos a través de una red de pasar a través de un individuo específico. La idea es que estas personas son más capaces de inyectar información en la red.

Y, finalmente, es una propiedad de los nodos de una red conocida como su k-núcleo. Esto se determina mediante la poda de forma iterativa las periferias de una red para ver lo que queda. El k-núcleo es el paso en el que dicho nodo o persona está podados desde la red. Obviamente, los más conectados sobrevivir a este proceso, el más largo y tener la puntuación más alta de k-núcleo.

La pregunta que Sen y colegas dispuso a contestar era cuál de estas medidas mejor escogidos fuera superspreaders de información en las redes reales.

Comenzaron con LiveJournal, una red de blogs en ​​los que los individuos mantienen listas de amigos que representan vínculos sociales con otros usuarios de LiveJournal. Esta red permite a la gente a volver a publicar la información de otros blogs y utilizar una referencia de los enlaces de vuelta al post original. Esto permite que Sen y co para recrear no sólo la red de vínculos sociales entre los usuarios de LiveJournal, sino también la forma en que la información se transmite entre ellos.

Sen y colegas recogen todas las entradas del blog de ​​febrero 2010 a noviembre 2011, un total de más de 56 millones entradas. De ellos, unos 600.000 contienen enlaces a otros mensajes publicados por los usuarios de LiveJournal.

Los datos revelan dos importantes propiedades de difusión de la información. En primer lugar, sólo unos 250.000 usuarios participan activamente en la difusión de información. Esa es una pequeña fracción del total.

Más importante aún, se encontraron con que la información no siempre se difunden a través de la red social. El encontró que la información podría extenderse entre dos usuarios de LiveJournal a pesar de que no tienen ninguna relación social.

Eso es probablemente porque encuentran esta información fuera del ecosistema LiveJournal, quizás a través de búsquedas en la web o/a través de otras redes. "Sólo 31,93 % de los puestos de propagación se puede atribuir a los vínculos sociales observables", dicen.

Eso está en marcado contraste con los supuestos detrás de muchos modelos de red social. Estos simulan la forma en los flujos de información, asumiendo que viaja directamente a través de la red de una persona a otra, como una enfermedad que se transmite por contacto físico.

El trabajo de Sen y colegas sugiere que las influencias fuera de la red son cruciales también. En la práctica, la información a menudo se extiende a través de varias fuentes aparentemente independientes dentro de la red al mismo tiempo. Esto tiene importantes implicaciones para la forma en superspreaders se pueden observar.

Sen y compañía dicen que una persona grados -el número de otras personas que él o ella están conectados no- es un buen predictor de la difusión de la información como los teóricos han pensado. "Nos parece que el grado de que el usuario no es un indicador confiable de influencia en todas las circunstancias", dicen.

Lo que es más, el algoritmo PageRank es a menudo ineficaz en este tipo de red también. "Contrariamente a la creencia común, aunque PageRank es eficaz en el ranking de páginas web, hay muchas situaciones en las que no puede localizar superspreaders de información en la realidad", dicen.

Por el contrario, la propiedad del k-núcleo es relativamente bueno en encontrar superspreaders. "Nos encontramos constantemente que los mejores esparcidores están situados en el k-núcleo", dicen.

Lo que es interesante aquí es que Sen y colegas encontraron resultados similares cuando examinaron la red de divulgación científica en revistas de la Sociedad Americana de Física, así como en los subgrupos de las redes en Twitter y Facebook. Los usuarios de estas redes diferentes mostraron el mismo comportamiento de difusión de información.

Pero antes de que la conclusión de que el problema de encontrar superspreaders está ahora resuelto, hay un factor adicional que debe tenerse en cuenta. La medida k-núcleo es una propiedad global de la red sólo puede ser calculada teniendo en cuenta la estructura de toda la red.

Eso no es muy conveniente cuando se trata de grandes redes, como Facebook y Twitter, que son también los más valiosos para los vendedores, políticos, etc.

Así Sen y colegas han desarrollado todavía otra medida de la influencia que funciona casi tan bien como la medida k-núcleo, pero es mucho más fácil de calcular en el uso de subconjuntos de toda la red.

Su método consiste en sumar los grados de los vecinos más cercanos de una persona y decir que esto es casi tan bueno como la puntuación de k-núcleo para predecir superspreaders.

En otras palabras, tomar cada uno de sus amigos más cercanos, cuente el número de conexiones que tienen y luego añadir a todos ellos juntos. Si sus amigos más cercanos están altamente conectadas, lo más probable es que usted es un superspreader.

Si es así, hay algunas personas que les gustaría llegar a conocerte mejor -vendedores, políticos, gobiernos, etc. Con superspreaders ser tan valiosas materias primas, lo que será interesante ver cómo evoluciona el mercado para ellos y sus servicios.

Ref:  arxiv.org/abs/1405.1790 : Searching For Superspreaders Of Information In Real-World Social Media

MIT Technology Review

No hay comentarios:

Publicar un comentario