miércoles, 30 de abril de 2014

Smith: Think Link: Network Insights with No Programming Skills


jueves, 17 de abril de 2014

Red de amigos en clase: Sesgo parental y efectos de pares

Red de amigos en clase: Sesgo parental y efectos de pares

Los autores entrevistan a los padres y sus hijos matriculados en seis escuelas primarias en el distrito de Treviso (Italia). Se estudia las diferencias estructurales entre la red de amigos niños reportados por los niños y los esbozados preguntados a los padres. Encontramos que la red de los padres tiene un sesgo: los padres esperan que los efectos de otros amigos sobre el rendimiento escolar sean más fuertes de lo que realmente son. Por lo tanto, los padres de los estudiantes de bajo rendimiento informan que sus hijos son amigos de los estudiantes de alto rendimiento. Nuestras simulaciones numéricas indican que cuando esta tendencia se combina con un sesgo de cómo algunos niños se dirigen a los amigos, a continuación, hay un efecto multiplicador en el rendimiento escolar esperado.

miércoles, 16 de abril de 2014

Redes criminales detectadas por telefonía móvil

Cómo detectar las pandillas delictivas usando datos de teléfono móvil
Las fuerzas del orden están recurriendo a la teoría de las redes sociales para comprender mejor los comportamientos y hábitos de las bandas criminales.



El estudio de las redes sociales está proporcionando conocimientos dramáticos en la naturaleza de nuestra sociedad y la forma en que están conectados entre sí. Así que no es ninguna sorpresa que las agencias de aplicación de la ley quieren entrar en el acto.

Las redes criminales son tan sociales como la amistad o las redes de empresas. Así que las mismas técnicas que pueden desvelar los vínculos entre nuestros amigos y colegas también deben trabajar para los ladrones, traficantes de drogas y la delincuencia organizada en general.

Pero, ¿cómo sería su agente de la ley ordinaria ir sobre la recolección y análisis de datos de esta manera ? Hoy en día, obtener una respuesta gracias al trabajo de Emilio Ferrara en la Universidad de Indiana en Bloomington y unos pocos amigos.

Estos chicos han creado una plataforma de software a medida que puede reunir información de los registros de teléfono móvil, desde bases de datos policiales y de los conocimientos y la experiencia de los agentes propios para recrear redes detallados detrás de las organizaciones criminales.

La nueva plataforma, denominada LogAnalysis, da una visión única en el hacer de una organización criminal. "Permite a los investigadores forenses para comprender profundamente las jerarquías dentro de las organizaciones criminales, el descubrimiento de los miembros que desempeñan un papel central y proporcionan una conexión entre los sub-grupos ", dicen.

Uno de los primeros problemas que cualquier agente del orden público es probable que vienen en contra de la hora de estudiar las redes sociales es el gran volumen de datos que este proceso genera. Aquí es donde LogAnalysis entra en su cuenta.

Importa automáticamente los registros de llamadas de teléfono primas, elimina ambigüedades y redundancias en los datos y luego lo convierte a un formato que puede ser fácilmente representada en el tipo de formato gráfico visual que permite un análisis más detallado. También permite a los agentes para agregar otros datos como fotos policiales de los registros policiales y demás información que el oficial podría tener a la mano.

Los agentes pueden entonces estudiar los datos en un número de diferentes maneras. Para empezar, se puede mirar en la red de vínculos entre los individuos de acuerdo con el número de llamadas que hacen el uno al otro.

En esta red, cada teléfono es un nodo y existen conexiones entre los teléfonos que han llamado el uno al otro. Esto permite la detección inmediata de las comunidades que tienden a ponerse en contacto entre sí más a menudo. Esto a su vez puede revelar la jerarquía de una organización criminal y de las personas más importantes en su interior.

Por supuesto, el conocimiento de la forma en que las organizaciones criminales trabajan juega un papel crucial en el análisis de estos datos. Por ejemplo, la gente que hace el mayor número de llamadas no necesariamente son los encargados.

Eso es debido a que estas bandas limitan deliberadamente sus comunicaciones para que los jefes se comunican las instrucciones eran de un pequeño número de tenientes que luego distribuyen los mensajes por la red. " Las redes de delincuentes fuertemente emplean el secreto para escapar de las investigaciones ", dicen Ferrara y co.

LogAnalysis también permite a los agentes del orden para el estudio de las redes en los períodos de tiempo limitados. Eso les permite, por ejemplo, el estudio de las llamadas que se realizan justo antes y después de un crimen en particular.

Ferrera y co ilustran su papel con un ejemplo de una red criminal grande para que las fuerzas del orden obtuvieron registros de 84 teléfonos en un período de 15 días. Esta red fue responsable de una serie de robos, extorsiones y tráfico ilícito de drogas. Los datos personales se retiraron por razones de privacidad.

Ferrera y co muestran cómo LogAnalysis revela los vínculos entre los miembros de esta pandilla, cómo se agrupan en torno a las llamadas delitos específicos y cómo ciertos miembros operaban en hasta 14 subgrupos diferentes, algunos de los cuales tenían la tarea específica de cometer asesinatos.

Esa es una interesante aplicación, práctica para la teoría de redes sociales. Y plantea una serie de preguntas importantes sobre la naturaleza de la evidencia en las investigaciones criminales. En particular, en qué medida pueden las redes sociales se utilizan como prueba de pertenencia a una organización criminal?

Otra pregunta es donde esta información proviene y qué tipo de red criminal que se aplica.

Teniendo en cuenta que tres de los cuatro investigadores en este documento se basan en la Universidad de Messina, en Sicilia, no está más allá de los reinos de la posibilidad de que los datos provienen de esa parte de Italia también. Y si es así, no es difícil imaginar la clase de organización que se describe aquí.

Ref: arxiv.org/abs/1404.1295 : Detecting Criminal Organizations In Mobile Phone Networks

lunes, 14 de abril de 2014

El grafo sexual de Game of Thrones

Grafo de relaciones sexuales en 'Game of Thrones'
Huffington Post | por Matthew Rappaport

El sexo usualmente no suele estropear su estado de ánimo, pero si usted no ha visto las tres primeras temporadas de la serie de HBO "Game of Thrones", es posible que desee para cubrir sus ojos hasta entonces.

He aquí un vistazo glorioso en todo el sexo de las tres primeras temporadas. Antes de gritar de placer y/o de terror, esta tabla no incluye el sexo de la Temporada 4, confirmado o supuesto (el salvaje juego previo de Jon Snow, ¿alguien?).



Usted podría estar pensando que había más conexiones en los siete reinos, y estarías en lo correcto. Esta infografía muestra sólo las conexiones implícitas en pantalla entre los que amas y te encanta odiar. HuffPost posteó un corte de vídeo juntos un mashup de sexo para todos ustedes más de 18 años para ver desde las tres primeras temporadas, que deberían cubrir cualquier cosa que la imagen de arriba haya dejado de representar.

El autor y creador "Juego de tronos" George RR Martin, escribió un episodio de cada temporada , y él escribió Temporada 4 Episodio 2 : "El león y la rosa", que se estrenará en HBO el domingo 13 de abril. Tememos que puede haber menos tiempo para el sexo y posiblemente más tiempo para la sangre, pero tendremos que esperar y ver.

domingo, 13 de abril de 2014

Buscando al consumidor a través del ARS

Redes sociales y búsqueda del consumidor

¿Quién es su cliente objetivo? Ese ha sido la cuestión de "hacia donde apuntamos" de los consultores de marca por generaciones. Las personas que vienen con respuestas interesantes son valoradas y admiradas.

No ha habido escasez de estrategias y métodos de poner adelante a contestar. Las encuestas de consumidores, grupos de enfoque y las técnicas estadísticas han tratado de identificar a, para comunicarse con, y adquirir los consumidores adecuados para el producto adecuado.

Sin embargo, cada vez es más claro que somos, en gran parte, producto de nuestras redes sociales. Nuestras opiniones y comportamientos se ven muy afectados por una compleja red de influencia social. Esa realidad está dando lugar a una nueva forma de pensar y una serie de nuevas posibilidades estratégicas. El análisis de redes ha sido útil en otros campos y el potencial de comercialización es enorme.

¿Quien dirigió los ataques del 9-11?

Al día siguiente de los ataques del 9-11, la estructura de liderazgo de los secuestradores se publicó en los principales periódicos. ¿Cómo se imaginan eso? Si se piensa en ello durante un minuto, ese es el problema orientación definitiva y no tan diferente de la identificación de quien sería un consumidor probable para una marca.

La respuesta es, por supuesto, secreta y clasificada, pero el científico de redes Valdis Krebs realizó su propio análisis de redes sociales juntando vínculos entre los secuestradores de los informes de noticias y el cálculo de tres medidas de influencia :

Centralidad de grado: ¿Cuántos enlaces cada secuestrador tenía con el resto de la red.

Centralidad de intermediación: Su ubicación en la red en relación con otros miembros.

Centralidad de cercanía: La distancia social media entre un miembro en particular y todos los demás miembros de la red.

Esto es lo que se le ocurrió :



Se dará cuenta de que Mohamed Atta lideró por un amplio margen en las tres medidas, así que no es sorprendente que se le identifica como el líder de la red. También es interesante que Zacarias Moussoui, el reputado "vigésimo secuestrador", figuras en forma tan destacada.

Para una visión más completa, revise el sumario completo de Valdis Krebs aquí. Es una lectura fascinante.

La caza de Bin Laden

Por supuesto, después de los ataques iniciales, estaba la cuestión de la localización de la orquestador principal, Osama bin Laden, un esfuerzo representado en el nuevo libro Manhunt de Peter Bergen. En 2005, después de años de búsqueda infructuosa, un documento titulado "Avances" comenzó a circular entre los funcionarios de inteligencia que describen 4 "pilares" para formar una "red para la búsqueda :

Liderazgo de Al Qaeda: El lugar más obvio para buscar terrorista más importante del mundo es el estudio de sus consortes de cerca. Algunos hemos capturado e interrogado, otros que encontramos más tarde y recorrimos sus archivos. Por desgracia, nunca nos pareció mucho para llevarnos a nuestro destino.

Familia: Ningún hombre es una isla. Incluso archicriminales tienen personas que los aman. Otros fugitivos superiores, sobre todo Adolf Eichmann y Pablo Escobar se dispararon de esa manera. Bin Laden tenía una gran familia que se dedicó a, por lo que este era un lugar obvio para buscar.

Comunicados de Prensa: Una de las marcas de Bin Laden fueron sus declaraciones a los medios de alto perfil. Al rastrear hacia atrás desde el destino (medios de comunicación de alto perfil) los investigadores esperaban para localizar su origen - al hombre mismo.

Redes de correo: Como líder de una gran organización, Bin Laden tenía para comunicarse con sus seguidores. Los funcionarios sabían que había dejado hace tiempo que el uso de cualquier tipo de forma electrónica de la correspondencia, por lo que supusieron que él debe ser el uso de una red de mensajeros. Esta fue de hecho la forma en que finalmente lo encontraron.

Cuando leí esto, algunas cosas me llamaron la atención. En primer lugar, se parece mucho a la forma en que los consumidores de la marca del segmento que nosotros, pero el uso de los grupos sociales. En segundo lugar, que no era de las conexiones de alto perfil que dieron frutos, pero el mensajero humilde que llevó a la meta, que es exactamente lo contrario de lo que se puede esperar para ver en una presentación de marketing.

El Mito de los influyentes

Es el último punto que es particularmente importante. Tenemos vendedores tendemos a asumir que el mundo es relativamente sencillo. Dividimos a los consumidores en pequeños segmentos ordenados y esperamos que actúen en consecuencia. Los ricos deben comprar productos caros, los pobres deben pellizcar peniques y así sucesivamente.

Sin embargo, el mundo real tiene su propia lógica que no es tan fácil capturado en una diapositiva de PowerPoint. En ninguna parte es esto tan cierto como en el mito de los influyentes, personas aparentemente mágicas que son tan fresco, influeyentes y de gran alcance que todos bailan a su son. De hecho, hay muy poca evidencia de que existen y mucho que diga que no lo hacen los influyentes.

En realidad, la influencia es más bien una función de los umbrales que cualquier otra cosa. No nos convence por cualquiera persona o evento, sino por una maraña de múltiples señales. El efecto global puede ser sustancial y la investigación por Christakis y Fowler ha demostrado que muchos de los atributos de comportamiento, incluyendo la obesidad, se ven afectados por nuestras redes sociales.

Al igual que en el caso de correo de Bin Laden, cualquiera en la red puede inclinar la balanza. Después de todo, las redes son un fenómeno de grupo y mirando a los individuos, en gran medida no alcanza el punto.

El poder de la "Q"

Si queremos pensar seriamente acerca de las redes y la comercialización, es necesario alejarse del viejo pensamiento de un "consumidor objetivo" y empezar a pensar en lo que es una red de destino viable se vería así. En otras palabras, ¿qué tipo de red llevará nuestro mensaje de manera más eficiente?

Un estudio muy citado realizado por Brian Uzzi y Spiro Jarrett nos da una herramienta para determinar exactamente eso. Examinaron las redes sociales de los musicales de Broadway y midieron una métrica llamada "Q", que, sin entrar en demasiados detalles, básicamente mide la densidad de la red.

Esto es lo que encontraron:



Cuando las personas sin vínculos previos comienzan a trabajar juntos, los resultados tienden a ser pobres, por no estar lo suficientemente familiarizados con los demás para desarrollar un proceso de trabajo fuerte. Los equipos que tienen cierta familiaridad con los demás les va mucho mejor. A medida que aumenta la densidad de la red, también lo hace la productividad.

Sin embargo, más allá de cierto punto llegan de conocerse muy bien (es decir, la red se vuelve demasiado densa) y la creatividad, junto con los resultados financieros, se resienten. Las redes que son demasiado flojas que no permiten que la información fluya, pero los que son demasiado apretados pueden mantener las nuevas ideas y sofocar la innovación.

Cabe destacar que el tipo de red social fue más determinante del éxito de un juego que cualquier otro factor, incluyendo el presupuesto de marketing, presupuesto de producción y la rentabilidad histórica del Director.

Marcas como Redes

Al igual que los musicales de Broadway, las marcas son también las redes. Que tienen éxito son lo suficientemente densa que los consumidores se influyen entre sí, pero no tan endogámica que están cerrados al mundo exterior y rechazan el cambio ( una trampa que puede hacer que el crecimiento difícil para las marcas con seguidores de culto similares).

Así, más allá de la IPO de Facebook la semana pasada $ 100 mil millones, debemos ver la aparición de las redes sociales electrónicas como una oportunidad para mirar a los consumidores de una manera completamente nueva que nos puede permitir pedimos completamente nuevas preguntas.

¿Esa última campaña mejorar nuestra red añadiendo a nuestra red consumidor o diluirlo? ¿Hay que tratar de mejorar la densidad de la red o alcanzar? Análisis de redes sociales puede revelar respuestas y nos llevan en direcciones completamente nuevas.

Por supuesto, nada de esto disipa la necesidad del análisis y la táctica más convencional. Para estar seguro, hay considerables obstáculos técnicos y computacionales para la gestión de métricas de red para las grandes marcas, pero la ciencia de la red tendrán mucho para ofrecer en los próximos años.

- Greg

Digital Tonto

viernes, 11 de abril de 2014

Mapas de amistad en dispositivos móviles

Crean un mapa de la amistad basado en las redes sociales y dispositivos móviles
Investigadores analizaron diversas servicios on line y de geolocalización de usuarios para crear un modelo que pueda ayudar a estudiar la propagación de información o rumores. 
Por Miguel Ángel Criado  | Materia (bajo licencia Creative Commons) - La Nación

 
Un usuario consulta su cuenta de Twitter desde un teléfono móvil. Un estudio sobre las redes sociales busca analizar el funcionamiento de los rumores en base a los datos que se generan en diversas plataformas on line. Foto: Reuters
Nos hacemos amigos de aquellos con los que estamos más tiempo y pasamos más tiempo con los amigos. Sobre esa lógica, expertos en sistemas complejos han analizado la dinámica de tres redes sociales para crear un modelo sobre la amistad. La combinación entre conexiones sociales y su desarrollo en movilidad permite explorar mejor cómo nos relacionamos y con quién. El modelo servirá para anticipar la propagación de la información, rumores y, en menor medida, patrones para hacer nuevos amigos.

El estudio de las redes sociales humanas, entendido aquí en su sentido original, no referido a las de internet, se ha visto muy favorecido por la explosión de éstas últimas. Twitter, Facebook, Flickr o Instagram se han convertido en grandes aliados de los científicos sociales para entender cómo se forman y cómo son las relaciones entre las personas. Otro de los grandes objetos de su estudio es la movilidad, clave para diseñar sistemas de transporte, desarrollos urbanos, asignación de recursos. Sin embargo, hasta ahora apenas existían modelos que combinaran el espacio y el tiempo.

Eso es lo que han hecho Investigadores del Instituto de Física Interdisciplinar y Sistemas Complejos (IFISC), centro mixto de la Universitat de les Illes Balears y del Consejo Superior de Investigaciones Científicas (CSIC). Aprovechando el Big Data , analizaron una cantidad ingente de datos de tres redes sociales para fisgonear en las conductas humanas, en particular, en las relaciones de amistad.

De Twitter contaron con la información de 714.000 usuarios y sus más de 15 millones de conexiones en forma de replies (el botón de responder). Como una de las patas de su modelo era la movilidad, su base de datos estaba sólo formada por los tuits que estaban geolocalizados, obtenidos por medio del GPS del móvil del usuario. También usaron la información de unos 250.000 usuarios de otras dos redes sociales: Gowalla y Brigthkite. Menos conocidas en España, ambas ya han desaparecido pero su mecanismo básico de funcionamiento es similar al de Foursquare, donde los usuarios hacen check-in al llegar a un sitio desvelando su posición y conociendo también la de sus amigos.

Mapa de movilidad (arriba) y conexiones sociales (abajo) de 20 usuarios (puntos) en Estados Unidos, Reino Unido y Alemania. Foto: Gentileza PLoS ONE

"Tenemos redes sociales reales (las tres estudiadas) y los usuarios están geolocalizados. Así obtienes una red social en el espacio", dice José Ramasco, científico del IFISC y coautor del estudio, recién publicado en PLoS ONE . El trabajo analiza la forma y dinámica de estas redes espaciotemporales en Estados Unidos, Reino Unido y Alemania, por ser estos tres países los que ofrecían un mayor número de usuarios, en particular de Gowalla y Brigthkite. Pero creen que, con prudencia, sus resultados podrían ser válidos para otros países como España.

El punto de partida de su modelo es la última posición conocida de un usuario durante el mes que cubrían los datos que analizaron. A partir de ahí, las conexiones entre ellos y sus ubicaciones permiten dibujar un mapa de la amistad apoyado en una serie de parámetros. Uno es la probabilidad de que dos usuarios tengan una conexión en función de la distancia. La lógica aquí es sencilla. Tendemos a mantener relaciones con los que están más cerca y esta tendencia decae siguiendo una ley de potencia a medida que los kilómetros entre ambos aumentan.

Sin embargo, los investigadores tuvieron que corregir aquí su modelo e incluir la existencia de conexiones 100% online a grandes distancias entre gente que no se ha visto nunca o casi. Son relaciones que no existían antes de que apareciera Internet. Otro de los parámetros tenidos en cuenta en el modelo era la probabilidad de que el usuario viajara a ver a alguno de los amigos con los que mantiene una conexión pero que están lejos.

Cuando echaron a correr su modelo, vieron que los usuarios tienden a permanecer cerca de sus ubicaciones originales. En eso, sigue la estructura básica de las redes sociales , que se construyen sobre dos puntos en el espacio fundamentales, el hogar y el trabajo. Pero también comprobaron que había saltos en el espacio ocasionales que se corresponden con la visita a algún amigo de otro punto del país. Es entonces cuando pueden aparecer nuevas conexiones.

"Uno de los aspectos que más nos ha llamado la atención es el de los triángulos, una figura muy relevante para la sociología", explica Ramasco. Las conexiones entre tres usuarios permiten crear esta figura geométrica en las relaciones sociales. Vieron que en la distribución de las conexiones, se producían dos picos muy pronunciados. Por un lado, se generaban triángulos equiláteros donde la misma longitud en cada lado indicaba que eran conexiones a corta distancia. Sin embargo, también había un segundo pico con triángulos con uno de sus lados muy alargados. Aquí, uno de los miembros de la conexión es un amigo que está muy lejos.

Este fenómeno se da especialmente en Estados Unidos, con conexiones de este a oeste muy pronunciadas. Aunque el estudio descartó analizar las conexiones fuera de los países, comprobó también que los estadounidenses tienen la mayor parte de sus relaciones entre ellos. Sin embargo, en el Reino Unido y en especial en Alemania, las amistades transfronterizas son más habituales. También vieron que en Estados Unidos hay un mayor número de conexiones exclusivamente online y que en las dos naciones europeas la tendencia es a la predominancia de los triángulos equiláteros.

"Con este modelo se podrían hacer simulaciones sobre como circula la información o se propagan los rumores", comenta el investigador del IFISC. Aunque en menor medida, también podría servir para estudiar el desarrollo y evolución de una enfermedad contagiosa. Incluso señalaría la probabilidad de que uno haga un nuevo amigo en determinado lugar. "Individuo a individuo eso es muy complicado, pero se podría dibujar un patrón de la amistad", corrige Ramasco..

jueves, 10 de abril de 2014

Los 4 grados de separación de Facebook

Anatomy of Facebook


Think back to the last time you were in a crowded airport or bus terminal far from home. Did you consider that the person sitting next to you probably knew a friend of a friend of a friend of yours? In the 1960s, social psychologist Stanley Milgram’s “small world experiment” famously tested the idea that any two people in the world are separated by only a small number of intermediate connections, arguably the first experimental study to reveal the surprising structure of social networks.

With the rise of modern computing, social networks are now being mapped in digital form, giving researchers the ability to study them on a much grander, even global, scale. Continuing this tradition of social network research, Facebook, in collaboration with researchers at the Università degli Studi di Milano, is today releasing two studies of the Facebook social graph.

First, we measured how many friends people have, and found that this distribution differs significantly from previous studies of large-scale social networks. Second, we found that the degrees of separation between any two Facebook users is smaller than the commonly cited six degrees, and has been shrinking over the past three years as Facebook has grown. Finally, we observed that while the entire world is only a few degrees away, a user’s friends are most likely to be of a similar age and come from the same country.

In our studies, performed earlier this year, we examined all 721 million active Facebook users (more than 10% of the global population), with 69 billion friendships among them. To date, these are the largest social network studies ever released.

How many friends?
An important basic view of any social network is the cumulative degree distribution, which shows the percentage of individuals that have less than a given number of friends. As you can see above, only 10% of people have less than 10 friends, 20% have less than 25 friends, while 50% (the median) have over 100 friends. Meanwhile, because the distribution is highly skewed, the average friend count is 190. An important finding from our study, however, is that the distribution is not nearly as skewed as earlier studies of social networks have suggested.


At first glance, the median friend count on Facebook — 100 — may seem surprisingly low; a quick survey of my own friends reveals that they almost all have more than 100 friends. But no, your friends are not atypically social – a classic paradox regarding social networks dictates that, for most people, the median friend count of their friends is higher than their own friend count. On Facebook, that’s the case for 84% of our users. Why? Scott Feld wrote about this phenomenon in his 1991 paper Why Your Friends Have More Friends than You Do, showing that the same phenomenon dictates that college students typically find that their classes to be larger than the average class size, and that when sitting on an airplane, it will typically be more crowded than the average occupancy. These effects all arise because for people, classes, and flights to be popular, you must be much more likely to choose them. So you shouldn’t feel bad if it seems like all your friends are more popular than you: it appears this way to most of us.

Four degrees of separation.
The idea of ‘six degrees of separation’ -- that any two people are on average separated by no more than six intermediate connections -- was first proposed in 1929 in a short story by Hungarian author Frigyes Karinthy, and made popular by the John Guare play and movie,Six Degrees of Separation. The idea was first put to the test by Stanley Milgram in the 1960’s. Milgram selected 296 volunteers and asked them to dispatch a message to a specific individual, a stockholder living in the Boston suburb of Sharon, Massachusetts. The volunteers were told that they couldn’t send the message directly to the target person (unless the sender knew them personally), but that they should route the message to a personal acquaintance that was more likely than the sender to know the target person. Milgram found that the average number of intermediate persons in these chains was 5.2 (representing about 6 hops). The experiment showed that not only are there few degrees of separation between any two people, but that individuals can successfully navigate these short paths, even though they have no way of seeing the entire network.

While we will never know if it was true in 1929, the scale and international reach of Facebook allows us to finally perform this study on a global scale. Using state-of-the-art algorithms developed at the Laboratory for Web Algorithmics of the Università degli Studi di Milano, we were able to approximate the number of hops between all pairs of individuals on Facebook. We found that six degrees actually overstates the number of links between typical pairs of users: While 99.6% of all pairs of users are connected by paths with 5 degrees (6 hops), 92% are connected by only four degrees (5 hops). And as Facebook has grown over the years, representing an ever larger fraction of the global population, it has become steadily more connected. The average distance in 2008 was 5.28 hops, while now it is 4.74.

Thus, when considering even the most distant Facebook user in the Siberian tundra or the Peruvian rainforest, a friend of your friend probably knows a friend of their friend. When we limit our analysis to a single country, be it the US, Sweden, Italy, or any other, we find that the world gets even smaller, and most pairs of people are only separated by 3 degrees (4 hops). It is important to note that while Milgram was motivated by the same question (how many individuals separate any two people), these numbers are not directly comparable; his subjects only had limited knowledge of the social network, while we have a nearly complete representation of the entire thing. Our measurements essentially describe the shortest possible routes that his subjects could have found.

Your friends and you.
It’s easy for me to imagine that a path from me to a random person in Siberia goes first to one of my few Russian friends in California, and then hops around the globe to a friend of theirs living in Russia. But, while I can imagine these short paths connecting all pairs of people in the world, this notion stands in sharp contrast to my day-to-day experience. Most of my friends live in the US, and the ones I am closest to live within just a few miles of me.

This is what makes social networks somewhat unique: they are both well-connected in the sense that you can reach anyone from anyone else in a relatively short number of hops, but at the same time, they are very locally clustered, with the vast majority of connections spanning a short distance. In our study, we found that 84% of all connections are between users in the same country. But this isn’t the only dimension along which people tend to cluster. We also find that people tend to have a similar, albeit typically smaller, number of friends as their neighbors, and tend to be about the same age. Somewhat surprisingly, even for individuals aged 60, the distribution of their friends’ ages is sharply peaked at exactly 60.



Conclusions
To facilitate open access within the scientific community, the two works are available for download:

J. Ugander, B. Karrer, L. Backstrom, C. Marlow.
The Anatomy of the Facebook Social Graph,
http://arxiv.org/abs/1111.4503

L. Backstrom, P. Boldi, M. Rosa, J. Ugander, S. Vigna.
Four Degrees of Separation,
http://arxiv.org/abs/1111.4570

In these two works, we show how the Facebook social network is at once both global and local. It connects people who are far apart, but also has the dense local structure we see in small communities. We show that, as Facebook has grown over the years, representing an ever larger fraction of the global population, it has become even more connected. In the years to come, we look forward to continuing to illuminate social trends and helping people understand how the world is becoming more connected.

Facebook

sábado, 5 de abril de 2014

ARS 101: Conversando con Mark Granovetter

Conversando con Mark Granovetter

Utilizando algunas de las sugerencias del último postPilar Opazo entrevista a Mark Granovetter en NYC.

Introducción: Mark Granovetter es un líder en la investigación y la teoría en Sociología Económica y Redes Sociales. Él es quizás mejor conocido por sus artículos de gran influencia, "The Strength of Weak Ties [La fuerza de los lazos débiles]" y "Economic Action and Social Structure: The Problem of Embeddedness. [Acción Económica y Estructura Social:. El problema del arraigo]". Los conceptos de arraigo y la fuerza de los lazos débiles han sido ampliamente adoptados, creando nuevas áreas de investigación. En este momento el profesor Granovetter es un miembro del cuerpo docente en el Departamento de Sociología de la Universidad de Stanford.

1. La fortaleza de los lazos débiles

En su contribución de 1973 la definición de "la fuerza de un lazo" es la siguiente: "la fuerza de un lazo es una combinación (probablemente lineal) de la cantidad de tiempo, la intensidad emocional, la intimidad (confianza mutua), y el servicios recíprocos que caracterizan al enlace. Queríamos preguntarle, ¿hizo esta definición deliberadamente ambigua para permitir el surgimiento de diferentes medidas que se podrían probar, validar y desafiar a su teoría? ¿Usted sabe sobre estudios empíricos que las hayan explorado? ¿Puede su noción de "fuerza de los lazos" abrazar niveles de diferencia de análisis (individuos, grupos sociales, organizaciones, industrias, etc)?




2. Inserción o Embeddedness

-       Durante la década de 1980, la "nueva sociología económica" surgió en oposición a la disciplina de la economía y como un nuevo subcampo de estudio que tenía que justificarse a sí misma . Durante su visita, Viviana Zelizer reafirmó esta visión señalando que el foco inicial de la sociología económica en modelos cuantitativos, los mercados y las empresas, seguido o derivado de un intento de criticar e incluso convencer a los economistas de la inexactitud de sus teorías y suposiciones. Su trabajo en "arraigo" [embeddedness] en 1985 sugiere que la actividad económica no sólo comprenden los individuos aislados , sino también las interconexiones entre esos individuos... Hoy en día, la situación parece ser diferente, la sociología económica ya se ha ganado la consolidación como un subcampo y existe amplia evidencia no sólo desde la sociología, sino también de la antropología, la historia y las ciencias sociales en general, que apoya la importancia de las relaciones sociales en la comprensión de la actividad económica. En esta línea, ¿cree que sigue siendo importante para la economía de dirección? ¿Diría usted que un espacio fructífero de la colaboración y el diálogo que se ha generado con los economistas?
-          Al situarse en oposición a la economía, el subcampo de la sociología económica parece haber perdido la conexión con las teorías sociológicas clásicas que intentaron entender los procesos sociales más amplios, como la racionalización, diferenciación, integración/orden, etc. En su lugar, la "nueva sociología económica" está centrada en revelar los mecanismos sociales que son realmente en juego en la economía, junto con el examen de las formas específicas de coordinación, como los mercados o las empresas. En primer lugar, ¿comparte este punto de vista? Y en segundo lugar, de qué manera cree usted que la "nueva sociología económica" tiene el potencial de arrojar luz en cuestiones sociológicas más generales?






3. Últimos trabajos y nuevas redes

En su trabajo más tarde usted se ha involucrado con el tema de la innovación y las nuevas empresas de Silicon Valley. Al mismo tiempo, las nuevas nociones de redes habían tenido influencia en la teoría sociológica, como la teoría del actor-red de Callon y Latour y "Nueva Ciencia de las Redes" de Duncan Watt. ¿Cómo son estos nuevos enfoques informando a su trabajo posterior?




4. Enseñando sociología económica

En su opinión, ¿cuáles son el conjunto de teorías, conceptos y técnicas con las que cada estudiante de sociología económica debe estar equipado?



Estudios de la Economía

jueves, 3 de abril de 2014

Anatomía estructural de la red Tumblr

La anatomía de una red social olvidada
Mientras que los científicos de la red se han estudiando detenidamente los datos de Twitter y Facebook, se han olvidado de Tumblr. Ahora que han comenzado a preguntar cómo esta red se diferencia del resto.



El estudio de las redes sociales se ha apoderado de los informáticos en los últimos años. En particular, los investigadores se han centrado en algunas de las más grandes redes que han hecho de sus datos disponibles, como algunas redes de telefonía móvil, Wikipedia y Twitter.

Pero con las prisas, una red ha sido más o menos ignorado por los investigadores: Tumblr, una plataforma de microblogging similar a Twitter. Por lo tanto una cuestión interesante es cómo la red asociada con Tumblr es diferente de la red Twitter.

Hoy se recibe una respuesta, gracias al trabajo de Yi Chang y sus amigos en Yahoo Labs en Sunnyvale. Estos chicos señalan que se sabe relativamente poco sobre Tumblr comparación con otras redes como Twitter y se dispuso a cambiar esta situación.

Las estadísticas básicas son sencillas. Tumblr es un servicio de microblogueo con cerca de 160 millones de usuarios que juntos han publicado más de 70 mil millones puestos.

La diferencia más significativa entre Tumblr y su primo mayor, Twitter, es que no hay límite para el tamaño de los mensajes que los usuarios pueden crear. Por el contrario, Twitter impone el famoso límite de 140 caracteres en todos sus mensajes. Tumblr también es compatible con los mensajes multimedia, como imágenes, audio y video.

Otra diferencia importante es que Tumblr no requiere que los usuarios ingresar su información básica de perfil, como el género o ubicación. Así que esto hace que el análisis un poco más complicado de lo que es con otras redes que recogen esta información. Sin embargo, Chang y sus colegas dicen que los usuarios de Tumblr tienden a ser mucho más joven que la gente en otras redes, con la mayoría de los usuarios son menores de 25.

Chang y coautor del estudio, la naturaleza de Tumblr usando un subconjunto de casi 600 millones de mensajes publicados en la red entre agosto y septiembre del año pasado. Ellos dicen que más del 90 por ciento de estos mensajes implican fotos o texto. A pesar de apoyar a otros tipos de medios de comunicación, éstos han claramente no ha llegado a ser popular en Tumblr.

Una pregunta interesante es si Tumblr se asemeja más a una red blogosfera que una red de microblogging como la de Twitter.

Hay diferencias significativas entre estos tipos de red. Una característica clave de Twitter es que hay una buena cantidad de reciprocidad entre los usuarios. La reciprocidad es la probabilidad de que si el usuario sigue un usuario b, entonces b también sigue a.

En la blogosfera, la reciprocidad es casi inexistente. Sólo el 3 por ciento de los bloggers tienen este tipo de enlace recíproco. En Twitter, sin embargo, la proporción es mucho mayor : un 22 por ciento de los altavoces de agudos tienen vínculos recíprocos.

En este sentido, Tumblr es aún más densa que Twitter, con casi el 30 por ciento de las conexiones de ser correspondido. Lo que es más, la distancia media entre dos usuarios de Tumblr es de 4,7, es decir un usuario puede conectarse a otro en un promedio de 4,7 pasos. Eso es la mitad de la distancia de la blogosfera y casi lo mismo que las distancias en Facebook y Twitter.

¿Por cuánto tiempo son puestos en Tumblr, dado que no hay límite de longitud ? El cargo promedio es de 427 caracteres de longitud y una cuarta parte de ellos son más de 140 límite de caracteres de Twitter. Por el contrario, la duración media de un tweet se encuentra a sólo 68 caracteres.

Finalmente, Chang y sus colegas dicen que el contenido tiende a ser vuelto a publicar con mayor rapidez en Tumblr. "Aproximadamente 3/4 de los primeros reblogs ocurren dentro de la primera hora y 95,84 por ciento aparecen en un solo día ", dicen. Por el contrario, en twitter alrededor de la mitad de retweeting se produce dentro de una hora y 75 por ciento en un día, dicen. " Tumblr es más vibrante y más rápido", dicen los investigadores de Yahoo.

Este trabajo proporciona una visión útil de Tumblr, ya que fue a finales de 2013. Como tal, se permitirá a los investigadores a entender cómo la red consiste en el futuro.

Eso será importante para Yahoo. Es importante tener en cuenta que en mayo de 2013, que pagó más de $ 1 mil millones para Tumblr. Así que no es en absoluto sorprendente que quieren entender lo que han comprado.

Lo que es un poco más desconcertante, sin embargo, es que han esperado hasta ahora para averiguar.

Ref : arxiv.org/abs/1403.5206 : ¿Qué es Tumblr?: un panorama estadístico y comparativo

miércoles, 2 de abril de 2014

Usando Gephi para analizar centralidad geográfica

Juguemos con Gephi: Comprendiendo centralidad de grado, de grado ponderado e intermediación
Matthieu Totet - Koumin

Hola a todos,

Hoy voy a tratar de explicar algunas noción clásica cuando usted está buscando en su gráfico. El Grado y Licenciatura ponderado son bastante simples de entender y es casi la base del análisis gráfico. Centralidad betweeness pedir un poco de enfoque mente para entender, pero cuando explique con un ejemplo expresivo, es sencillo !

El conjunto de datos

Me quedo con la relación de los países por las fronteras. Es muy simple y concreto para entender, cambia de la Tradicional « Redes sociales » y el conjunto de datos es lo suficientemente diferentes para ver con claridad el concepto que queremos estudiar.

Por supuesto, los animo y propongo a utilizar el archivo gexf para hacerlo y explorar por ustedes mismos [Archivo Gexf]

Aquí está la cartografía con sólo un poco de visualización de diseño. No tocamos sin embargo, el tamaño de los nodos.



 Grado : Graduame soy famoso.

 

El grado de un nodo es el número de relación (enlace) que tiene, de forma independiente si es una en o una relación fuera. Es la suma de bordes para un nodo. Es idea muy simple de entender.

No tenemos un grado de entrada y grado de salida en nuestro gráfico, es porque tenemos un grafo no dirigido. Estas estadísticas son exactamente los mismos que el Grado, pero « In» contar sólo enlaces entrantes y « Out» cuenta sólo los enlaces salientes.

Para mostrar el tamaño del nodo por grado : Ranking >> Nodos >> Elige un rango de parámetros Grado y haz clic en " Aplicar »


¿Qué quiere decir aquí?


Una relación (borde ) es una frontera entre los 2 países, por lo que si un país tiene un alto grado, que significa que tiene una gran cantidad de países vecinos.

En la cartografía anterior, vemos que Rusia y China son muy grandes, es porque tienen una gran cantidad de países vecinos, 14 para ser exactos.

Grado ponderado: Más grande es mejor


El grado ponderado de un nodo es como el título. Se basa en el número de enlaces para un nodo, pero ponderado por el peso de cada enlace. Se está haciendo la suma del peso de los enlaces.
Por ejemplo, un nodo con 4 bordes que el peso 1 (1 +1 +1 +1= 4) es equivalente a :

  • un nodo con bordes 2 que el peso 2 (2 +2= 4) o
  • un nodo con bordes 2 que el peso 1 y 1 borde que el peso 2 (1 +1 +2= 4) o
  • un nodo con 1 punta que peso 4 etc...

El grado ponderado tiene que ser calculado antes, ir a Estadísticas >> Media. Grado ponderado >> Ejecutar. Después de un tiempo rápido, tendrá el resultado de cálculo y usted será capaz de hacer Clasificacion >> Nodos >> Elija un rango de parámetros Grado >> Grado ponderado y haga clic en « Aplicar »


¿Qué quiere decir aquí?

Usted puede haber notado que algunos bordes son más grandes que otros, es porque en los datos recogidos, el peso del borde representa la longitud de la frontera en kilómetros. Así el grado ponderada aquí es equivalente al número total de kilómetros de frontera para un país.

Aquí, de nuevo a Rusia y China son grandes porque tienen grandes fronteras. Pero si se compara con la cartografía anterior, verá que todos los países europeos eran grandes antes, pero ahora es muy poco. Es porque esos países gozan muy pequeñas fronteras.

Centralidad de intermediación: Maestro de Marionetas

Para visualizar el concepto, se toma todo el camino más corto de todos los nodos a todos los nodos en el gráfico. En cada ruta, si un nodo está recorrida, agrega él « un punto ». Cuando se llevan a cabo todos los caminos, tiene un ranking donde algunos nodos se viajaba mucho y algunos pocos ( casi nunca). Esto describe la centralidad betweeness, si un nodo tiene un número alto, tiene una alta centralidad de intermediación.

Si está navegando en el gráfico, lo más probable viajado nodos que tienen un alto betweeness. Y si se quita tesis nodos primero, hay una alta probabilidad de reducir su gráfico en múltiples componentes conectados.

La centralidad betweeness tiene que ser calculado antes, ir a Estadísticas >> Diámetro Red >> Ejecutar. Después de un tiempo rápido, tendrá el resultado de cálculo y usted será capaz de hacer Clasificacion >> Nodos >> Elija un rango de parámetros Grado >> betweeness Centralidad y haga clic en « Aplicar »


¿Qué quiere decir aquí?

La centralidad de intermediación aquí significa que, si quieres ir de un país a otro, lo más probable es que tenga que viajar a través de los grandes nodos. Lo que se ve es que hay un conjunto de países que son muy «centrales», ya que se están ligando (indirectamente ) a casi todos los países del mundo.

Y si nos fijamos en el caso de Francia, que tiene la mayor centralidad de intermediación. ¿Por qué? Es principalmente debido al hecho de que es el único país que está haciendo el enlace entre América y resto del mundo.


¡Aquí está! Espero haber sido claro en mi explicación y te ha gustado este tutorial.

martes, 1 de abril de 2014

Redes de flujos de inmigración mundial

¿Cuántas personas han migrado todo el mundo en los últimos 24 años?
GEOFFREY GILLER, Scientific American


La gente está constantemente migrando todo el mundo. Pero los científicos han tenido durante mucho tiempo problemas para cuantificar cuántas personas se están moviendo y donde están viniendo y yendo a.

Parte del problema es que los países varían ampliamente en la cantidad y calidad de los datos que recogen a los inmigrantes que ha recibido, a nivel mundial, estos datos son a menudo difíciles de comparar directamente.

Un informe del año pasado por las Naciones Unidas con el fin de solucionar ese problema mediante la combinación de todos los datos disponibles sobre las poblaciones de inmigrantes en un amplio conjunto de datos, armonizado.

Ahora, un nuevo estudio acaba de ser publicado en la revista Science ha tomado ese conjunto de datos y se ha ido un paso más allá mediante la generación de más datos y visualizar el flujo mundial de personas de una manera nueva.

El conjunto de datos de las Naciones Unidas incluyó información para los años 1990, 2000 y 2010. Sin embargo, los autores del nuevo estudio querían ver cómo la migración mundial cambió en escalas de tiempo más finos. El uso de técnicas similares a las de la ONU utilizarse para rellenar las lagunas de datos, los investigadores generaron datos para 1995 y 2005, así, dándoles cuatro períodos de cinco años.


Imagen cortesía de Abel et al., Science / AAAS

La trama circular de los flujos migratorios entre y dentro de las regiones del mundo durante el año 2005 y 2010. Las marcas de graduación muestran el número de migrantes (entradas y salidas) en millones. Sólo flujos que contiene al menos 170.000 inmigrantes se muestran

El nuevo conjunto de datos reveló algunos patrones esperados y algunos sorprendentes, dice Nikola Sander, un investigador en el Centro de Wittgenstein de Demografía y Global Human Capital en Viena y un co- autor del nuevo estudio. "Lo que vemos es que los eventos repentinos de ejemplo, la caída de la Cortina de Hierro en la década de los noventa, los conflictos violentos en Ruanda y en Afganistán en la década de los noventa... provocaron un gran número de movimientos", dice ella.
Sin embargo, los datos no muestran un aumento general en el número o el porcentaje de inmigrantes en todo el mundo, a pesar de la idea generalizada de que la inmigración se ha ido incrementando en los últimos 20 años.

Sander también quiso mostrar estos nuevos datos de una manera que sea fácil de entender y comprender. "La visualización típica de datos de flujo ha sido un mapa del mundo y después de diez o 15 flechas negras impresas en la parte superior de la misma," dice ella. "Tiene un atractivo visual muy bajo, y sólo puede ir a un cierto nivel de complejidad."

Frustrado, se dio cuenta de que tenía que tomar ideas de visualización de datos de " fuera de la disciplina", como ella dice, para representar mejor los resultados.

Mientras que la búsqueda en línea se encontró con Circos, una herramienta de software que utiliza un diseño circular para visualizar diferentes tipos de datos, como los genomas y las mutaciones del cáncer. Sander dio cuenta de que una parcela similar también mostraría las complejidades de los datos de migración.

Ella publicó el gráfico de arriba en el papel de la ciencia y se asoció con otra empresa, Null2, para codificar una versión interactiva, a continuación.





Sander espera continuar analizando los datos. "Esto es sólo el primer conjunto de estimaciones" del movimiento mundial de personas que se derivan del conjunto de datos de las Naciones Unidas, dice ella. Ella espera que otros se unan en el esfuerzo por mejorar las estimaciones, así, ella y su co -autor de Guy J. Abel publicamos el código que utilizan para generar los conjuntos de datos de 1995 y 2005.

Como las lagunas en los datos de la ONU se llenan y métodos de armonización de los datos mejoran, Sander dice, las estimaciones serán cada vez más precisa.

Business Insider