jueves, 31 de octubre de 2013

Redes sociales y poder político

Las redes sociales como quinto poder...

¿Es para tanto? ¿Vos que opinás?

miércoles, 30 de octubre de 2013

ARS 101: Cohesión estructural

Cohesion estructural


Cohesión estructural es la concepción sociológica [1] [2] de una definición formal útil y medida de la cohesión en los grupos sociales. Se define como el número mínimo de los actores en una red social que necesitan ser removidos de desconectar el grupo. Por tanto, es idéntica a la cuestión de la conectividad de nodo de un grafo dado. La versión de corte vértice del teorema de Menger también demuestra que el número de desconexión es equivalente a un grupo de tamaño máximo con una red en la que cada par de personas tiene al menos este número de caminos separados entre ellos. También es útil saber que los grafos k-cohesivos (o k-componentes) son siempre un subgrafos de un k-núcleo, a pesar de un k-núcleo no siempre es k-cohesiva. Un k-núcleo es simplemente un subgrafo en el que todos los nodos tienen por lo menos k vecinos pero no necesitan siquiera estar conectados entre si. Los límites de la estructura endogámica en un grupo de parentesco son un caso especial de la cohesión estructural.

Ejemplos

Algunos ejemplos ilustrativos se presentan en la galería a continuación:




El anillo de 6 nodos en el grafo tiene conectividad 2 o un nivel 2 de la cohesión estructural porque se necesita la eliminación de dos nodos para desconectarlo.



El componente de 6 nodos (1 conectado) tiene incrustado un 2-componente, los nodos 1-5


Una camarilla o clique de 6 nodos se encuentra a 5-componente, de cohesión estructural 5

Referencias


  1. Moody, James; White, Douglas (2003).  "Structural Cohesion and Embeddedness: A Hierarchical Concept of Social Groups." (PDF). American Sociological Review 68 (1): 1–25. Consultado el 2006-08-19.
  2. White, Douglas, Frank Harary (2001). "The Cohesiveness of Blocks in Social Networks: Node Connectivity and Conditional Density." (libro). Sociological Methodology 2001 (Blackwell Publishers, Inc., Boston, USA and Oxford, UK.) 31 (1): 305–359.doi:10.1111/0081-1750.00098. Consultado el 2012-08-13.


Wikipedia

martes, 29 de octubre de 2013

Que revela nuestra red de Facebook de nuestra vida amorosa

Lo que tu lista de amigos de Facebook revela acerca de su vida amorosa
Por Leo Mirani - Quartz




Facebook puede aislar a su cónyuge o pareja sobre la base de su red de amigos. En un artículo fascinante que se publicará el año que viene, el científico social de Facebook Lars Backstrom y el profesor Jon Kleinberg de la Universidad Cornell revelan cuánto conocimiento se puede extraer de la estructura de una red, lo que demuestra tanto el valor de lo que el establishment de la seguridad estadounidense trata de tranquilizarnos diciéndonos que "sólo son metadatos" y revelando la configuración de privacidad de Facebook barrocas como las prendas basadas en la fe de la ropa nueva del emperador.

He aquí cómo funciona: Backstrom y Kleinberg recogieron una muestra aleatoria de alrededor de 1,3 millones de usuarios de Facebook con la lista de su cónyuge o algún tipo de relación de pareja en sus perfiles. Eso les dio un conjunto de datos con unos 8600 millones enlaces que contienen 379 millones de nodos, o puntos donde los vínculos se superponen. El modo de larga data de la encuesta sobre la estructura de una red es la noción de "arraigo", o la medición de la fuerza con dos personas están conectadas por el número de amigos que tienen en común. En esa medida, su amigo más cercano puede llegar a ser un amigo de la universidad.

Los autores utilizaron un nuevo método para encontrar conexiones más importantes. Ellos propusieron la medida de "dispersión." En lugar de buscar únicamente en la fuerza de las conexiones, la dispersión mira cómo otros puntos en una red se superponen con círculos discretos. En la ilustración de arriba, los amigos hacia la parte superior y la parte superior derecha estarían altamente integrados. Pero el único nodo en el centro de la parte inferior izquierda del diagrama está más conectado con un círculo más amplio de amigos . Es una idea elegante y muy intuitiva: Su cónyuge no puede ser tan gruesa con sus amigos del trabajo o de la escuela, pero es probable que se solape con muchos más grupos separados. El análisis de una red para la dispersión produce resultados dos veces más precisas sobre el arraigo en la búsqueda de pareja romántica de un usuario determinado, encuentra el documento.

Los autores también encuentran algo de verdad en lo que podría parecer evidente: Una relación romántica que muestra altos niveles de dispersión es más probable que persista. En otras palabras, las personas que introducen a sus parejas a toda clase de amigos tienden a permanecer juntos. Backstrom y Kleinberg miraron un subconjunto de 400 mil usuarios que dicen estar "en una relación" y encontraron que los que en gran medida los niveles de dispersión fueron significativamente menos probabilidades de haber cambiado su estado a "solo" 60 días más tarde.

Las cosas se vuelven un poco más complicadas cuando los autores no lo sabe ya si un usuario está en una relación. Sin embargo, el análisis de una muestra aleatoria de 129 mil usuarios, casi la mitad de los cuales eran solteros, predijo con exactitud si una persona estaba en una relación del 60% del tiempo. Lo que se eleva al 68 % si se consideran también los factores demográficos.

¿Qué significa para los usuarios de Facebook? Al averiguar quién es más importante para usted, Facebook puede producir un mejor "servicio de noticias." Más relevante, pero no es sólo Facebook el que pueden utilizar esta información. Aunque la configuración de privacidad se volvió a dispararse por "opacos", muchas de las aplicaciones que se conectan a su cuenta tiene acceso a tu lista de amigos. En efecto, los mismos efectos se pueden acceder fuera de Facebook, por ejemplo, de la libreta de teléfonos inteligente, a la que la mayoría de aplicaciones de solicitud de acceso. Como escriben los autores, "los aspectos cruciales de nuestra vida cotidiana pueden ser codificados en la estructura de red entre nuestros amigos, siempre y cuando mire esta estructura bajo la lente correcta." En otras palabras, sólo el pertenecer a una red revela tanto como lo que puede contarle.

“Romantic Partnerships and Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook” will be presented at the 17th conference on Computer Supported Cooperative Work and Social Computing in Baltimore, Feb 15-19, 2014.

lunes, 28 de octubre de 2013

Las elecciones por Twitter en Argentina

Elecciones 2013 en Twitter: el termómetro en vivo de los candidatos

Los candidatos jugaron sus últimas cartas también en el mundo virtual

Para conocer la resonancia que tuvo la campaña en las redes sociales, LA NACION monitoreó desde las 16.30 en tiempo real todo lo que sucedió en Twitter en torno a los principales candidatos, que jugaron sus últimas cartas también en el mundo virtual antes de las elecciones del 27 de octubre.

CONTADOR DE TUITS Y BUZZ VOLUME

El contador muestra en tiempo real los tuits totales referidos a las cuentas de los principales candidatos a senadores y diputados por la Capital. Por su parte, el gráfico muestra la evolución de tuits, retuits y menciones de esas cuentas.



TOP TUITS

Ranking en tiempo real que muestra los 5 tuits más retuiteados de las últimas 3 horas. Las cuentas integradas a esta aplicación son @gabimichetti, @sergiobergman, @stolbizer, @elisacarrio, @filmusdaniel, @minsaurralde, @juancabandie, @denarvaez, @sergiomassa, @FernandoSolanas, @geronimovenegas, @lozano_claudio, @claubonara, @itaihagman, @altamirajorge y @nestorpitrola

VS.

Comparación de la actividad en Twitter en torno a las cuentas de @minsaurralde y @sergiomassa. Se incluyen las menciones, tuits y retuits de ambos candidatos.

RANKING

Las cuentas de los principales candidatos en Capital, ordenadas en función de la cantidad de menciones registradas en Twitter.

viernes, 25 de octubre de 2013

ARS 101: Clique

Clique


El grafo completo K5. En un subgrafo como éste,
los vértices forman un clique de tamaño 5.
En teoría de grafos, un clique en un grafo no dirigido G es un conjunto de vértices V tal que para todo par de vértices de V, existe una arista que las conecta. En otras palabras, un clique es un subgrafo en que cada vértice está conectado a cada otro vértice del grafo. Esto equivale a decir que el subgrafo inducido por V es un grafo completo. El tamaño de un clique es el número de vértices que contiene.

El Problema del clique, que consiste en dado un grafo, decidir si existe en él un clique con un tamaño particular, es NP-completo.

Lo opuesto de un clique es un conjunto independiente, en el sentido que cada clique corresponde a un conjunto independiente del grafo complemento.
Los nodos 1,2 y 5 forman un clique


Origen del nombre

El término proviene de la palabra inglesa clique, que define a un grupo de personas que comparten intereses en común. En esta analogía, las personas serían los vértices; las relaciones de interés, las aristas; y el hecho de que todas compartan un mismo interés, el grafo completo, es decir, el clique en si.

Referencias

El término "clique" en Wolfram MathWorld

jueves, 24 de octubre de 2013

ARS 101: Centralidad de PageRank

PageRank


Google ordena los resultados de la búsqueda utilizando su propio algoritmo PageRank. A cada página web se le asigna un número en función del número de enlaces de otras páginas que la apuntan, el valor de esas páginas y otros criterios no públicos.

PageRank es una marca registrada y patentada1 por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de GoogleLarry Page (apellido, del cual, recibe el nombre este algoritmo) y Sergey Brin, en la Universidad de Stanford.
PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas "importantes", es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas "importantes". Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.

Algoritmo

El algoritmo inicial del PageRank lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google: “The Anatomy of a Large-Scale Hypertextual Web Search Engine":2

{\rm PR}(A) = (1-d) + d  \sum_{i=1}^n {{\rm PR}(i) \over C(i)}
Donde:
  • {\rm PR}(A) es el PageRank de la página A.
  • d es un factor de amortiguación que tiene un valor entre 0 y 1.
  • {\rm PR}(i) son los valores de PageRank que tienen cada una de las páginas i que enlazan a A.
  • C(i) es el número total de enlaces salientes de la página i (sean o no hacia A).
Algunos expertos aseguran que el valor de la variable d suele ser 0,85.3 Representa la probabilidad de que un navegante continúe pulsando links al navegar por Internet en vez de escribir una url directamente en la barra de direcciones o pulsar uno de sus marcadores y es un valor establecido por Google. Por lo tanto, la probabilidad de que el usuario deje de pulsar links y navegue directamente a otra web aleatoria es 1-d.4 La introducción del factor de amortiguación en la fórmula resta algo de peso a todas las páginas de Internet y consigue que las páginas que no tienen enlaces a ninguna otra página no salgan especialmente beneficiadas. Si un usuario aterriza en una página sin enlaces, lo que hará será navegar a cualquier otra página aleatoriamente, lo que equivale a suponer que una página sin enlaces salientes tiene enlaces a todas las páginas de Internet.
La calidad de la pagina y el numero de posiciones que ascienda se determina por una "votación" entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página. Un hiperenlace a una página cuenta como un voto de apoyo. El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan. Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto. Si no hay enlaces a una página web, no hay apoyo a esa página específica. El PageRank de la barra de Google va de 0 a 10. Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación, 1 es la calificación mínima que recibe un sitio normal, y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank. Parece ser una escala logarítmica. Los detalles exactos de esta escala son desconocidos.
Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg, es el algoritmo HITS.

Manipulación

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han diseñado métodos para manipular artificialmente el PageRank de una página. Entre estos métodos hay que destacar el spam, consistente en añadir enlaces a una cierta página web en lugares como blogs, libros de visitas, foros de Internet, etc. con la intención de incrementar el número de enlaces que apuntan a la página.
A principios del 2005 Google implementó un nuevo atributo para hiperenlaces rel="nofollow" como un intento de luchar contra el spam. De esta forma cuando se calcula el peso de una página, no se tienen en cuenta los links que tengan este atributo.

Antecedentes

PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto para la Información Científica (ISI) en los Estados Unidos durante la década del 50. El SCI pretende resolver la asignación objetiva de méritos científicos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos científicos) es más alto, colaboran en mayor medida con el desarrollo de su área de investigación. El índice de citación es un elemento determinante para seleccionar qué investigadores reciben becas y recursos de investigación.

Bibliografía

Notas al pie de página

Enlaces externos


Wikipedia

martes, 22 de octubre de 2013

Un mapeo de documentos indexados en Scopus

Scopus Maps


The base map of aggregated citation relations among 19,600 journals in Scopus during 2012 is as follows:



Figure 1: Base map of aggregated citation relations among 19,600 journals included in Scopus 2012; colors correspond to 27 communities distinguished by VOSviewer; This map can be web-started at http://www.Vosviewer.com/Vosviewer.php?map=http://www.leydesdorff.net/scopus12/basemap.txt


One can generate an overlay for any set downloaded from Scopus as follows:


· Search in Scopus (advanced or basic); for example, using the search string ‘TITLE(“humanities computing”) OR TITLE(“computational humanities”) OR TITLE(“digital humanities”) OR TITLE(“ehumanities”) OR TITLE(“e-humanities”)’ provided 114 documents on October 8, 2013;

· Make a possible selection of records among the retrieved documents or tick “All”;

· Click on “Export”;

· Among the output formats, choose the “RIS format (Reference Manager, Procite, Endnote)” and “Specify fields to be exported”;

· Only “Source titles” should be exported; untick all other fields;

· Click on “Export”: the file “scopus.ris” can be saved; for example, for the 114 records mentioned;

· Save the file “scopus.ris” in the same folder as the routine overlay.exe and the file with the mapping information scopus.dbf (right-click for saving this file). One can paste different (e.g., sequential) output files of Scopus into a single file, but the routine expects an input file with the name “scopus.ris”.

· One can now run overlay.exe in that same folder; preferably from the C-prompt; (using the C-prompt, one obtains error messages);

· The file “overlay.txt” (e.g., ehum.txt) is a map file that can be opened in VOSviewer;

· Rao-Stirling diversity is stored in the file “rao.txt” and shown on the screen; overlay.dbf contains the information such as the number of publications in each journal.



The resulting overlay map reads as follows:


Figure 2: Overlay of 114 documents with the search string ‘TITLE(“humanities computing”) OR TITLE(“computational humanities”) OR TITLE(“digital humanities”) OR TITLE(“ehumanities”) OR TITLE(“e-humanities”)’ in Scopus; Rao-Stirling diversity = 0.1244. This map can be web-started at http://www.Vosviewer.com/Vosviewer.php?map=http://www.leydesdorff.net/scopus12/ehum.txt&label_size=1.35


See for more explanation: Loet Leydesdorff, Félix de Moya-Anegón, and Vicente P. Guerrero-Bote, “Journal Maps, Interactive Overlays, and the Measurement of Interdisciplinarity on the basis of Scopus data” (in preparation).

lunes, 21 de octubre de 2013

Facebook enfrenta su punto de saturación


El desafío de Facebook: la red enfrenta la pérdida de usuarios

En EE.UU. y el Reino Unido, 11 millones habrían dejado la plataforma




Facebook podría estar dejando de gustarnos. Al menos eso surge de una fuerte polémica global en torno al número de usuarios de la plataforma, que llega a unos 1110 millones de personas en todo el mundo. El periódico inglés The Guardian, citando a la consultora Nielsen, dio la voz de alerta: entre Estados Unidos y el Reino Unido, la red social habría perdido 11 millones de seguidores (9 y 2, respectivamente). Ya en enero, la plataforma había mostrado una caída de 1,4 millones de "amigos" y algunos especialistas advirtieron que la creación de Mark Zuckerberg, que en la Argentina usan unos 20 millones de personas, podría haber llegado a su "punto de saturación".
La competencia de redes sociales segmentadas y de otras formas de comunicación instantánea, sumada a un posible agotamiento de la fórmula y al rechazo de muchos usuarios a la interfaz web tosca y recargada de la plataforma, podría estar restándole impulso.
A este panorama se suma un dato de Comscore, otra consultora global, que detectó una caída del 5% en la cantidad de minutos promedio por usuario. Aunque 11 millones en un universo de 1100 millones de usuarios únicos mensuales (665 millones de los cuales ingresan diariamente) no parece marcar aún una tendencia firme. En su defensa, Facebook exhibe exitosísimos números de penetración móvil: 751 millones de usuarios acceden a la red desde sus dispositivos móviles, un 54% más que hace un año. Para potenciar esa tendencia, la empresa lanzó Home, una aplicación móvil que desde el 12 de abril está disponible sólo para Estados Unidos. Según Facebook, unos 552 millones de usuarios usan la red tanto desde la PC como desde el móvil.
Los datos de la cantidad de usuarios desataron una fortísima polémica sobre el futuro de Facebook, tal vez el medio digital más exitoso en la corta historia de Internet, justo antes del anuncio de los resultados financieros trimestrales, que anteayer mostraron buenos números: una facturación de US$ 1458 millones con una ganancia de US$ 373 millones; es decir, un margen del 23%. Los ingresos de la empresa, que empezó a cotizar en el Nasdaq hace casi un año, también crecieron fuerte: 38% en un año.
Los números de usuarios de Facebook siempre han sido polémicos porque la misma red social es la fuente de esos datos, y las cifras alternativas que permiten contrastarlas son parciales o estimativas.
Según The Guardian, el número de visitantes únicos al sitio desde computadoras, teléfonos inteligentes y tabletas cayó de 153 millones en marzo de 2012 a 142 millones en marzo de este año, tras haber alcanzado un pico de 158 millones en agosto pasado. El amesetamiento de los gráficos de barras de cantidad de usuarios para mercados desarrollados en el informe financiero del propio Facebook parece darle la razón al diario inglés.
The Huffington Post, una de las principales referencias del periodismo digital, acusó al diario inglés de dar información falsa y omitir el crecimiento móvil que en Estados Unidos llevó el número de usuarios de 62 millones a 99 millones en un año, lo que podría estar reflejando "un cambio de la PC de escritorio al móvil", afirmó.
SocialBakers, una consultora que estima cantidad de usuarios, hizo una aclaración y cuestionó fuertemente a The Guardian, al que acusó de no comprender esos datos, que dejarían de estar disponibles para todo el público.
Podríamos encontrarnos ante un tema tabú: en enero pasado, el CEO, Jan Rezab, de esa misma consultora había señalado a The Wall Street Journal: "Facebook posiblemente esté llegando a un punto en el que la parte menos comprometida de su audiencia no esté visitando la plataforma todos los días del mes".
De todas formas, el problema de Facebook no es tanto perder usuarios como hacer que esos contactos se traduzcan en mayores ingresos, lo que podría ser más complejo si la mayor parte de ese público termina concentrándose en los mercados emergentes. Tal vez previendo ese fenómeno, la empresa está abriendo oficinas comerciales en varios de esos países, entre ellos la Argentina, donde el 65% de los 31,1 millones de usuarios de Internet tiene una cuenta activa en la red social.
Para Alejandro Zuzenberg, director de Facebook Argentina, el horizonte en estas tierras es promisorio: "Nos está yendo muy bien", dijo a LA NACION en febrero pasado.

EL CHAT SUPERÓ A LOS SMS

Por primera vez desde su nacimiento en 1992, el año pasado se enviaron más mensajes de chat de Whatsapp, Line, Google Talk o iMessage, que mensajes de texto desde celulares. Según la consultora Informa, en 2012, se enviaron diariamente 17.600 millones de SMS y 19.100 millones de mensajes de chat.
Además, los usuarios globales que adquieran un iPhone, que hasta ahora sólo pagaban un dólar para usar Whatsapp de por vida, deberán renovar esa suscripción cada año. Los que ya tenían esa app conservarán el beneficio. Para el resto de los dispositivos regiría el mismo esquema.

LOS NÚMEROS DEL FENÓMENO

  • 1110
    millones

    Según informó al mercado, ése es el número de usuarios que Facebook alcanzó en marzo
  • 11
    millones

    La cifra de usuarios que, según algunas fuentes, habría perdido en EE.UU. y el Reino Unido




sábado, 19 de octubre de 2013

Redes de 2 modos entre actores y películas de HBO

Programa de Reciclaje de Actores de HBO
(Gracias a Knepper Rich, de IU, quien me habló de esto ....)

Revise: este artículo sobre los actores que lo hacen bien en la maravillosa serie de HBO

Aparentemente HBO ama sus actores tanto, que muchos de ellos tienen papeles en varias de sus series ..... por ejemplo, Wendell Pierce, quien planea Antoine Baptiste, el ne-er-do-y trombonista mujeriego en Treme (fantástico espectáculo) también tuvo un papel principal en The Wire.



Complexity and Social Network Blog

viernes, 18 de octubre de 2013

Ciudades que fijan tendencias en Twitter

The Top Five Trend-Setting Cities on Twitter

Twitter data reveals the cities that set trends and those that follow. And the difference may be in the way air passengers carry information across the country, by-passing the Internet, say network scientists.




One of the defining properties of social networks is the ease with which information can spread across them. This flow leads to information avalanches in which videos or photographs or other content becomes viral across entire countries, continents and even the globe.

It’s easy to imagine that these trends are simply the result of the properties of the network. Indeed, there are plenty of studies that seem to show this.

But in recent years, researchers have become increasingly interested in the relationship between a network and the geography it is superimposed on. What role does geography play in the emergence and spread of trends? And which areas are trend setters and which are trend followers?

Today we get an answer of sorts thanks to the work of Emilio Ferrara and pals at Indiana University in Bloomington. These guys have examined the way trends emerge in cities across the US and how they spread to other cities and beyond.

Their research allows them to classify US cities as sources, those that lead the way in trends, or those that follow the trends which the team call sinks.

Their research also leads to a curious conclusion–that air travel plays a crucial role in the spread of information around the country This implies that trends spread from one part of the country to another not over the internet but via air passengers, just like diseases.

The method these guys use is straightforward. Twitter publishes a continuously updated list pf the the top ten most popular phrases or hashtags on its webpage. It also has webpages showing the trending topics for each of 63 US cities.

To capture the way these trends emerge and spread, Ferrra and co set up a web crawler to check each list every ten minutes between 12 April and 30 May 2013. In this way the collected over 11,000 different phrases and hashtags that became popular throughout these 50 days.

They then plotted the evolution of these trends in each US city over time. This allowed them to study how trends spread from one city to another and to look for clusters of cities in which the same topics trend together.

The results are revealing. They say most trends die away quickly–around 70 per cent of trends last only 20 minutes and only 0.3 per cent last more than a day.

Ferrara and co say they can see three distinct geographical regions that share similar trends–the East Coast, the Midwest and Southwest. It’s easy to imagine how trends arise at a low level and spread through the region through local links such as friends.

But these guys say there is also a fourth cluster of influential cities that also form a group where the emergence of trends is related. However, these place are not geographically related. They are metropolitan areas such as Los Angeles, New York, Atlanta, Chicago and so on.

What links these places is not geography but airports, say Ferrara and co. Their hypothesis is that topics trend in these places because of the influence of air passengers. In other words, trending topics spread just like diseases.

Ferrara and co have created a list of the cities that act as trend setters and those that act as trend followers.

The top five sources of trends are: Los Angeles, Cincinnati, Washington, Seattle and New York.

The top five trend followers (or sinks) are: Oklahoma City, Albuquerque, El Paso, Omaha and Kansas City.

That’s a fascinating result. In a sense it’s obvious that the large scale movement of people will influence the apread of information However, it’s not obvious that this should happen at a rate that is comparable to the spread of trends across the internet itself.

And it raises an interesting question that Ferrara and co hope to answer in future work. “Does information travel faster by airplane than over the Internet?” they ask.

We’ll be watching for when they reveal the answer.

Ref: arxiv.org/abs/1310.2671 : Traveling Trends: Social Butterflies or Frequent Fliers?

miércoles, 16 de octubre de 2013

Un análisis breve de una página de Facebook mediante ARS

Breve análisis de la página Facebook “Il Scritore” de Natalino Balasso

Il scritore Banner Facebook Page
El periodo navideño nos lleva a discutir cuestiones y experimentamos la herramienta más ligera en el cajón eran demasiados meses de espera. Uno de ellos es NetVizz que permite, entre otras cosas, analizar una página o grupo de Facebook desde la perspectiva del análisis de redes sociales.
La página que ha elegido no tiene nada que ver con los problemas del mundo digital, nuevas empresas o similar. La 'página de puro entretenimiento, la hija del genio de Natalino Balasso: actor, comediante y ahora incluso escritores famosos. "Los escritores famosos" es esencialmente una colección de poemas y reflexiones contadas por Natalino en su propio dialecto comprensible incluso fuera del Polesine, su tierra. 
Volviendo a la herramienta: NetVizz, muy simple y explica por sí mismo le permite descargar datos de los últimos 999 mensajes en una página o grupo de Facebook. Nodo se crea para cada puesto y para cada usuario (anónima) que comentó, compartir o expresar sus semejantes. Las relaciones (enlaces) se crean entre los usuarios y el contenido, sino también entre los mismos, siempre que un usuario expresa una como un comentario de otro usuario.
Los 89 examinados (3 fotos, 3 videos, 83 de estado) se comentaron sobre o recibidos de 5.455 usuarios diferentes. Después de los diez primeros en términos de como recibido (si lo hay yo he guardado los MAYÚSCULAS originales):
Il Scritore Top10 post
Los 89 posts (3 fotos, 3 videos, 83 de estado) se comentaron o recibieron de 5.455 usuarios diferentes. Después de los diez primeros en términos de Me Gusta recibidos. La siguiente figura muestra la red relacional de la página de "Los escritores famosos," el tamaño de los nodos es proporcional al número de gustos recibida, en la parte central de la gráfica son los usuarios que comentan en varios puestos, mientras que en el exterior, ya que se unen grupos de los comentaristas "únicos" (más de 50%).
Otra métrica está disponible en NetVizz es el compromiso "engagement" (suma aritmética de likes, comentarios y compartidos), un objetivo interesante a través del cual examinar el análisis del comportamiento del usuario. Como ya se ha observado más de un medio de interacción con el usuario entra en una sola vez, mientras que un tercio del ventilador interactúan de 2 a 5 veces.
Il Scritore User Engagement SNA
Se podría ir aún más lejos, cambiando el enfoque con el contenido de los mensajes y comentarios, el análisis de los problemas que han afectado a más de atención. Pero es mejor parar aquí, para evitar gravar la discusión y desviar la atención de la página de fans de "los famosos escritores" que tiene, básicamente, mantenerse fiel protagonista de este post de fin de año.
Disclaimer
Este blog está destinado a fines de investigación y estudio personal. Pediría la cortesía de cualquier imprecisión, me aseguraré de integrar y modificar el contenido de esta página.
Créditos, recursos on line

viernes, 11 de octubre de 2013

Los textos de Facebook definen personalidades y lenguajes

Scientists Used Facebook For The Largest Ever Study Of Language And Personality — And The Results Are Groundbreaking


A group of University of Pennsylvania researchers who analyzed Facebook status updates of 75,000 volunteers have found an entirely different way to analyze human personality, according to a new study published in PLOS One.

The volunteers completed a common personality questionnaire through a Facebook application and made their Facebook status updates available so that researchers could find linguistic patterns in their posts.

Drawing from more than 700 million words, phrases, and topics, the researchers built computer models that predicted the individuals’ age, gender, and their responses on the personality questionnaires with surprising accuracy.

The “open-vocabulary approach” of analyzing all words was shown to be equally predictive (and in some cases moreso) than traditional methods used by psychologists, such as self-reported surveys and questionnaires, that use a predetermined set of words to analyze.

Basically, it's big data meets psychology.

The Penn researchers also created word clouds that “provide an unprecedented window into the psychological world of people with a given trait,” graduate student Johannes Eichstaedt, who worked on the project, said in a press release. “Many things seem obvious after the fact and each item makes sense, but would you have thought of them all, or even most of them?”

Here are some personality traits (key at bottom):





PLOS One





The word clouds allowed the researchers to generate new insights into relationships between traits and language used.

For example, participants with the most emotional stability refer to sports much more.

Researcher Lyle Ungar said this suggests “we should explore the possibility that neurotic individuals would become more emotionally stable if they played more sports.”

In this way the results provide new ways of researching connections between traits, behaviors, and the effectiveness of psychological interventions.

Here's the breakdown by age:








PLOS One





Martin Seligman, director of the Positive Psychology Center, explained why the new approach trumps previous methods: “When I ask myself, ‘What's it like to be an extrovert?’ ‘What's it like to be a teenage girl?’ ‘What's it like to be schizophrenic or neurotic?’ or ‘What's it like to be 70 years old?’ these word clouds come much closer to the heart of the matter than do all the questionnaires in existence.”

Here is gender:




PLOS One

The biggest boon of the study may be that instead of asking millions of people to fill out surveys, future studies could involve volunteers submitting their Facebook or Twitter feeds for anonymized study.

“Researchers have studied these personality traits for many decades theoretically,” Eichstaedt said, “but now they have a simple window into how they shape modern lives in the age of Facebook.”

The study is part of the World Well-Being Project, which has found several ways to “analyze the big data available through online social media in light of psychological theory.”



Business Insider

jueves, 10 de octubre de 2013

Coeficiente de agrupamiento

Coeficiente de agrupamiento 

En la teoría de grafos, un coeficiente de agrupación es una medida del grado en el que los nodos en un gráfico que tienden a agruparse juntos. La evidencia sugiere que en la mayoría de redes del mundo real , y en particular las redes sociales, los nodos tienden a crear grupos muy unidos que se caracterizan por una densidad relativamente alta de enlaces; esta probabilidad tiende a ser mayor que la probabilidad media de un lazo establecido al azar entre dos nodos (Holland y Leinhardt de 1971, [1] Watts y Strogatz, 1998 [2]).

Existen dos versiones de esta medida: la global y la local. La versión global fue diseñado para dar una indicación general de la agrupación en la red, mientras que el local, da una indicación de la incrustación de los nodos individuales .

Coeficiente de agrupamiento global 

El coeficiente de agrupación mundial se basa en tripletes de nodos. Un triplete consiste en tres nodos que están conectados por cualquiera de los otros dos (triplete abierto) o tres (triplete cerrado) lazos no dirigidos. Un triángulo se compone de tres tripletes cerrados, uno centrado en cada uno de los nodos. El coeficiente de agrupación global es el número de tripletes cerrados (o 3 x triángulos) sobre el número total de tríos (tanto abierto como cerrado). El primer intento de medir que fue hecha por Luce y Perry (1949). [3] Esta medida da una indicación de la agrupación en el conjunto de la red (global), y se puede aplicar tanto a las redes no dirigidas como dirigidas (a menudo llamadas transitividad, ver Wasserman y Faust, 1994, página 243 [4]).


Watts y Strogatz definen el coeficiente de agrupamiento como sigue, "Supongamos que un vértice tiene  vecinos; entonces un máximo de hasta  enlaces pueden existir entre ellos (esto ocurre cuando cada vecino de  está conectado a cada otro vecino de  ). Sea la fracción de estos enlaces permitidos que existen actualmente. Definamos  como el promedio de   sobre todos los ."

Cociente de transitividad

El cociente de transitividad es un concepto relacionado. Se define como:

El coeficiente de agrupamiento asigna mayor peso a los nodos con menor grado, mientras que el cociente de transitividad asigna mayor peso a los nodos con mayor centralidad de grado.

Una generalización de redes ponderados fue propuesto por Opsahl y Panzarasa (2009), [5] y una redefinición de las redes de dos modos (tanto binaria y ponderadas) por Opsahl (2009). [6]

Coeficiente de agrupación local



Ejemplo: El coeficiente de la agrupación local de un grafo no dirigido. El coeficiente de agrupación local del nodo azul se calcula como la proporción de las conexiones entre sus vecinos que en realidad se realizan en comparación con el número de todas las conexiones posibles. En la figura, el nodo azul tiene tres vecinos, que pueden tener un máximo de 3 conexiones entre ellos. En la parte superior de la figura se observan las tres conexiones posibles (segmentos negros gruesos), dando un coeficiente de la agrupación local de 1. En la parte media de la figura se realiza sólo una conexión (línea de color negro de espesor) y 2 conexiones se echa en falta (líneas de puntos rojos), dando un coeficiente de clúster local de 1/3. Por último, ninguna de las posibles conexiones entre los vecinos del nodo azul se realizan, la producción de un valor de coeficiente de la agrupación local de 0.

El coeficiente de la agrupación local de un vértice (nodo) en un gráfico cuantifica qué tan cerca sus vecinos están de ser una camarilla (gráfico completo). Duncan J. Watts y Steven Strogatz introdujeron la medida en 1998 para determinar si un grafo es una red de mundo pequeño.

Un grafo  formalmente consiste de un conjunto de vértices  y un conjunto de enlaces entre ellos. Un enlace   conecta al vértice  con el vértice .

El vecindario  para un vértice  es definido como sus vecinos inmediatamente conectados como sigue:

Definimos  como el número de vértices, , en el vecindario, , de un vértice.

El coeficiente de agrupamiento local   para un vértice   es entonces dado por la proporción de enlaces entre los vértices dentro de su vecindario dividido por el número de enlaces que podría potencialmente existir entre ellos. Para un grafo dirigido, es distinto de , y por lo tanto para cada vecindario  hay  enlaces que podrían existir entre los vértices dentro del vecindario  ( es el número de vecinos de un vértice). Entonces, el coeficiente de agrupamiento local para grafos dirigidos está dado por  [2]



Dado que un grafo no dirigido tiene la propiedad que   y son idénticos. Por ello, si un vértice  tiene  vecinos, enlaces podrían existir entre los vértices dentro de su vecindario. Por ello, el coeficiente de agrupación local para grafos no dirigidos puede ser definido como

Sea  el número de triángulos sobre  para un grafo no dirigido . Esto es, es el número de subgrafos de  con 3 enlaces y 3 vértices, uno de los cuales es . Sea  el número de of tripletes sobre . Esto es, es el número de subgrafos (no necesariamente inducidos) con 2 enlaces y 3 vértices, uno de los cuales es y tal que es incidente a ambos enlaces. Entonces podemos también definir al coeficiente de agrupamiento como


Es simple demostrar que las dos definiciones precedentes son lo mismo, dado que

Estas medidas son iguales a 1 si cada vecino conectado a   se encuentra también conectado a cada otro vértice dentro del vecindario, y 0 si ningún vértice conectado a   se conecta con ningún otro vértice que está conectado a .

Coeficiente de agrupamiento medio de red 


El coeficiente de agrupamiento para toda la red está dada por Watts y Strogatz [2] como la media de los coeficientes de la agrupación locales de todos los vértices  :[7]

Un grafo es considerado un mundo pequeño, si el coeficiente de agrupamiento medio es significativamente más alto que un grafo aleatorio construido con el mismo conjunto de vértices y si el grafo tiene aproximadamente la misma longitud media de camíno más corto que si correspondiente grafo aleatorio.

Una generalización para grafos ponderados fue propuesta por Barrat et al. (2004),[8] y una redefinición para grafos bipartitos (también llamadas redes de dos modos) por Latapy et al. (2008)[9] y Opsahl (2009).[6]

Esta fórmula no es, por definición, definida para grafos con vértices aislados; ver Kaiser, (2008)[10] y Barmpoutis et al.[11] Las redes con los coeficientes de agrupamiento medio más grandes posible se encuentran que tienen estructuras modulares y al mismo tiempo, tiene la menor distancia media posible entre los diferentes nodos.[11]

Referencias

  1. P. W. Holland and S. Leinhardt (1971). "Transitivity in structural models of small groups".Comparative Group Studies 2: 107–124.
  2. Jump up to:D. J. Watts and Steven Strogatz (June 1998). "Collective dynamics of 'small-world' networks"Nature 393 (6684): 440–442. Bibcode:1998Natur.393..440W.doi:10.1038/30918PMID 9623998.
  3. Jump upR. D. Luce and A. D. Perry (1949). "A method of matrix analysis of group structure". Psychometrika 14 (1): 95–116.doi:10.1007/BF02289146PMID 18152948.
  4. Jump upStanley Wasserman, Kathrine Faust, 1994. Social Network Analysis: Methods and Applications. Cambridge: Cambridge University Press.
  5. Jump upTore Opsahl and Pietro Panzarasa (2009). "Clustering in Weighted Networks"Social Networks 31 (2): 155–163.doi:10.1016/j.socnet.2009.02.002.
  6. Tore Opsahl (2009). "Clustering in Two-mode Networks"Conference and Workshop on Two-Mode Social Analysis (Sept 30-Oct 2, 2009).
  7. Jump upKemper, Andreas (2009). Valuation of Network Effects in Software Markets: A Complex Networks Approach. Springer. p. 142.ISBN 9783790823660.
  8. Jump upA. Barrat and M. Barthelemy and R. Pastor-Satorras and A. Vespignani (2004). "The architecture of complex weighted networks".Proceedings of the National Academy of Sciences 101 (11): 3747–3752. arXiv:cond-mat/0311416Bibcode:2004PNAS..101.3747B.doi:10.1073/pnas.0400087101PMC 374315PMID 15007165.
  9. Jump upM. Latapy and C. Magnien and N. Del Vecchio (2008). "Basic Notions for the Analysis of Large Two-mode Networks". Social Networks 30(1): 31–48. doi:10.1016/j.socnet.2007.04.006.
  10. Jump upMarcus kaiser (2008). "Mean clustering coefficients: the role of isolated nodes and leafs on clustering measures for small-world networks".New Journal of Physics 10 (8): 083042. arXiv:0802.2512Bibcode:2008NJPh...10h3042Kdoi:10.1088/1367-2630/10/8/083042.
  11. D. Barmpoutis and R. M. Murray (2010). "Networks with the Smallest Average Distance and the Largest Average Clustering".arXiv:1007.4031 [q-bio.MN].