Mostrando entradas con la etiqueta tweets. Mostrar todas las entradas
Mostrando entradas con la etiqueta tweets. Mostrar todas las entradas

viernes, 14 de julio de 2017

Ley natural: Los tweets políticos generan polarización

Un grafo muestra cómo los tweets moralmente indignados permanecen dentro de su burbuja política




Los tweets rojos y azules no interactúan mucho. (William Brady et al)


Escrito por Olivia Goldhill | Quartz


"America first"

Miles de personas en todo el mundo han hecho emocionadamente un punto político con un tweet bien afilado e ingenioso. Todo lo que se necesita es 140 caracteres para hacer un argumento rotundo, y el hombre se siente bien para obtener unos retweets.
Pero, independientemente de lo persuasivos o divertidos que sean sus tweets, es probable que no sea bien recibido por alguien que no esté de acuerdo con usted. Un estudio de más de medio millón de tweets, publicado recientemente en las Actas de la Academia Nacional de Ciencias, muestra que los tweets moralmente indignados tienden a ser ampliamente retweeted dentro de sus esferas políticas, pero rara vez escapan de sus burbujas.
Los investigadores, dirigidos por el psicólogo William Brady de la Universidad de Nueva York, comenzaron analizando el lenguaje utilizado en 563.312 tweets sobre tres temas polémicos: control de armas, matrimonio entre personas del mismo sexo y cambio climático. Ellos ordenaron los tweets según su uso del lenguaje moral (por ejemplo, la palabra "deber"), lenguaje emocional (por ejemplo, "miedo") y lenguaje que es tanto moral como emocional (por ejemplo, "odio"). Los tweets que eran estrictamente morales o puramente emocionales no tenían un mayor número de retweets, pero los investigadores encontraron un aumento del 20% en retweets por palabra moral-emocional añadida.

A continuación, los investigadores analizaron cuánto de este intercambio ocurrió en redes ideológicas. Ellos estimaron la inclinación ideológica de cada tweeter usando un algoritmo que mide la persuasión política basada en redes seguidoras. Para cada tweet, calcularon el número de retweets de aquellos con la misma ideología que el autor, en comparación con aquellos con una ideología diferente. En general, encontraron mucho más retweets en grupo que fuera de grupo para mensajes sobre el control de armas y el cambio climático. (Los resultados para los tweets de matrimonio del mismo sexo tienden en la misma dirección, pero no son estadísticamente significativos).
El gráfico de red anterior es una visualización de esos hallazgos, con el azul representando a tweeters liberales y rojo representando conservadores. Los puntos representan tweets en todos los temas políticos, mientras que las líneas representan retweets. Aunque hay cierta interacción entre los dos grupos, el rojo y el azul permanecen en gran medida separados. Incluso las palabras más morales o emocionales, al parecer, no son lo suficientemente poderosas como para inducir un retweet desde el otro lado del pasillo.

sábado, 10 de septiembre de 2016

Análisis de cuentas verificadas de Twitter con Gephi

El análisis de 205.718 usuarios verificados Twitter
Desde el año 2008 se crea visualizaciones de red para comprender mejor cómo funcionan las comunidades. En este artículo voy a echar un vistazo a cómo verificada usuarios de Twitter están conectados y quienes son.

Startup Grind



Lo siento por la mala calidad de la imagen. Medio les parece comprimir mucho. Puede descargar el PNG original (5 MB). Para obtener más información sobre el algoritmo, mira la sección de recogida de datos en la parte inferior.

¿Cómo están conectados las cuentas verificadas en Twitter?

Aquí están todas las cuentas de Twitter verificados en una sola imagen. Cada nodo es una cuenta y el tamaño se debe a la cantidad de personas los siguen. Tamaño ajustado con interpolación spline para hacer las cuentas con menos seguidores más visible y reducir los tamaños de los que tienen el mayor número de seguidores. De lo contrario las cuentas con millones de seguidores serían mayores que los de las propias comunidades.

Nombrando las sub-comunidades

La imagen se ve bien, pero se vuelve interesante cuando se va más profundo. En cuanto a cada uno de estos nudos de cuentas para entender de qué se trata. Si tienen algo en común. O si no son más que la gente al azar siguientes entre sí.


En primer lugar tratamos de ver de que se tratan estos grupos


Como se puede ver en la imagen grande más adelante, los grupos no son tan desconectados como se ven sin las conexiones (bordes). Sin embargo, el algoritmo todavía era capaz de encontrar comunidades muy unidas. Y si bien hay muchas comunidades transversales siguientes, la mayoría de los siguientes ocurren entre las propias comunidades.
Todo el gráfico es de US céntrica. Ese gran nodo de color marrón en el medio de todo. Eso es @twitter. Y el azul claro se superpone con, que es @youtube. La otra gran luz azul en la parte inferior derecha media son celebridades. @katyperry, @justinbieber, @theellenshow, @rihanna, @ladygaga y así sucesivamente. Hay mucho más en juego en este sector centro, pero en esta visualización es difícil de ver. Voy a echar un vistazo más de cerca más adelante en este artículo.
Mientras que es posible diferenciar entre grupos de actualidad en el centro, para el resto de las sub-communites se agrupan principalmente regional. Esto tiene que ver con el menor número de cuentas verificadas para los demás países. Si pongo cada uno de estos grupos en su propio gráfico, estoy seguro de que será posible obtener una imagen más clara de cómo están conectados en sí mismo y no sólo una gota.
Alemania, Austria y Suiza están conectados de forma natural por el lenguaje. Canadá es la extensión de Estados Unidos hacia la izquierda, Reino Unido hacia la derecha y Australia en la parte inferior derecha. Una vez más, el lenguaje como un factor para ello. No es la cercanía cultural. Pero esto existe para más grupos.
Otro grupo de lengua española es de color verde en la parte superior. Incluso después de varios intentos, no fue capaz de encontrar otra conexión entre todas las cuentas agrupadas allí. Son de diferentes países de América del Sur, así como los medios de comunicación de Estados Unidos en español y más. Cerca de México, Argentina y España. Brasil, con cierta distancia.
Turquía está lejos de todos los demás. Especialmente la UE, que está justo al lado de la ONU y un poco de política del Reino Unido. Más cerca de la UE no es Israel. Me sorprendió que aparece cerca de Portugal, Finlandia, Suecia y Dinamarca. En el otro lado Rusia. Y justo detrás de Rusia Qatar y Arabia Saudita.
Francia tiene una posición de fuera en la parte superior derecha, alguna conexión con Italia y España. Lejos de la UE y Alemania. Pero no todos Alemania. Hay otro sub-comunidad alemana. Fútbol. O mejor: Bundesliga. Or está cerca de los Países Bajos también. Y, por supuesto, con el fútbol en el Reino Unido. Hay otro grupo de sub-comunidades cercanas: eSport. Y eSport pasa por contracción de los desarrolladores de juegos que se sientan en el borde de la burbuja de los Estados Unidos.
En el borde derecho no es Asia con muchas varias comunidades más pequeñas. Todavía no sé por qué Japón tiene dos sub-comunidades que no están tan bien conectadas entre sí.


205 mil cuentas de twitter verificadas y 19 millones de conexiones entre ellas

Viaje a través de la gráfica [video, alemán]




En el video Voy a través de los grandes sub-comunidades y hablar de lo que creo que son y por qué son exhibidas como un grupo distinto.

Lugares más populares


Top 25 lugares (como las personas que escriban en su biografía)

Twitter no tiene la función de autocompletar para los datos de localización como Facebook lo hace. La gente puede poner en el campo de ubicación de lo que quieran. Como resultado no es tan grande como para trabajar con los datos. Como se puede ver en el gráfico anterior en el Top 25 lugares tienen varias ortografías diferentes. Londres no es más popular que Los Ángeles, pero más personas utilizan el mismo formulario. Y éstas son sólo las formas más populares, para cada ciudad hay muchas formas diferentes de escribir ellos. Algunos añaden el estado, algunos del país, algunos utilizan el barrio y mucho más.
Tal vez voy a tener tiempo para mirar en todas estas formas de un día o encontrar una herramienta que los normaliza. Por ahora creo que la nube de la palabra es suficiente, ya que no se preocupa por la ubicación exacta de la palabra de la cadena.



La recogida de datos

Cuando llegó a mi cuenta de Twitter verificada, he notado que @verified comenzó a seguirme. En cuanto a sus seguidores que es fácil de adivinar que sigue cada cuenta verificada en Twitter. Por lo tanto, puedo decir que hay 206 000 cuentas verificadas en Twitter en el momento. Y comprueben alrededor de 1.000 cuentas cada día. Puede haber algunas cuentas que bloquean @verified y por lo tanto no aparecen en sus seguidores pero supongo que la cantidad es tan pequeña que puedo ignorarlo. El uso de la cuenta como punto de partida que es posible recoger la red de cuentas verificadas en Twitter.
He utilizado una versión modificada del comando Python twecoll herramienta de línea por JP de Vooght para recoger una lista de todas las cuentas seguido por @verified. Luego, la herramienta fue a través de todas estas cuentas 205k y miró a los que siguen. Para un conjunto de datos que he limitado a las cuentas que siguen a menos de 10 000 cuentas y un segundo conjunto de datos de cuentas que siguen a menos de 1 000 cuentas. Hay dos razones para esto. Las personas más administraciones siguen, el menos importante se vuelve cada conexión. La segunda razón es la limitación técnica de mi equipo (4670k i5 a 4,2GHz, 16GB de RAM, 250 GB de Samsung EVO 840, GTX 760). A pesar de que funciona con el conjunto de datos más grande, no es divertido para trabajar, porque todo lleva más tiempo.
La recolección de datos funcionó en una Frambuesa Pi 2 de 7 días a partir de 22. 28/08/2016 con sólo algunas horas de pausa debido a los errores que tenía que corregir manualmente. Debido al tiempo de largo plazo hay algunas inconsistencias en los datos cuando la gente sigue o unfollowed alguien en ese período de tiempo. En esta escala no hace una diferencia. Hay algunas cuentas en el conjunto de datos que no se verifica más. Tomé un vistazo más de cerca a las 36 cuentas. Estas fueron todas las cuentas que han perdido su estado verificado en un día de cada cuentas verificadas. La mitad de ellos elimina su cuenta / suspendieron, la otra mitad fue privado y perdió su estado verificado por eso.
El conjunto de datos grande, <10 000 seguidores, dispone de 205 718 cuentas de Twitter y 45 302 877 conexiones entre ellos. El conjunto de datos más pequeña, <1 000 seguidores, tiene 205.718 cuentas, así y 19 176 260 conexiones.
Yo uso Gephi para visualizar los datos. Pié el proceso de obtención de los datos en un estado útil. OpenOrd (25, 25, 25, 10, 15; cortar 0,8; 500 iteraciones) me dio la disposición más útil. Los colores son calculados por el algoritmo de modularidad. Puedo cambiar el tamaño de los nodos de vez en cuando. Si no se ha señalado que son seguidores.

Algunas Estadísticas generales

Cargué las estadísticas de las cuentas verificadas 205K en Excel e ignore las conexiones. Estos números no ignoran todas las cuentas, no importa cuántas cuentas que siguen.
Cuando presenté mi cuenta para la verificación, me dijeron que por algunos contactos que no tienen suficientes seguidores. De hecho cuentas verificadas tienen un promedio de 117 845 seguidores. Pero hay una gran cola larga. La mediana es a los 9 370 seguidores. Hay más de 100 mil cuentas con menos de 10 000 seguidores. Y el resto no tiene que mucho más. El promedio se sesgada por las cuentas de mega como @katyperry con 92.2m seguidores. Hay 188 cuentas verificadas con más de 10 millones de seguidores y 4 330 cuentas verificadas con más de 1 millón de seguidores. Hay una cuenta verificada con sólo dos seguidores.



Pero, ¿cuántas cuentas se atienen a las cuentas verificadas? Por término medio se siguen las cuentas de 2031. Pero de nuevo nos dieron algunos seguidores de mega. Una cuenta sigue cuentas 3.6m. La mediana se encuentra en una muy manejables 475 seguidores. Personalmente siento que todo por encima de 5 000 seguidores no se sigue de forma manual. Después de todo el mundo es una táctica frecuentemente usada para generar siguientes. Así que muchas personas hicieron que Twitter introdujo un límite que sólo se puede seguir un cierto porcentaje representa más de lo que sigue (Base Límite 5 000, límite diario 1 000). Esto dio lugar a una nueva táctica seguimiento y no seguir. Las cuentas siguen a tantas personas como sea posible y unfollow todo aquel que no siga de nuevo en x días. Estoy divagando. Hay 3 551 cuentas que siguen a nadie y 33 328 cuentas que siguen a otros a menos de 100. Una cuenta volvió a los siguientes negativos de -28. Supongo que eso es un error con la base de datos de Twitter.


Lo siento por la elección del eje.

Las cuentas verificadas han publicado una cantidad acumulada de 2 488 119 264 actualizaciones de estado. 12 095 en promedio. La mediana de 4 a 191. Sin cuenta la edad, estos números no significan nada. La mayoría de las cuentas son cuentas hablador de apoyo por parte de empresas. AmexOffers ha publicado tweets de 5,2 millones. Por supuesto que hay muchas cuentas verificadas, las cuales no han twitteado en absoluto. O eliminado todo. 131 para darle el número. 25 y 764 cuentas verificadas registraron menos de 500 tweets.



La mayoría de las cuentas de Twitter verificadas fueron creados en 2009. El gráfico anterior es bastante sorprendente si nos fijamos en la popularidad general de Twitter.



De lunes a domingo casi dos veces el número de cuentas se crearon que en el fin de semana. Necesito un conjunto de datos para compararla con antes de que yo puedo decir si esto es más probable que provenga de la pauta general de uso de Twitter o si estas cuentas son cuentas de trabajo es más probable que a menudo son creadas por las agencias.

Siete aprendizajes


  • Las cuentas verificadas están conectados regionalmente primera, segunda y temáticamente
  • El lenguaje es una característica importante mutua
  • Las cuentas más seguidas son las celebridades más populares
  • La política y la tecnología tienen más seguidores entre cuentas verificadas
  • Las cuentas de redes son influyentes de todo el mundo
  • La mayoría de las cuentas verificadas son muy activos, pero siguen pocas personas
  • Compartir grandes gráficos es complicada

Explora usted mismo y dime lo que has encontrado

Usted puede explorar la gráfica, ya sea como una versión GigaPan, que carga de forma dinámica o ir a por todas y tratar la versión de 30 MB sigma.js, que puede bloquear el navegador y toma algunos minutos en cargar, pero tiene una función de búsqueda. O sin búsqueda, pero es mejor utilizar el zoom. Ambos tienen su versión sigma.js eje Y invertida, lo que está en la parte superior de las capturas de pantalla aquí, está en el fondo allí.

Visualización zoomable en Gigapan
Compartir sus ideas en los comentarios oa través de Twitter.

Colabore conmigo

Quiero escribir artículos acerca de cada sub-comunidades y necesitan la ayuda de personas que ya están conociendo el grupo respectivo. Si quieres colaborar conmigo en uno de estos artículos por favor envíeme un correo electrónico con el grupo está interesado en: lucahammer@gmail.com. Entonces le envía un archivo con los datos establecidos para ese grupo, una breve guía de cómo se puede trabajar con él y un enlace de Google Docs en el que podemos trabajar el artículo juntos. Puede publicar el artículo final en su propio blog / medio / publicación o que publicarla aquí.


Aquí está la guía de cómo alguien puede analizar las redes de Twitter con Gephi

domingo, 7 de diciembre de 2014

El más precioso mapa de los tweets

Crean un mapa con cada tuit enviado en los últimos tres años en el mundo

Eric Fischer, responsable de Mapbox, un servicio de creación y publicación cartográfico, ha elaborado un mapa con cada tuit enviado en los últimos tres años y medio en todo el planeta.





Mapbox

viernes, 7 de marzo de 2014

Análisis de conversaciones en Twitter de un congreso en Italia

Social Case History Forum: Análisis de las conversaciones en Twitter



El Jueves de 15 de noviembre de 2012 se celebró en Milán en el Centro de Congresos Stelline Palazzo, la tercera edición de Social Case History Forum. Día abierto al público, durante el que expertos y profesionales hablarán de sus estudios de caso relacionados con los proyectos sobre medios de comunicación social.
Entre los muchos temas tratados, se prestará especial atención a la televisión social, generación de leads, B2C y B2B marketing en medios sociales, las campañas de marketing de Facebook y adv, e-gobierno, email marketing y medios de comunicación social, las empresas sociales para las organizaciones sin fines de lucro; además de la habitual atención a los arranques.
El propósito de esta investigación es analizar desde el punto de vista de las conversaciones de Twitter de calidad y cantidad en torno a #schf12 , hashtag oficial promovido por los organizadores.
En el día del evento, hay 1.416 tweets publicados por un total de 190 usuarios, con una media de unos 7 tweets por usuario. Bueno 162 de estos usuarios entran en interacción, a través de retweets y menciones, lo que demuestra un alto grado de participación (85%) de la comunidad en Twitter, se reunieron alrededor all'hashtag #schf12.


Evidentemente los tweets se centran durante las presentaciones, pero se puede ver que una buena parte anterior y posterior a la clausura de la sesión, el testimonio de la espera y el evento bien recibido. 
Se puede observar de los picos, en correspondencia de las presentaciones:

  • Fare Social Media Marketing nel B2B: si può? L’esperienza SAP Italia. Valeria Severini, AD, Freedata Labs – Flaminio Francisci, Marketing Manager, SAP Italia
  • Come conoscere e coinvolgere gli utenti grazie al social login: il caso Amadori. Gianluca Treu, Marketing and sales manager, Cubeyou
  • Sentiment Analysis: dietro al web c’è un cuore? Sicuramente ci sono delle persone. Prof. Francesco Colace, Ricercatore, Dipartimento di Ingegneria Informatica, Ingegneria Elettrica e Matematica Applicata Università degli Studi di Salerno
  • Email & Social network: casi pratici di integrazione. Come, perchè e quanto funziona. Arianna Galante, DIrector of Agency Department
Para seguir el TagCloud de los usuarios más activos, en cuanto al número de tweets enviados.
En cuanto a los usuarios más populares son un buen indicador de retweets y menciones recibidas.
La red relacional, desarrollada durante el evento, un total de 162 nodos y 608 interacciones (RT y menciones). Al centrarse en los usuarios que ingresan al menos 5 interacciones se puede ver 5 subcomunidades donde se intensifican los intercambios comunicativos y que cubren aproximadamente el 40% de los usuarios y el 74% de las interacciones totales. En el gráfico siguiente el tamaño de los nodos es proporcional al número de menciones recibido.
Cabe señalar la centralidad de los usuarios institucionales: @ socialchforum es la voz oficial del evento, y @ sapitalia @ContactLab son compañías que han traído buena respuesta con su propia historia clínica. Reportero social real de los eventos están @vnotarfrancesco @ chiaracovi, @ futurap @franciungaro y @Improjou.

Disclaimer
Este blog está destinado exclusivamente a la investigación y el estudio personal. 
Pido a la cortesía de cualquier imprecisión, voy a estar seguro de integrar y modificar los contenidos de esta página.

Créditos, recursos on line:

domingo, 18 de agosto de 2013

Los lugares más felices de USA según los tweets

The Happiest Places in America




After parsing the results from a recent University of Vermont study of geotagged tweets, theHuffington Post has compiled a map showing just how happy — or unhappy — Americans are according to the state they live in.

The numbers you see in the above graphic were derived by scoring more than 10,000 words on a positive-negative scale and measuring their frequency in millions of tweets across the United States.

Context was deliberately ignored to eliminate experimental bias, as were tweets from out-of-towners and/or tourists (which may explain why Hawaii rocked the list!).


Katy Hall and Jan Diehm explain their map and the 'word happiness score':


What emerged was significant regional variation in happiness by this calculation, which correlates with other lifestyle measures such as gun violence, obesity and Gallup'straditional wellbeing survey. A sadness belt across the South includes states that have high levels of poverty and the shortest life expectancies. 

Geography is, of course, just one predictor of moods expressed on Twitter. The researchers also used their "hedonometer" to look at daily happiness averages over the past few years — and the peaks (holidays, especially Christmas) and valleys (tragedies including the Newtown shooting and Boston Marathon bombing) are not surprising.

It turns out that Louisiana is the saddest state. "Socioeconomic factors that influence happiness in the U.S., such as poverty, unemployment and government resources, also account for some of the variation in life satisfaction levels in countries around the world," write Hall and Diehm.

Be sure to head on over to the HuffPo article to learn more — and to see how the U.S. stacks up with the rest of the world on the Life Satisfaction Index.

io9