Mostrando entradas con la etiqueta blogs. Mostrar todas las entradas
Mostrando entradas con la etiqueta blogs. Mostrar todas las entradas

miércoles, 18 de julio de 2018

Blogósfera singapuresa

Imágenes SVG con Pajek

Dr. Steven McDermott

Los nodos / vértices de la Blogosfera de Singapur 1239 representados usando svg export on pajek.


La blogósfera de Singapur


Blogósfera de Singapur: el tamaño del nodo denota la centralidad de la interrelación

Blogósfera de Singapur: el tamaño del nodo denota la centralidad de la interrelación

miércoles, 20 de enero de 2016

¿Cómo se distribuye la desinformación?

¿Como se difunde la desinformación online?


World Economic Forum

En el período previo a las elecciones italianas de 2013, un posteo de medios sociales exponiendo la corrupción del parlamento se volvió viral. Los políticos italianos estaban en silencio la certeza de que, se ganara o se perdiera, serían financieramente seguro quedarse con el dinero de los contribuyentes. El parlamento había pasado en silencio un proyecto de ley especial de bienestar especialmente diseñadas para proteger a los responsables políticos de que se aseguraran que un paquete increíble de seguro de desempleo en caso de que perdiesen su escaño en las próximas elecciones. El proyecto de ley, propuesto por el senador Cirenga, asignaba unas increíbles 134 mil millones € al desempleo político. El Senado italiano votó 257 a favor y 165 en abstención.
El mensaje causó un gran revuelo considerable y comprensible. Estaba cubierto en varios periódicos principales y ha sido citado por las principales organizaciones políticas. Pero había un problema: toda la historia era falsa. Ni siquiera una buena falsificación en este caso. Para los interesados ​​en la política italiana, había una serie de problemas obvios con la historia. En primer lugar, no había ningún Senatore Cirenga. El número de votos no estaba bien tampoco, ya que Italia no tiene ni siquiera que muchos senadores. Y la suma increíble habría representaron aproximadamente el 10% del PIB de Italia.
¿Entonces qué pasó? ¿Cómo una falsa tan obvia engañar a tanta gente?
Walter Quattrociocchi, jefe del Laboratorio de Ciencias de la Computación Social al IMT Lucca, en Italia, ha estado estudiando el fenómeno de la falta de información en línea. Su trabajo ayudó a informar a última Riesgos Globales Informe del Foro Económico Mundial. Hablamos con él para obtener más información.



¿Por qué está pasando esto?

Antes de la web, que recibió su información de revistas, la televisión y los periódicos. Ahora cualquiera puede crear un blog, tener una página de Tumblr o publicar sus opiniones en línea. A partir de ahí, se puede distribuir esa información rápidamente a través de Twitter, Facebook y toda una mezcla heterogénea de otras plataformas de medios sociales.
El problema es que mientras que los medios tradicionales tenían editores, productores y otros filtros antes de la información se hizo pública, publicación individuo no tiene filtro. Sólo tiene que decir lo que quiere y lo puso ahí.
El resultado es que todo el mundo puede producir o encontrar información coherente con su propio sistema de creencias. Un entorno lleno de información sin control maximiza la tendencia a seleccionar el contenido por el sesgo de confirmación.
Estudios recientes que se centran en la desinformación en línea señalaron que la exposición selectiva a contenidos específicos conduce a "cámaras de eco" en el que los usuarios tienden a formar y reforzar sus creencias.

¿Qué es una caja de resonancia?

Una caja de resonancia es un espacio aislado en la web, en donde las ideas se intercambian esencialmente sólo confirmar el uno al otro. Puede ser un espacio de personas con ideas afines compartir puntos de vista políticos similares, o una página sobre una teoría de la conspiración específica. Una vez dentro de uno de estos espacios, los usuarios están compartiendo información que es muy similares, básicamente "eco" entre sí.
Hemos estudiado la dinámica dentro de una única cámara de eco. Lo que encontramos es que el contenido más discutido se refiere a cuatro temas específicos: el medio ambiente, la alimentación, la salud y la geopolítica.
Contenido perteneciente a los diferentes temas que se consumen de una manera muy similar por los usuarios. Gustos y las acciones siguen siendo más o menos los mismos temas de todo.
Si nos centramos en la sección de comentarios, sin embargo, notamos una diferencia notable en los temas. Usuarios polarizadas en la geopolítica son los más persistentes al comentar, mientras que los que se centran en la dieta son menos persistentes.
Asimismo, se encontró que los usuarios de "saltar" de un tema a otro. Una vez que comienzan a "como" algo, lo hacen cada vez más, como un efecto de bola de nieve. Una vez involucrado en un corpus conspiración, un usuario tiende a unirse a la conversación global, y comienza a "saltar" de un tema a otro. Los aumentos de probabilidad con participación de los usuarios (número de gustos en un solo tema específico). Cada nuevo como sobre el mismo tema conspiración aumenta la probabilidad de pasar a uno nuevo en un 12%.

¿Qué tipo de rumores se están extendiendo?

Páginas sobre conspiraciones globales, chem-senderos, ovnis, reptilianos. Una de las conspiraciones más publicitados es el vínculo entre las vacunas y el autismo.
Estas narrativas alternativas, a menudo en contraste con la corriente principal uno, proliferan en Facebook. La peculiaridad de teorías de la conspiración es que tienden a reducir la complejidad de la realidad. Teorías de la conspiración creen (o reflejan) un clima de desconexión de la sociedad y de las prácticas recomendadas oficialmente - por ejemplo, vacunas, dieta, etc.
Entre los más fascinantes dinámicas sociales observados es el trolling. Antes, los trolls eran principalmente personas que sólo querían despertar a una multitud, pero la práctica ha evolucionado. Trolls hoy actúan para burlarse de la cultura "creer cualquier cosa" de estos eco cámaras. Básicamente atacan contradicciones a través de la parodia.
Actividades Trolls 'van de contenido controversial y satírica a la fabricación de declaraciones puramente ficticios, muy poco realistas y sarcásticos. Por ejemplo, los trolls conspiracionistas agregan en grupos y construir páginas de Facebook como una caricatura de noticias conspiración. Un ejemplo reciente fue una publicación falsa de "hallazgos" que mostró chemtrails tenían rastros de viagra en ellos.
Lo que hace que su actividad tan interesante es que, muy a menudo, estas bromas van viral y terminan utilizado como evidencia en los debates en línea de activistas políticos.

¿Cómo has estado estudiando este fenómeno?

En Facebook, gustos, acciones, y los comentarios nos permiten entender la dinámica social desde una perspectiva totalmente nueva. Con estos datos, podemos estudiar las fuerzas impulsoras detrás de la difusión y el consumo de información y rumores.
En nuestro estudio de 2,3 millones de individuos, nos fijamos en cómo los usuarios de Facebook se consumen información diferente en el borde de la discusión política y de prensa durante las 2013 elecciones italianas. Páginas fueron clasificados, de acuerdo con el tipo de contenido de informar.
1. Los principales medios
2. activismo político en línea
3. Fuentes de Información Alternativa (temas que son abandonados por la ciencia y medios de comunicación)

Seguimos 50 páginas públicas y las interacciones de sus usuarios (como, comentarios y acciones) durante seis meses.
Cada acción tiene un significado particular. A igual que da la retroalimentación positiva; una parte expresa la voluntad de aumentar la visibilidad; y los comentarios de ampliar el debate.
Lo que encontramos fue que ni el tema de un puesto ni su calidad de la información tuvieron ningún efecto sobre el resultado. Mensajes contiene afirmaciones sin fundamento, o alrededor de activismo político, así como noticias regular, todos tenían patrones de compromiso muy similares.
Así que la gente está reaccionando a los puestos en función de sus creencias, sin importar donde esos puestos se originó a partir?
Exactamente. No es que la gente está reaccionando de la misma manera a todo el contenido, pero que todo el mundo está de acuerdo en su comunidad específica.
La gente está buscando información que confirme sus creencias existentes. Si hoy un artículo sale de la OMS apoyar sus reclamos, que les guste y compartirlo. Si mañana uno nuevo sale contradiciendo sus afirmaciones, criticas a él, cuestionarlo.
Los resultados muestran que estamos de vuelta a la "cámaras de eco", hay una exposición selectiva seguida por el sesgo de confirmación.
Para comprobar esto, se realizó otro estudio, esta vez con una muestra de 1,2 millones de usuarios. Queríamos ver cómo la información relacionada con las narrativas muy distintas - es decir, la corriente principal de noticias científicas y conspiración - se consumen y se conforma por las comunidades en Facebook.
Lo que encontramos es que las comunidades polarizadas emergen tipos distintos de todo el contenido y los consumidores de noticias de la conspiración tienden a ser muy centrado en el contenido específico.
Los usuarios que les gusta mensajes hacen en las páginas de una específica categoría de 95% de las veces. También nos fijamos en comentarios, y encontramos que los usuarios polarizadas de noticias de la conspiración se centran más en los mensajes de su comunidad. Ellos son más propensos a recibir y compartir mensajes de páginas de conspiración.
Por otro lado, las personas que consumen cuota de noticias científicas y les gusta menos, pero comentan más en las páginas de la conspiración.
Nuestros resultados indican que existe una relación entre las creencias y la necesidad de cierre cognitivo. Se trata de los factores que impulsan a los incendios forestales digitales.

¿Eso quiere decir que sabemos lo que va a ir la próxima viral?

Fenómenos virales son generalmente difíciles de predecir. Esta visión hace que nos permita al menos a entender los usuarios que son más propensos a interactuar con afirmaciones falsas.
Queríamos entender si una polarización como en el consumo de contenido afecta a la estructura de las redes de amistad del usuario. En otro estudio, Viral Desinformación: El papel de la homofilia y la polarización que se encontró que la participación de un usuario en una narrativa específica va de la mano con el número de amigos que tienen un perfil similar.
Eso proporciona una visión importante sobre la difusión de rumores no verificados. Esto significa que a través de la polarización, podemos detectar donde están más probable que se propague rumores engañosos.
Pero no podríamos combatir tal mediante la difusión de una mejor información?
No. De hecho, hay evidencia de que esto sólo empeora las cosas.
En otro estudio, se encontró que las personas interesadas en una teoría de la conspiración son propensos a involucrarse más en la conversación cuando se expone a "desacreditar". En otras palabras, cuanto más la exposición al contraste de información a una persona se le da, más se refuerza su patrón de consumo. Desenmascarando dentro de una caja de resonancia puede ser contraproducente, y reforzar el sesgo de las personas.
De hecho, la desconfianza en las instituciones es tan alta y el sesgo de confirmación tan fuerte, que el Washington Post ha suspendido recientemente su columna semanal de descrédito.

¿Qué se puede hacer para luchar contra la desinformación?

La desinformación en línea es muy difícil de corregir. El sesgo de confirmación es muy potente. Una vez que la gente ha encontrado "pruebas" de sus puntos de vista, las versiones externas y contradictorias son simplemente ignorados.
Una de las propuestas para contrarrestar esta tendencia es soluciones algorítmicas impulsada. Por ejemplo, Google está desarrollando un puntaje de confiabilidad para clasificar los resultados de las consultas. Del mismo modo, Facebook se ha propuesto un enfoque impulsado por la comunidad donde los usuarios pueden bandera contenidos falsos para corregir el algoritmo de suministro de noticias.
Este tema es controvertido, sin embargo, ya que aumenta los temores de que la libre circulación de contenidos puede ser amenazada y los algoritmos propuestos podría no ser precisa o efectiva. A menudo los usuarios denuncian intentos de desacreditar la información falsa, como el vínculo entre la vacuna y el autismo, como actos de desinformación.

martes, 24 de febrero de 2015

Cómo cambian las personas más importantes según la cultura (de Wikipedia)

La Antropología Computacional revela cómo las personas más importantes de la historia varían según la cultura
Personas que hacen Data Mining en Wikipedia revela algunas diferencias sorprendentes en la forma en culturas orientales y occidentales identifican figuras importantes en la historia, dicen los antropólogos computacionales.
MIT Technology Review



El estudio de las diferencias entre las culturas se ha visto revolucionado por la Internet y el comportamiento de las personas en línea. De hecho, este fenómeno está detrás del nacimiento de la nueva ciencia de la antropología computacional.

Una ventana especialmente fructífera en las almas de diferentes culturas es Wikipedia, la enciclopedia en línea multitud de fuentes con más de 31 millones de artículos en 285 idiomas diferentes. Una categoría importante consiste en artículos sobre personas importantes. Y no cualquiera puede aparecer. Wikipedia tiene criterios específicos que las personas notables deben cumplir para la inclusión mérito.

Así que una pregunta interesante es cómo las personas más importantes varían de una versión de idioma de Wikipedia a otra. Es evidente que estas diferencias deben surgir de las fuerzas culturales que determinan la notabilidad (o notoriedad) en diferentes partes del mundo.

Hoy en día, Peter Gloor en el Instituto de Tecnología de Massachusetts en Cambridge y algunos compañeros dicen que han calculado las personas más importantes en cuatro versiones lingüísticas diferentes de Wikipedia-Inglés, alemán, chino y japonés. Y dicen diferencias importantes surgen, no sólo en los nombres que aparecen, pero en el más amplio de maquillaje de las listas.

El objetivo del equipo es crear una red social de todas las personas que aparecen en alguna versión lingüística de Wikipedia. Empiezan por la descarga de los artículos para todas las personas de un prominente total de 800.000 en la versión en Inglés, por ejemplo.

Ellos junto extraen las fechas de nacimiento y muerte y trabajan fuera que la gente estaba vivo al mismo tiempo. Posteriormente, se examinan los enlaces en cada página para determinar quien señala a quién. Esto permite Gloor y co que elabore una red de vínculos entre las personas que vivían en el mismo tiempo para cada año entre 3000 y 1950 antes de Cristo.

Por ejemplo, las personas más importantes en el año 0 incluyen el historiador griego y biógrafo Plutarco que está vinculado a los contemporáneos como Adriano, César y Nerón. Sin embargo, los vínculos de la página de Plutarco a personas que vivieron antes o después de él se ignoran.

Por último, Gloor y co clasifican las personas en estas redes de importancia utilizando el famoso algoritmo PageRank. Este es el mismo algoritmo que Google utiliza para clasificar las páginas en sus páginas de búsqueda. Su acción consiste en la clasificación de las entradas más altamente si son señaladas por otras entradas que también los primeros puestos.

Las listas resultantes son una lectura interesante. Las versiones más largas contienen 50 entradas pero incluso las primeras entradas revelan algunas diferencias interesantes entre las diferentes versiones lingüísticas.

Los cinco primeros en la versión en Inglés son George W Bush, William Shakespeare, el biógrafo victoriano Sidney Lee, Jesús y Carlos II de Inglaterra.

Los cinco primeros en alemán son: Adolf Hitler, Johan Goethe, Aristóteles, el Papa Benedicto XVI y Platón.

En la versión china son: Mao Zedong, a principios del siglo 20 emperador y general Yuan Shikai, el cantante taiwanés Jay Chou, el guerrero samurái del siglo 16 Oda Nobunaga y el gobernante japonés del siglo 16 Tokugawa Ieyasu.

Y en japonés: el biógrafo del siglo 20 Ikuhiko Hata, el gobernante japonés del siglo 16 Tokugawa Ieyasu, el guerrero japonés del siglo 16 Toyotomi Hideyoshi, Adolf Hitler y el guerrero samurai del siglo 16 Oda Nobunaga.

Estas listas muestran las personas más importantes de todos los tiempos en estas culturas, decir Gloor y co. Hay varias características notables que distinguen este del oeste. Por ejemplo, la parte superior 50 de la versión japonesa contiene sólo los guerreros y los políticos al igual que los 10 de la versión china. Por el contrario, cerca de la mitad de los diez primeros y top 50 son científicos, artistas o líderes religiosos en las versiones occidentales.

Del mismo modo que llama la atención es la prevalencia de cifras de otras partes del mundo. Los líderes no son en inglés constituyen el 80 por ciento de las entradas de la lista de idiomas Inglés. Por el contrario, sólo un puñado de líderes que no son chinos aparecen en la versión en idioma chino.

Un artefacto de la forma en que estas listas se compilan es el papel de los historiadores. Los biógrafos Sidney Lee y Ikuhiko Hata son tanto prominente debido a los enlaces desde sus páginas a los contemporáneos que han escrito sobre. Eso les da claramente una importancia exagerada en este ranking.

Sin embargo, la clasificación proporcionan una interesante visión de las fuerzas que dan forma al sentido cultural de importancia en todo el mundo. "Sondeo de la perspectiva histórica de muchos diferentes Wikipedias en lengua específica ofrece una vista de rayos X profundamente en los fundamentos históricos de la comprensión cultural de los diferentes países", dicen Gloor y co.

Fascinante trabajo y claramente hay más oro que se extrae de la cada vez más rico mineral culturales en la Wikipedia.

Ref: arxiv.org/abs/1502.05256 Cultural Anthropology Through the Lens of Wikipedia - A Comparison of Historical Leadership Networks in the English, Chinese, Japanese and German Wikipedia




domingo, 20 de julio de 2014

Usando el ARS para conocer comunidades en línea

La aplicación de análisis de redes sociales a las redes de comunicaciones en línea 
Por Claire Reinelt, Natalia Castañeda

Leadership Learning Community

¿Buscando aumentar su alcance e influencia en el espacio de los medios sociales? El Análisis de Redes Sociales (ARS), una metodología de investigación que se centra en "la cartografía y la medición de las relaciones y los flujos entre las personas, los grupos, las organizaciones, los ordenadores, direcciones URL y otras entidades de la información / conocimiento conectado" (Orgnet.com) puede ser la respuesta. Recientemente hemos asociado con la Fundación Robert Wood Johnson para explorar la manera de aplicar eficazmente el análisis de redes sociales para las estrategias de salud pública de comunicaciones en línea, cómo operan las redes de comunicación en Twitter y la blogósfera, y cómo identificar conexiones estratégicas e influyentes que puedan sustentarse en el tiempo para ampliar el alcance de los mensajes de salud pública. Este fue un proyecto innovador que produjo la información detallada y detallada sobre cómo utilizar SNA para crear una estrategia de campañas de comunicación, y queríamos compartir algunas de estas ideas con la comunidad - incluyendo recomendaciones específicas para identificar los mensajes clave, personas influyentes, y estrategias de participación.
Estábamos especialmente interesados ​​en la búsqueda de las conversaciones y personas influyentes en torno a los determinantes sociales de la salud, que según la Organización Mundial de la Salud, son "las circunstancias en que las personas nacen, crecen, viven, trabajan y envejecen, así como los sistemas de puestos en marcha para hacer frente a la enfermedad. Estas circunstancias están a su vez formadas por un conjunto más amplio de fuerzas:. Economía, la política social y la política "Estábamos interesados ​​en la búsqueda de las conversaciones que se enlazan el tema de la salud con otros temas relacionados, como los negocios, la planificación urbana, la alimentación y la educación .

Las principales preguntas que guían la exploración incluyen:
  • ¿Quiénes son los influyentes medios de comunicación social para los temas relevantes?
  • ¿Cómo pueden los individuos y grupos en la salud pública de ampliar su alcance e influencia entre las personas influyentes?
  • ¿Cómo son los diferentes actores de salud pública ubicados en el espacio de los medios sociales?
  • ¿Cuáles son los patrones de conversación de las personas más influyentes y los cubos?

¿Cómo que se inició?

Hacia el comienzo del proyecto, nos pasamos un montón de tiempo en el desarrollo de una estrategia de palabras clave que nos permitirá encontrar conversaciones en Twitter y blogs. Estas son algunas de las estrategias que utilizamos para desarrollar la estrategia de palabras clave:
Entrevistados actores de salud pública y personas influyentes
Conversación monitoreada arroyos para identificar hashtags
Herramientas usadas como Radian6 y SocialMention para probar la relevancia y la actividad de cada palabra clave
Se desarrolló una lista de más de 40 palabras clave y hashtags y lo utilizó tanto para el blog y Twitter canales
Abarcan una amplia gama de temas en nuestras palabras clave, desde la salud móvil (mHealth #), a las cuestiones relacionadas con la alimentación y la salud ('comida desierto') y el bienestar de las empresas (# co_health). La variedad de temas nos permitió encontrar personas influyentes que estaban dirigiendo múltiples conversaciones relacionadas, y también para ver las conexiones entre las personas y los temas en los dos canales.
Software de vanguardia apalancado y enfoques tecnológicos como NodeXL y Nexalogy para analizar las conversaciones y conexiones de redes sociales

Red de Twitter 

Hemos desarrollado una serie de mapas para ver donde había conversaciones relevantes que suceden en Twitter y cómo se conectan esas conversaciones. El siguiente ejemplo es un mapa de las agrupaciones generadas por las búsquedas de palabras clave relevantes para la salud urbana.



Al analizar el mapa vemos que diferentes conversaciones tienen diferentes formas. 'Las calles completas "," transitabilidad "y" crecimiento inteligente "son conversaciones distintas, pero están altamente interconectadas en este clúster. Hay un número importante de plazas de color amarillo, que representan a los usuarios de Twitter que utilizan dos o más palabras clave en sus tweets. Ellos en realidad están tejiendo juntos estas tres palabras clave o hashtags. Algunos ejemplos incluyen: @ Transportdata, que es una organización que se centra en la política de transporte y está tendiendo un puente entre "calles completas" y "crecimiento inteligente»; y otro ejemplo es @ jeromeoppenheim, que es un agente libre que cubre temas de política urbana y de puente entre "calles completas", "crecimiento inteligente" y "RWJF.

Por el contrario, 'saveplay' es una conversación altamente interconectado con personas retweeting y respondiendo a la otra, pero con muchos menos Bridgers a otros grupos (sólo dos). Y 'el acceso a alimentos sanos "tiene una muy distintos nodos más dispersas-forma muchos. Esto es menos de una conversación, y más de un grupo de mensajes de radiodifusión. RWJF parece estar impulsando este grupo, junto con @ naomistarkman (de civileats.com). Además, @ Healthyamerica1 tiene una posición única en este mapa, la cuenta está tendiendo un puente entre el "acceso a los alimentos saludables" y las conversaciones "calles completas".

Blogs influyente red

El siguiente mapa representa las conexiones entre las 112 principales editores (que sitios están ligando a que otros sitios en el conjunto de datos):



Tres grupos principales tópicos surgieron de la investigación blog: Política Urbana (planificación urbana, desarrollo urbano, etc) en azul, la alimentaria y de sanidad (incluyendo la discusión desierto alimentos), de color morado, y la salud general de rojo. Las discusiones sobre los blogs de Salud General (rojo) están muy conectados a los blogs de discusiones sobre la Política Urbana (azul). El cluster General de Salud tiene el mayor número de personas influyentes, incluyendo HealthPopuli.com, HealthAffairs.org, TheHealthcareBlog.com, y el cluster Cuestiones Urbanas tiene la segunda más alta, incluyendo Good.is, TreeHugger.com y WorldChanging.com. Los blogs que discuten los temas de alimentación y salud (morado) no están muy conectados con los otros dos grupos principales (Salud General y urbanas). Algunos sitios, como Civileats.com, están tratando de llevar los temas de la alimentación a la vanguardia de las conversaciones de salud urbanos y generales. Además, si se mira de cerca se puede ver que hay una oportunidad para fortalecer los blogs en este espacio, ya que no hay un líder de conducir las discusiones.

Algunos de los blogs que estudiamos tienen posiciones notables en el sistema de blogs que hemos examinado durante el estudio, tales como Wonkroom.thinkprogress.org, que está tendiendo un puente entre la salud y grupos urbanos. Sin embargo, no un montón de sitios estás enlazando a este blog, lo que representa una oportunidad para aprovechar este sitio como un conector.

Algunas recomendaciones


Sobre la base de los mapas de Twitter y blogs, desarrollamos algunas recomendaciones para aquellos de ustedes que están interesados ​​en trabajar en conjunto con los influyentes medios de comunicación social para aumentar su alcance y el impacto de sus mensajes:

Aumentar la visibilidad

El primer paso es identificar las palabras clave relevantes, y luego identificar a los usuarios. Una vez que usted los sigue, que es probable que siga de nuevo. Después de controlar sus mensajes y Retweet ellos, son más propensos a seguir de vuelta e incluso Retweet algunos de sus contenidos. Así que mientras tanto, la atención debe centrarse en continuar para generar contenidos de calidad.

Conéctate con personas influyentes

Se identificaron una serie de "hubs" importantes "y Bridgers." Animamos a las organizaciones conectarse con los ejes - personas que están altamente conectados en la red, tales como el bien y el @ @ Urbandata; y con Bridgers - personas que trabajan en múltiples conversaciones, como @ Ithealthnonprof, que está discutiendo cuestiones en torno a la "salud rural", "salud urbana" y "salud móvil '.

Algunas de las personas influyentes de la blogosfera son: centros que están discutiendo activamente múltiples problemas (como Good.is) y Bridgers (como Wonkroom.thinkprogress.org) que se conectan clusters. Otros ejemplos incluyen TreeHugger.com, Futurity.org, Colorlines.com, Civileats.com y Switchboard.nrdc.org.

Dar prioridad a las conversaciones

En Twitter, estas son algunas de las conversaciones que recomendamos participar activamente en, ya que parecen ser los más activos y relevantes: "calles completas", "crecimiento inteligente", "salvar juego", "comida desierto", "escuelas saludables" , 'co_health'. Co_health es un ejemplo de comunidad que está en la intersección de la salud y la conversación de negocios, centrado en el bienestar de la empresa.

En la blogosfera, hay una oportunidad para contribuir al fortalecimiento de la categoría de alimentos (ya que los blogs que cubren esta no están conectados a otros grupos, por lo que tienen poca visibilidad e influencia). Esto significaría discutir este tema de forma activa en los canales de su organización, así como llegar a los principales blogs de esa categoría (pidiendo contribuir blogs invitados sobre temas de interés, etc), y participar en las conversaciones que están sucediendo en otros blogs / comunidades que identificamos. Asimismo, el área temática urbana fue bastante activo, particularmente conversaciones en torno a la posibilidad de caminar y el uso de bicicletas.

Participar en eventos relevantes

Participar en los eventos relevantes, en este caso TED y SXSW (South by Southwest), es una buena estrategia. Al participar en la discusión y con el hashtag de conferencia, puede mejorar su visibilidad en esa comunidad y atraer a más seguidores.

Aumentar la participación de la comunidad

En general (tanto en Twitter y blogs), se recomienda el aumento de la comunidad o de la participación de la audiencia por el cierre de triángulos con regularidad, lo que significa introducir a las personas que están conectadas a ellos, pero no necesariamente conectadas entre sí. Esto ayudará a fortalecer el núcleo de la red. Según Cultiva sitio web, la definición de tejer la red es "hacer introducciones mediante la descripción de las fortalezas de cada uno, elija la alineación y el beneficio mutuo, nombre pequeño primer paso."

Además, seguir acogiendo seminarios y reuniones para compartir ideas y contenidos (incluso asociarse con personas influyentes para albergar algunas de esas reuniones), aprovechando el blog de su organización y cuentas de Twitter para hacer preguntas y solicitar comentarios sobre las ideas y proyectos, y para compartir aprendizajes con su comunidad.

Creemos SNA es un enfoque de evaluación altamente prometedora para encontrar personas influyentes en las redes de comunicación, pero hay muchas preguntas que quedan, como

  • ¿Cuál es el contexto de la influencia de los actores clave?
    • En el proceso de identificación de los factores de influencia en el espacio de blogs relacionados con la salud que nos dimos cuenta de que los blogs y los usuarios de Twitter pueden variar significativamente de los sitios de nicho para los jugadores de organización más establecidos. Sería interesante explorar más a fondo la relación entre los tipos de usuarios, los tipos de mensajes, y los tipos de actividades que se dedican pulg ¿Cómo difieren de influencia en el modo en que utilizan este medio de comunicación? ¿Cuáles son los recursos y factores de influencia la información de valor?
  • ¿Cuál es el contenido de las conversaciones e interacciones?
    • Otro nivel de análisis se centrará en la comprensión de la naturaleza de las conversaciones acerca de los factores sociales y económicos que afectan a la salud los resultados-¿Cuáles son los mensajes clave que se están comunicando? ¿Estos mensajes ayudan a catalizar conversaciones e interacciones entre sectores?

¿Cuáles son algunas otras interesantes aplicaciones de SNA? ¿Qué otras herramientas y métodos ha utilizado para analizar las conexiones en los canales de medios sociales? Esperamos con interés escuchar sus preguntas e ideas!

Referencias

http://www.cdc.gov/socialdeterminants/
http://www.orgnet.com/sna.html

lunes, 26 de mayo de 2014

Similaridad de coseno en blogs

Prediciendo temas centrales en un Blog Corpus desde una Perspectiva de Redes 
Srayan Datta
http://arxiv.org/abs/1405.2386

En centrado en el contenido de Internet de hoy en día, los blogs se están convirtiendo cada vez más popular e importante desde una perspectiva de análisis de datos. De acuerdo a Wikipedia, había más de 156 millones los blogs públicos en Internet a partir de febrero de 2011. Los blogs son un reflejo de nuestra sociedad contemporánea. Los contenidos de las diferentes entradas del blog son importantes desde las perspectivas sociales, psicológicos, económicos y políticos. El descubrimiento de los temas importantes en la blogosfera es un área que todavía necesita mucho explorar. Tratamos de llegar a un procedimiento utilizando medidas probabilístico modelado tema y centralidad de red, que identifica los temas centrales en un corpus blog.

viernes, 16 de mayo de 2014

Sen (2014): Los superdifusores de información en redes

La ciencia emergente de superspreaders (y cómo saber si usted es uno de ellos)
Nadie ha descubierto la manera de detectar los esparcidores más influyentes de información en una red real. Ahora que parece que va a cambiar con consecuencias importantes, sobre todo para los propios superspreaders.




¿Quiénes son los esparcidores de información más influyentes en una red? Esa es una pregunta que los vendedores, los bloggers, los servicios de noticias e incluso los gobiernos les gustaría contestar. Entre otras cosas porque la respuesta podría proporcionar formas de promover productos de forma rápida, para aumentar la popularidad de los partidos políticos por encima de sus rivales y para sembrar la rápida difusión de noticias y opiniones.

Así que no es sorprendente que los teóricos de redes han pasado algún tiempo pensando en la mejor manera de identificar a estas personas y comprobar cómo la información que reciben podría extenderse alrededor de una red. De hecho, se han encontrado una serie de medidas que punto los llamados super difundidores (superspreaders), personas que difunden información, ideas o incluso la enfermedad de manera más eficiente que cualquier otro.

Pero hay un problema. Las redes sociales son tan complejos que los científicos de la red no han sido capaces de poner a prueba sus ideas en el siempre ha sido muy difícil de reconstruir la estructura exacta de las redes de Twitter o Facebook, por ejemplo - que el mundo real. En su lugar, han creado modelos que imitan a las redes reales de ciertas maneras y probado sus ideas sobre estos en su lugar.

Pero hay cada vez más pruebas de que la información no se propaga a través de redes reales de la misma manera como lo hace a través de estos idealizados queridos. La gente tiende a transmitir la información sólo cuando están interesados ​​en un tema y cuando están activos, factores que son difíciles de tener en cuenta en un modelo puramente topológica de una red.

Así que la pregunta de cómo encontrar los superspreaders permanece abierta. Eso parece que va a cambiar gracias a la obra de Sen Pei en la Universidad de Beihang en Pekín y algunos amigos que han realizado el primer estudio de superspreaders en redes reales.

Estos muchachos han estudiado la forma en los flujos de información en torno a las diversas redes que van desde la red de blogs Livejournal a la red de la publicación científica en la Sociedad Americana de Física de, así como en los subgrupos de las redes de Twitter y Facebook. Y han descubierto que el indicador clave que identifica superspreaders en estas redes.

En el pasado, los científicos de la red han desarrollado una serie de pruebas de matemáticas para medir la influencia que tienen los individuos sobre la difusión de información a través de una red. Por ejemplo, una medida es simplemente el número de conexiones de una persona tiene a otras personas en la red, una propiedad conocida como su grado. La idea es que las personas más altamente conectados son los mejores en la difusión de información.

Otra medida utiliza el famoso algoritmo PageRank que Google desarrolló para el ranking de páginas web. Esto funciona mediante la clasificación de alguien más altamente si están conectados a otras personas de alto rango.

Luego está "centralidad de intermediación", una medida de la cantidad de los caminos más cortos a través de una red de pasar a través de un individuo específico. La idea es que estas personas son más capaces de inyectar información en la red.

Y, finalmente, es una propiedad de los nodos de una red conocida como su k-núcleo. Esto se determina mediante la poda de forma iterativa las periferias de una red para ver lo que queda. El k-núcleo es el paso en el que dicho nodo o persona está podados desde la red. Obviamente, los más conectados sobrevivir a este proceso, el más largo y tener la puntuación más alta de k-núcleo.

La pregunta que Sen y colegas dispuso a contestar era cuál de estas medidas mejor escogidos fuera superspreaders de información en las redes reales.

Comenzaron con LiveJournal, una red de blogs en ​​los que los individuos mantienen listas de amigos que representan vínculos sociales con otros usuarios de LiveJournal. Esta red permite a la gente a volver a publicar la información de otros blogs y utilizar una referencia de los enlaces de vuelta al post original. Esto permite que Sen y co para recrear no sólo la red de vínculos sociales entre los usuarios de LiveJournal, sino también la forma en que la información se transmite entre ellos.

Sen y colegas recogen todas las entradas del blog de ​​febrero 2010 a noviembre 2011, un total de más de 56 millones entradas. De ellos, unos 600.000 contienen enlaces a otros mensajes publicados por los usuarios de LiveJournal.

Los datos revelan dos importantes propiedades de difusión de la información. En primer lugar, sólo unos 250.000 usuarios participan activamente en la difusión de información. Esa es una pequeña fracción del total.

Más importante aún, se encontraron con que la información no siempre se difunden a través de la red social. El encontró que la información podría extenderse entre dos usuarios de LiveJournal a pesar de que no tienen ninguna relación social.

Eso es probablemente porque encuentran esta información fuera del ecosistema LiveJournal, quizás a través de búsquedas en la web o/a través de otras redes. "Sólo 31,93 % de los puestos de propagación se puede atribuir a los vínculos sociales observables", dicen.

Eso está en marcado contraste con los supuestos detrás de muchos modelos de red social. Estos simulan la forma en los flujos de información, asumiendo que viaja directamente a través de la red de una persona a otra, como una enfermedad que se transmite por contacto físico.

El trabajo de Sen y colegas sugiere que las influencias fuera de la red son cruciales también. En la práctica, la información a menudo se extiende a través de varias fuentes aparentemente independientes dentro de la red al mismo tiempo. Esto tiene importantes implicaciones para la forma en superspreaders se pueden observar.

Sen y compañía dicen que una persona grados -el número de otras personas que él o ella están conectados no- es un buen predictor de la difusión de la información como los teóricos han pensado. "Nos parece que el grado de que el usuario no es un indicador confiable de influencia en todas las circunstancias", dicen.

Lo que es más, el algoritmo PageRank es a menudo ineficaz en este tipo de red también. "Contrariamente a la creencia común, aunque PageRank es eficaz en el ranking de páginas web, hay muchas situaciones en las que no puede localizar superspreaders de información en la realidad", dicen.

Por el contrario, la propiedad del k-núcleo es relativamente bueno en encontrar superspreaders. "Nos encontramos constantemente que los mejores esparcidores están situados en el k-núcleo", dicen.

Lo que es interesante aquí es que Sen y colegas encontraron resultados similares cuando examinaron la red de divulgación científica en revistas de la Sociedad Americana de Física, así como en los subgrupos de las redes en Twitter y Facebook. Los usuarios de estas redes diferentes mostraron el mismo comportamiento de difusión de información.

Pero antes de que la conclusión de que el problema de encontrar superspreaders está ahora resuelto, hay un factor adicional que debe tenerse en cuenta. La medida k-núcleo es una propiedad global de la red sólo puede ser calculada teniendo en cuenta la estructura de toda la red.

Eso no es muy conveniente cuando se trata de grandes redes, como Facebook y Twitter, que son también los más valiosos para los vendedores, políticos, etc.

Así Sen y colegas han desarrollado todavía otra medida de la influencia que funciona casi tan bien como la medida k-núcleo, pero es mucho más fácil de calcular en el uso de subconjuntos de toda la red.

Su método consiste en sumar los grados de los vecinos más cercanos de una persona y decir que esto es casi tan bueno como la puntuación de k-núcleo para predecir superspreaders.

En otras palabras, tomar cada uno de sus amigos más cercanos, cuente el número de conexiones que tienen y luego añadir a todos ellos juntos. Si sus amigos más cercanos están altamente conectadas, lo más probable es que usted es un superspreader.

Si es así, hay algunas personas que les gustaría llegar a conocerte mejor -vendedores, políticos, gobiernos, etc. Con superspreaders ser tan valiosas materias primas, lo que será interesante ver cómo evoluciona el mercado para ellos y sus servicios.

Ref:  arxiv.org/abs/1405.1790 : Searching For Superspreaders Of Information In Real-World Social Media

MIT Technology Review

jueves, 18 de octubre de 2012

El libro de la red política 2012


2012 Political Book Network

I have been mapping political book networks since before 2004 U.S. presidential election. These network maps are like a social graph of books.   The data is gathered from Amazon.com -- their list of top political books.  Two books are linked if they were often bought together, or by the same buyer.  These are also-bought pairs -- people who bought this book also bought that book.

During the the 2008 election the political book map reflected the deep divide in the country between conservative (RED) voters and liberal (BLUE) voters.  There were no connections, nor any intermediaries between red and blue books -- each cluster was completely closed off to the other. There was a separate cluster of people reading books on the then new candidate -- Obama, but they were not interested in reading/purchasing other political books (upper left corner of network map below).

2008 Political Book Network Map


I expected a similar pattern for 2012 -- a big chasm between right and left.  I thought the map would show each group honing up on their side's talking/debating points and ignoring books of non-conforming opinions.  I was surprised, the two clusters in October 2012 were connected by several books!  The hub in the center of the network, with spokes to many blue and red books, is The Price of Politics by Bob Woodward.  Woodward is viewed as a center-right journalist, and this book is about politics in general, so it makes sense that both sides would be reading his usually excellent prose.  No Easy Day, by one of the Navy Seals that took out bin Laden reads more like a novel, than a history book, attracting readers from all political persuasions.

The third bridging book was a surprise! The Little Blue Book is intended for a progressive audience -- it is a handbook for how to argue effectively with the right wing.  So, you would expect it to be firmly in the center of the dense blue cluster, right?  Wrong!  It has both blue and red readers!  I checked all editions of the books -- hardback, paperback and Kindle.  For the Kindle version, The Little Blue Book was connected (also bought) with other blue books, as expected.  It was with the paperback edition where I was surprised -- 4 of the first 10 also-bought books were red books!  Amazon shows their also-boughts by decreasing count/volume, therefore there were many instances of readers of certain red books were buying The Little Blue Book.  Why is this so?  Maybe the right wing is trying to understand the left wing and reading their blue handbook -- similarly to how they read the far left book Rules for Radicals during the 2008 election campaign.  

2012 Political Book Network Map


This year we also have books about the candidates -- their biographies and positions on major issues.  Obama has the same set of books as last election, Romney has his No Apology series, and Romeny's running mate is written up in the Young Guns book.  Potential voters appear to be reading books about both of the candidates -- Amazon readers are buying books about Romney and Obama together!  See books in upper left frame (2012 Candidate biographies) above.  

Another pattern is different in 2012 than in 2008. Now, people reading about the candidates, are also reading other political books.  The pattern is positive for Romney -- people reading about him are reading other red books -- not so, for Obama.  People reading his positive biographies and position books are also reading polemics attacking Obama.  The most influential anti-Obama book in the above network is Obama's America -- it is read by potential voters who are reading about both Obama and Romney.  See the link patterns in the upper left corner of the above diagram.

Even though the two book networks are connected, we still have a polarized voter base -- those are two strongly defined communities.  Running one of the network metrics from InFlow software, reveals two tightly defined clusters.  The E/I Ratio (External/Internal) is near -1.0 for both the blue and red groups indicating two exclusionary communities.  Polarization persists in America.

Can we use these network maps to predict the election?  Probably not.  The main insight I get from these maps is that the 2008 election provided a more clear cut choice for voters.  Although supporters of each candidate today would also say the choice is clear this time around (they always say that), the data does not support that. This time some readers are examining books from both sides... are these that small percentage of undecided voters who will likely decide this close election?  I bet each campaign would love to know who these Amazon readers are... and they may want to know each other!