Mostrando entradas con la etiqueta análisis de contenido. Mostrar todas las entradas
Mostrando entradas con la etiqueta análisis de contenido. Mostrar todas las entradas

martes, 18 de junio de 2019

Cómo, con qué, para qué: Herramientas para investigar datos de Twitter

Uso de Twitter como fuente de datos: una visión general de las herramientas de investigación en redes sociales (2019)

LSE Impact Blog




Twitter y otras plataformas de redes sociales representan un recurso grande y en gran parte sin explotar para datos y pruebas sociales. En esta publicación, Wasim Ahmed actualiza su serie recurrente en el Blog de Impacto, para ofrecerle los últimos desarrollos en métodos y metodologías digitales para investigar Twitter y otras plataformas de medios sociales.

Esta publicación se basa en las ediciones de 2015 y 2017 de esta publicación, captura tendencias y eventos clave que están configurando la investigación en redes sociales para los científicos sociales y proporciona una colección de métodos y herramientas de investigación para el análisis de datos de redes sociales.

Desde la edición de 2017 de esta publicación de blog, he visto usos aún más únicos e interesantes de los datos de las redes sociales en una amplia variedad de disciplinas de investigación, como sociología, informática, medios y comunicación, ciencia política e ingeniería, solo por mencionar pocos. Las plataformas de medios sociales generan una gran cantidad de datos diariamente sobre una variedad de temas y, en consecuencia, representan una fuente clave de información para cualquiera que busque estudiar la sociedad del siglo XXI.

Twitter sigue siendo la plataforma más popular para la investigación académica, ya que aún proporciona sus datos a través de una serie de interfaces de programación de aplicaciones (API). En contraste, las consecuencias de la "violación de datos" de Cambridge analytica han llevado a ciertas plataformas de redes sociales a limitar los datos proporcionados a través de sus interfaces de programación de aplicaciones. Sin embargo, aunque puede que no sea posible obtener datos de todas las plataformas de redes sociales, aún es posible realizar una investigación cualitativa y cuantitativa, como entrevistas y encuestas, con miembros de comunidades en línea.

Los estudios en redes sociales se pueden encuadrar a partir de una amplia variedad de teorías, construcciones y marcos conceptuales de una amplia variedad de disciplinas y recomendaría echar un vistazo a este documento: Social media research: Theories, constructs, and conceptual frameworks, que resume muy bien algunos de estos enfoques.

También hay una serie de enfoques de investigación que se pueden utilizar como Netnography y Digital Ethnography, que proporcionan marcos para realizar investigaciones en el mundo en línea. La netnografía, por ejemplo, puede basarse en la descarga de datos directamente desde una plataforma de redes sociales, anotando observaciones personales de una comunidad en línea y entrevistando a usuarios de redes sociales. Además, también hay una serie de métodos específicos para el análisis de datos de redes sociales que se resumen en la Tabla 1 a continuación.



Tabla 1: Resumen de los métodos de investigación

La Tabla 2 a continuación proporciona una descripción general de las herramientas para recuperar datos de redes sociales


Tabla 2: Una revisión de las herramientas para 2019
*Algunas herramientas pueden permitir el acceso a otras plataformas y la capacidad de importar sus propios datos.

Recientemente, también se ha vuelto cada vez más difícil para los académicos acceder a datos históricos de Twitter con una serie de servicios para académicos que están llegando a su fin. Esto ha dado lugar a servicios como los proporcionados por ScrapeHero, que permiten a los usuarios obtener datos históricos de Twitter de forma gratuita mediante el uso de web scraping. Sin embargo, esta forma de recuperar Twitter no es recomendable.

Para investigar otras plataformas en Internet, como foros web, blogs y otras plataformas de medios sociales, existen herramientas como Scrape Storm, que es un raspador de web visual basado en la inteligencia artificial y pretende poder recuperar datos de casi cualquier plataforma.

También hay una serie de aplicaciones avanzadas de análisis de datos y estadísticas que se pueden usar para analizar datos de redes sociales, como:

Estos paquetes deben investigarse al decidir qué aplicación se utilizará para un proyecto. También me gustaría mencionar la lista de herramientas de Iniciativas de Métodos Digitales, y la lista de herramientas de la Universidad Ryerson de su Laboratorio de Medios Sociales. Para recuperar datos de Twitter también vale la pena revisar el DMI-TCAT (gratis). SAGE Ocean publicó recientemente una revisión adicional de 100 herramientas de redes sociales.

Para el análisis de imágenes, recomendaría revisar la visión de Google Cloud AI y también existen herramientas como Instaloader que le permiten descargar fotos de Instagram de cuentas públicas. Se realizó un estudio realmente interesante en Instagram y se analizó el hashtag #CheatMeal utilizando el análisis de contenido temático y se puede acceder aquí.

Otro campo en rápido desarrollo de la investigación en redes sociales se centra en la ética. Es importante realizar una investigación ética en redes sociales y recientemente publiqué un capítulo de libro de acceso abierto, que examina el uso de Twitter como fuente de datos y brinda una descripción general de los desafíos éticos, legales y metodológicos. Se puede acceder al capítulo aquí.

Debido a una serie de solicitudes, también he empezado a realizar eventos de capacitación regulares (consulte la lista aquí) con la posibilidad de asistencia virtual. El primero de estos eventos se llevó a cabo en la Escuela de Economía y Ciencias Políticas de Londres el 17 de mayo de 2019 y nuestro hashtag # SMRM19 contiene una gran cantidad de material informativo, ya que el evento fue tweeteado en vivo.

martes, 25 de septiembre de 2018

Análisis de marcas en Twitter con NodeXL

Cómo realizar un análisis de marca de redes sociales de Twitter utilizando NodeXL


NodeXL


La ciencia de la red proporciona métodos poderosos para resolver problemas centrales en el espacio de marketing de redes sociales. Las visualizaciones y el análisis de las redes sociales son métodos útiles para identificar y evaluar rápidamente a personas influyentes y contrastar la forma de la conversación en torno a diferentes temas y marcas.



Hasta hace poco, estos métodos requerían habilidades avanzadas de desarrollo de software, pero las herramientas de análisis de redes están evolucionando y ahora están surgiendo soluciones de señalar y hacer clic que pueden identificar rápidamente subgrupos y segmentos de mercado y describir los temas y los recursos de alto valor en cada uno. Los conceptos clave de red como "betweenness" y "centrality" pueden proporcionar información que va más allá de los conteos de cosas como me gusta, seguidores o respuestas.

Una perspectiva de red mira a las redes sociales como una "colección de conexiones" y revela la forma emergente de la multitud. La investigación de Pew ha demostrado que hay un pequeño conjunto de estructuras de redes sociales que comúnmente aparecen en muchas formas de plataformas de medios sociales que permiten la "respuesta".

Los patrones de centro y rayo divididos, unificados, fragmentados, agrupados y entrantes y salientes son comunes en las redes sociales. Estas formas pueden informar las estrategias de las redes sociales al reconocer la forma actual y posiblemente deseada de la conversación al tiempo que proporcionan nuevos KPI para guiar la transición.

Esta es una guía paso a paso para crear un análisis de marca de redes sociales con NodeXL Pro.

Cada marca involucrada en las redes sociales necesita
  • Identifica los jugadores clave en su ecosistema social.
  • Realice análisis de la competencia e inteligencia de campaña.
  • Generar identificación de campaña - [filtrando el ruido, luego identificando + analizando tweets con la mayor interacción, o mediante hashtag (s) específicos]
  • Produzca información del contenido, para contenido / marketing social, para saber qué temas son de mayor interés para orientar la creación de contenido relacionado y relevante

NodeXL Pro (el complemento Network Discovery Discovery and Exploration para la conocida hoja de cálculo de Microsoft Office Excel ™) de la Social Media Research Foundation puede analizar sistemáticamente las redes sociales para revelar información procesable. En esta guía usaremos NodeXL Pro para mapear temas en Twitter, incluidas las discusiones sobre una marca, producto y problema.

NodeXL se puede utilizar para explorar tres mapas distintos de red de medios sociales que utilizan diferentes perspectivas de datos para obtener una variedad de valiosos conocimientos:


Red ego Red de marca Red de comunidades
Creado de tweets publicados por la cuenta de la marca. Basado en todas las menciones de la marca en los tweets actuales. Basado en los tweets actuales conteniendo el nombre de la cuenta de la marca.


Perspectivas de datos de red de Twitter

Tipo de red Datos recolectados Información de la red Información de contenido
Ego red 1.0 grado Tweets publciados en el cuenta de la marca o datos de seguidor Usuarios altamente conectados por el pondedaro del enlace Actividad de Tweet, estrategia de contenido, campañas de hashtag
Ego red 2.0 grado Tweets publicados por usuarios/amigos altamente conectados Posición en la red, densidad, influenciadores y agrupamientos Tópicos relacionados, hashtags, URLs
Red de industria Tweets publicados por una lista seleccionada de competidores Métricas relacioandas con el análisis de redes ego Tópicos relacionados con la industria, items mas mencionados
Red de comunidades Tweets actuales conteniendo el nombre de la cuenta de la marca Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados
Red de marca Tweets actuales mencionando el nombre de la marca Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados
Red discursiva Tweets actuales acerca del tópico Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados

Egored


(NodeXL>Data>Import > From Twitter Users network)



Acerca de: explore una red basada en el material publicado por la cuenta de marca oficial con el importador de la "red de usuarios de Twitter". Los últimos 3.200 tweets (incluidos los retweets y las respuestas) están disponibles en la API pública de Twitter, que es suficiente para revelar contenido reciente y estrategias de red.

Información de la red: ¿Cuáles son las cuentas de usuario más importantes mencionadas en los tweets, retweets y respuestas de la cuenta de marca? ¿Qué tan fuertes son las conexiones hacia esos usuarios?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados? ¿Cuál es el patrón de tiempo de los tweets? ¿Cuántos retweets y me gusta se ganaron?

Red comunitaria


(NodeXL>Data>Import > From Twitter Search network: e.g. @Tesla)



Acerca de: explore los tweets actuales y las conversaciones de los usuarios de Twitter que hablan directamente con la cuenta de marca con el importador de la "red de búsqueda de Twitter". Cada análisis de red es una instantánea única e histórica de las discusiones con la cuenta de marca. Los datos pueden contar historias interesantes sobre la marca, las campañas de marketing o la satisfacción del cliente.

Información de la red: ¿Qué usuarios de Twitter desempeñan un papel importante en las interacciones con la cuenta de marca? ¿Los grupos de usuarios forman grupos alrededor de ciertos temas o hashtags? ¿Cómo se ven estos clusters?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados en toda la red y dentro de los clústeres detectados? ¿Cuál es el sentimiento?


Red de marca


(NodeXL>Data>Import > From Twitter Search network: e.g. Tesla)

Acerca de: explorar quién está hablando actualmente sobre la marca. Esta recopilación de datos amplía la red de la comunidad y mostrará la gama completa de menciones de la marca.

Información de la red: ¿Qué cuentas de usuario juegan un papel importante en las conversaciones sobre la cuenta de marca? ¿Los grupos de usuarios forman clusters? ¿Cómo se ven estos clusters?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados en toda la red y dentro de los clústeres detectados? ¿Sentimiento? ¿Patrón de tiempo?


¿Qué hay en un libro de trabajo NodeXL Pro?




Una red social completa y un análisis de contenido pueden contener hasta 14 hojas de trabajo que se crean durante el proceso de análisis automatizado.



Los enlaces, vértices y hojas de trabajo del grupo están entrelazados entre sí y también con el panel de grafo.

Cada libro de trabajo contiene información importante sobre una faceta o dimensión de una red:

  • La hoja de trabajo Edges muestra las conexiones entre usuarios de Twitter en base a tweets, menciones y respuestas. Además de los contenidos de los tweets, esta hoja de trabajo también proporciona metadatos como la cantidad de retweets, me gusta, fecha de tweet, idioma y dispositivo de origen. Además, se han creado columnas que muestran los resultados del análisis de sentimiento.
  • La hoja de trabajo Vertices proporciona detalles sobre cada usuario mencionado en la hoja de trabajo de enlaces y se puede ordenar por varias métricas de red para llevar las cuentas más influyentes a la parte superior de la tabla. Twitter también proporciona métricas como Seguido, Seguidores, Tweets, Favoritos, Descripción, Ubicación, Sitio web y Fecha de incorporación en Twitter, que pueden ser útiles para un análisis posterior. Además, los conteos de sentimiento de la hoja de trabajo de enlaces se resumen para cada usuario.
  • La hoja de trabajo de Groups contiene detalles sobre cada grupo o clúster en la red, como el número de usuarios y enlaces en un grupo, la densidad de la red del grupo, los elementos de contenido superior y la opinión del grupo.
  • La hoja de trabajo de Overall metrics informa las medidas de resumen que definen las dimensiones principales de una red, como la cantidad de usuarios y las conexiones entre ellos.
  • La hoja de trabajo Twitter Search Network Top Items contiene un resumen formateado del análisis de contenido que muestra las URL, los hashtags, las palabras, los pares de palabras y los usuarios que se mencionan con más frecuencia en cada grupo y la red en general.
  • La hoja de trabajo Time Series contiene un gráfico que informa la actividad de tweets en la red durante minutos, horas, días o meses al analizar la columna de fecha de Tweet en la hoja de trabajo de enlaces.



Estudio de caso: Tesla

Todos los datos relacionados con este análisis se pueden encontrar en la Galería de grafos NodeXL en #nxltsl

Explore la egored

Con el importador de la red de usuarios de Twitter, exploraremos la red del ego de la cuenta de marca de Tesla en Twitter. Eso significa recopilar y analizar los tweets anteriores publicados por la cuenta de marca en sí.

La estructura de red out-hub-spoke resultante muestra todos los usuarios de Twitter conectados a través de tweets por la cuenta de marca Tesla.

Cómo crear un análisis de red de ego:

  • Paso 1: abre NodeXL Pro. 
  • Paso 2: descargue e importe este archivo de opciones de NodeXL Pro para utilizarlo en la automatización (¿cómo automatizar?) 
  • Paso 3: Abra el importador de datos de la red de usuarios de Twitter: Import > From Twitter users network
  • Paso 4: ingrese el controlador de Twitter que prefiera y seleccione las opciones como se muestra en la imagen.





  • Paso 5: haz clic en Aceptar y espera a que termine la automatización. El libro resultante de NodeXL Pro se ve así:





Puede encontrar un resumen del informe y el archivo NodeXL Pro completo:

https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141201

Antes de profundizar en los datos, es útil echar un vistazo a la hoja de cálculo de análisis de series de tiempo que muestra la actividad de tweets de la cuenta de marca:

Puede ver que los últimos 3.200 tweets se remontan a febrero de 2014: un cambio importante en la actividad de tweets puede observarse después de agosto de 2014. Y también la producción anual ha disminuido de un año a otro: de 541 tweets por año en 2015 a 174 en 2017.

Información de la red:


En los últimos 3.200 tweets, Tesla se ha conectado a 1.913 (= columna fuera de término en la hoja de cálculo de vértices) de otras cuentas de Twitter, lo que arroja una proporción de 0,60 usuarios conectados por tweet, este valor es 0,44 si solo se consideran los 500 tweets anteriores. Este valor se considera promedio en comparación con otras marcas, p. Toyota (0.88), Ford (0.78), Nissan (0.42), Volkswagen (0.01).

La columna de ponderación de enlace en la hoja de cálculo de enlaces muestra la clasificación de la red de los usuarios principales de Twitter conectados. Este ranking no es sorprendentemente dirigido por Elon Musk, seguido por otras cuentas de Tesla y cuentas relacionadas con la industria:




Estos usuarios conectados principales se consideran nodos importantes de la red circundante de la cuenta de marca.

Análisis de red extendido: la red circundante

Para obtener una visión más profunda de las redes que rodean una cuenta de marca, agregue los principales usuarios conectados al importador de la "Twitter Users Network". De esta forma podemos averiguar en qué medida se hace referencia a la marca por sus propias cuentas en red.

Asegúrese de limitar la cantidad de tweets que se recopilarán, más tiempo obtendrá su lista. Terminar con 10k tweets en general es siempre una buena medida para el manejo de datos. Puede usar el mismo archivo de opciones que antes.

Visite esta página para ver las 23 cuentas principales conectadas por Tesla: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141965

Información del contenido:

Todos los tweets y las estadísticas de tweets están disponibles en la hoja de cálculo de enlaces. P.ej. al ordenar los enlaces por conteo de retweets de columnas y conteo favorito, podemos identificar los tweets más o menos populares:

Tweet más favorito del 16 de noviembre de 2017: la mayoría de los tweets retuiteados a partir del 25 de abril de 2015:





Varias clasificaciones de contenido están disponibles en la hoja de cálculo Elementos principales de la red, como hashtags incrustados superiores, URL, palabras y pares de palabras. Aquí está el ranking de hashtags usados con mayor frecuencia que reflejan las principales campañas de marketing de la compañía durante los últimos años:

Principales Hashtags in eweet en el grafo entero:

[60] goelectric
[32] modelx
[23] model3
[20] tesla
[14] drivefree
[12] meetmodelx
[10] wallpaperwednesday
[9] teslacharging
[7] supercharger100
[6] earthday

Análisis de red extendido: análisis de principales hashtag

Utilice el importador de "Twitter Search Network" para explorar las conversaciones actuales sobre estos hashtags principales. Aquí hay un análisis completo de la red NodeXL Pro en el hashtag # model3: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=140941

Explore la red de la comunidad


La red comunitaria actual de una marca se explora con el importador de "Red de búsqueda de Twitter" al ingresar el nombre de la cuenta de marca (incluido el @) en la barra de búsqueda del importador.

Con una cuenta de marca popular en el centro de este análisis, los mapas de red resultantes suelen estar dominados por la estructura de red en el centro y el radio ya que las marcas no hablan mucho, pero al mismo tiempo se les habla mucho.

Cómo crear un análisis de red comunitaria:


Paso 1: descargue e importe este archivo de opciones de NodeXL Pro para utilizarlo en la automatización (¿cómo automatizar?)

Paso 2: abra el importador de datos de la red de búsqueda de Twitter: Import > From Twitter Search network

Paso 3: ingrese @Tesla en la barra de búsqueda y seleccione las opciones como se muestra en la imagen.




Paso 4: haz clic en Aceptar y espera a que se complete la automatización. El libro de trabajo NodeXL Pro resultante puede verse así y ahora está listo para una mayor exploración:



Puede echar un vistazo al informe y descargar el archivo de datos aquí: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141668

Información del contenido


El mapa de red creado arriba muestra la visualización de 9,481 tweets recogidos el 8 de febrero de 2018, dos días después del lanzamiento del SpaceX Falcon Heavy que llevaba un Tesla Roadster perteneciente al fundador de SpaceX, Elon Musk. La hoja de trabajo de los elementos principales de Twitter revela el impacto abrumador de este evento en este conjunto de datos cuando se buscan las palabras principales, los pares de palabras y los hashtags. Aquí están los hashtags principales en todo el grafo y dentro de los cuatro grupos principales:

Top Hashtags in Tweet in Entire Graph Entire Graph Count Top Hashtags in Tweet in G1 G1 Count Top Hashtags in Tweet in G2 G2 Count Top Hashtags in Tweet in G3 G3 Count Top Hashtags in Tweet in G4 G4 Count
roadster 974 roadster 884 falconheavy 322 falconheavy 179 starman 9
falconheavy 867 falconheavy 299 spacex 192 spacex 128 spacex 6
spacex 467 space 148 falconheavylaunch 100 tesla 93 mars 5
tesla 263 crypto 140 starman 72 teslaroadster 88 roadster 4
starman 255 spacex 97 tesla 58 starman 57 falconheavy 4
space 214 starman 59 teslaroadster 40 roadster 45 tesla 3
teslaroadster 152 tesla 57 mars 40 teslainspace 33 usaf 3
crypto 143 mars 38 dontpanic 36 model3 24 falconheavycargo 2
falconheavylaunch 126 model3 31 elonmusk 29 space 23 aimhigh 2
model3 117 teslaroadster 17 roadster 28 elonmusk 22 space 2


Información de la red

Grandes grupos de usuarios de Twitter se reúnen en torno a cuatro cuentas centrales de Twitter en esta red: @Tesla (G1), @elonmusk (G2) y @spacex (G3). El Grupo 4 está formado alrededor de un tweet por el Comando Espacial de la Fuerza Aérea Twitter @afspace. Estas cuentas se identifican como las más influyentes al ordenar la hoja de cálculo de vértices por Betweenness Centrality (columna U).

Puede desplazarse hacia abajo para ver la lista completa de usuarios en esta red o desplazarse hacia la derecha para buscar más información sobre cada usuario, como descripción, sitio web, zona horaria, cantidad de tweets, cuentas de seguidores, etc.




Tenga en cuenta que una centralidad de intersección alta no significa automáticamente influencia en la red. Un Out-Degree alto emparejado con un In-Degree bajo puede ser un indicador para bots (re) tweet y por lo tanto no requieren mucha atención.

Puede eliminar estas cuentas de su análisis haciendo clic en Show/Hide > Workbook columns > Visual properties y pegando Skip en la columna Visibility (H). Actualice la ventana del grafo después de eso, o vuelva a ejecutar un análisis completo para ver si la forma de la red cambia después de filtrar el ruido de datos.

Análisis extendido: una serie de análisis de red

Las redes creadas con Twitter Search Network son altamente dinámicas, por eso las actualizaciones periódicas son necesarias, p. identifique líderes de opinión, grupos emergentes de usuarios sobre ciertos temas o monitoree los puntajes de opinión. A continuación, presentamos una serie de informes de NodeXL que contarán diferentes historias:


@Tesla Twitter Community Network 2018-04-30


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=150028

Palabras positivas: 7.07%
Palabras negativas: 0.85%

El clúster @elonmusk (G1) supera al clúster @Tesla en este mapa y muestra una vez más el enorme impacto de Musk en la marca Tesla.


@Tesla Twitter Community Network 2018-05-07


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=150922

Palabras positivas: 3.09%
Palabras negativas: 1.91%

Esta instantánea de discusión se tomó unos días después de la cambiante entrevista de Elon Musk sobre el informe financiero del primer trimestre ...


@Tesla Twitter Community Network 2018-05-23


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=152874

Palabras positivas: 1.56%
Palabras negativas: 1.08%

Este análisis de red se creó dos días después de que Consumer Reports revelara preocupaciones de seguridad sobre el sistema de frenado de Tesla.


@Tesla Twitter Community Network 2018-06-01


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=153997

Palabras positivas: 3.15%
Palabras negativas: 2.24%

Crear un análisis de red de marca


Al eliminar el @ de la consulta de búsqueda, los resultados de la búsqueda se ampliarán. Encontrará un poco de ruido de fondo en los datos ya que también hay menciones y conversaciones sobre Nikola Tesla. Sin embargo, hay muchas historias de autos de Tesla que se pueden encontrar.

Para crear un análisis de red de marca, siga todos los pasos del análisis de la red de comunicación y el mapa resultante de la red NodeXL Pro tendrá el siguiente aspecto:


Información de la red


La estructura de red dominante de este tipo de análisis es la "Red de marca". El grupo más grande de usuarios son los aislados que se encuentran en G1. El tamaño de este grupo y un gran número de pequeños grupos aislados es una buena medida para el conocimiento de la marca y el alcance de la marca.

El mapa de la red también muestra el alcance global de Tesla, ya que puede ver clusters de idiomas regionales que se pueden explorar más. Aquí hay una descripción general creada a partir de la columna de enlace AG (Idioma):


Análisis extendido: más análisis de red



Otra serie de análisis de Tesla que hemos creado con el importador de la red NodeXL Pro Search:
Tesla Twitter Brand Network 2018-03-26
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=146166
Palabras positivas: 3.83%
Palabras negativas: 1.41%
El grupo más grande (G1) en esta red se centra en crypto marketplace @vestarin y su anuncio de asociarse con Tesla.



 
Tesla Twitter Brand Network 2018-05-24
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=152963
Palabras positivas: 2.60%
Palabras negativas: 2.93%

Este análisis de red se creó tres días después de que Consumer Reports revelara preocupaciones de seguridad sobre el sistema de frenado de Tesla .


.
Tesla Twitter Brand Network 2018-06-01
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155439
Palabras positivas: 3.12%
Palabras negativas: 1.72%



Crear un análisis de red de la competencia


Hay diferentes formas de recopilar datos comparativos de red. Obviamente, puede comenzar desde el principio y realizar todos los análisis previos en cualquier marca de su elección. Aquí hay un análisis de red que abarca los tweets en torno al vehículo más popular en el mercado estadounidense: el Nissan Leaf:


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=151748

Otro enfoque es crear una lista de cuentas de marca y utilizar el importador de la "red de usuarios de Twitter" para recolectar datos de la red. Aquí puede descargar un análisis completo de la red NodeXL Pro con datos comparativos de las 52 principales marcas de automóviles:



Una vista alternativa de los mismos datos:



https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=143291

Aquí se puede encontrar una vista más enfocada con solo cuatro competidores directos en el mercado de vehículos eléctricos: @Tesla @NissanElectric, @RenaultZE y @ ChevyElectric:



https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155520

Un enfoque diferente para comparar marcas es poner varios nombres de cuenta de la competencia en una consulta del importador de la "red de búsqueda de Twitter": @NissanElectric OR @RenaultZE OR @ ChevyElectric OR @Tesla:


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155525

También puede comparar las conversaciones en torno a los hashtags superiores de los vehículos eléctricos más populares: # model3 OR #nissanleaf O # MissionE:

martes, 26 de junio de 2018

Curación de datos en Big Data


Cómo hacer curación de contenido con los datos

Dr. Who



El contenido es el rey: siempre lo escuchamos cuando hablamos de la cura del contenido. Producir contenido valioso es difícil, si no tenemos idea, es prácticamente imposible. El valor de un contenido puede tener múltiples significados. Una cosa es segura: además de su originalidad, debe reflejar la demanda del mercado; debe reflejar, es decir, lo que las personas buscan en la red. Los datos en la web pueden ayudarnos en este sentido y, una vez procesados, pueden brindarnos diferentes maneras de hacerlo.

Curación de contenido guiados por datos: Pasos operacionales

Comienza desde el tema: definido el tema es necesario para dibujar la arquitectura de análisis. La arquitectura de análisis no es más que un documento simple para registrar los principales elementos de nuestro análisis, como son: el lapso de tiempo a considerar, la identificación de los canales donde residen los contenidos, el análisis de la pregunta específica.

Estos cuatro elementos básicos se deben expandir de acuerdo con los hallazgos que proporciona el raspado de datos. Un elemento fundamental es tener un buen crowler para obtener los datos de partida sin procesar.

El tema que traigo como ejemplo, y cuyos datos se tomaron hace más de un año, es el de la salud digital. El período de tiempo considerado fue de 30 días. La elección de este tiempo ajustado se debe al hecho de que es necesario evitar la dispersión de la demanda: un tiempo ajustado asegura que los datos se recopilan de los eventos recientes.

El cuestionamiento de la red permitió extraer más de 1700 contenidos con un duopolio de canales en los que viajó este contenido. Los tweets y artículos en línea dividían, hace un año, los contenidos sobre el tema de salud digital.

A partir de esta información, es posible ampliar la estructura arquitectónica de nuestro análisis: extraer información de la web para realizar el análisis de extracción de texto y comprender la existencia de aspectos particulares; lleve a cabo el análisis de las conversaciones de twitter para comprender cómo se debatió el tema e identifique, si existieran, personas influyentes específicas.


Curación de contenido: análisis SERP


El análisis SERP nos permite identificar tanto la competencia existente sobre el tema, como los segmentos que lo componen. El enfoque es el del análisis de cola larga que muchos de ustedes conocen. El análisis de cola larga, sin embargo, no es el único tipo de actividad que se puede realizar en un SERP: una vez tomada, también se puede analizar a través del análisis de minería de texto, en particular en la dimensión de metadescripción. La metadescripción es uno de los elementos fundamentales que guían nuestra investigación al facilitar la elección de clikkare, o no, en uno de los diversos enlaces que nos devuelve una consulta en Google. Dado el tiempo y el tema, hace un año tomé unos 980 sitios (igual al 50% del SERP completo) con una opción aleatoria estratificada. La estratificación permite considerar diferentes grupos de agregaciones y tener una representación estadística.

Para evaluar la oportunidad de llevar a cabo el análisis minería de texto en profundidad, el primer indicador que vemos es el de la tabla Zipf: un gráfico denso nos muestra que los temas resumidos en la meta descripción se argumentan; hay algún material sobre el cual trabajar y avanzar con el análisis.

Curación de contenido: análisis de minería de texto


Las ideas que surgieron hace un año fueron muy interesantes: la mayor parte del contenido en línea se relacionó con artículos / publicaciones para personajes locales y esto ensucia la capacidad del análisis para resaltar el estado de ánimo subyacente.



Al eliminar estos aspectos, fue posible identificar dos macroconjuntos: uno relacionado con la identidad digital, el otro más específico sobre el tema de la innovación digital en el sector hospitalario (lado derecho del gráfico).

La lectura de los contenidos de los dos clusters identificados: 4 referencias web para el clúster de identidad digital y 10 referencias para el clúster de innovación digital.

Estos 14 sitios representan las fuentes relevantes para una primera identificación del estado de ánimo subyacente en un tema determinado. Al combinar estas instancias con la segmentación hecha con el análisis de la cola larga, tenemos excelentes indicaciones para identificar el área temática que queremos cubrir con nuestro contenido.

Curación de contenido: evaluación de tema con el SNA

Se recopilaron más de 728 conversaciones en Twitter y se encontró una red de 526 oradores que generaron más de 500 informes.

Al aplicar los indicadores estadísticos apropiados, se resaltaron algunos conglomerados de conversación. En particular:

  • Mercado de salud digital (clúster verde)
  • Innovación en asistencia sanitaria digital (racimo rojo)
  • Dossier electrónico (clúster negro)
  • Observatorio PoLIMI (grupo naranja)
  • Convención del observatorio digital (clúster central)



Los principales contenidos fueron extraídos de cada grupo individual.

Ambos análisis, aunque con matices obvios, confirman los conocimientos que se pueden utilizar en términos de datos de curación de contenido impulsados, lo que respalda tanto la demanda del mercado como las conversaciones relacionadas con ella. No solo eso: el análisis de redes sociales también nos permite identificar cuáles de los actores analizados son los mejores para "contactar" para compartir el contenido que vamos a crear.

domingo, 11 de febrero de 2018

Usando ARS para búsquedas de estructura en textos

Usando métodos de búsqueda eficientes para la estructuración del contenido





Esta charla fue preparada para la presentación de un libro en Motto Art Bookstore en Berlín. El libro, Way to Russia Guidance, es una guía de viajes a Rusia realizada por Nodus Labs en colaboración con el recurso en línea más popular sobre Rusia waytorussia.net, que utiliza polysingularity como metodología para estructurar el contenido del libro.

Nodus Lab


El problema de la búsqueda y la recuperación de contenido

Considere que estás buscando algo en un libro. ¿Cuáles son las diferentes estrategias que podrías usar?

Una opción sería leerlo desde el principio hasta el final, pero eso llevaría mucho tiempo y no es el método más eficiente. Usar una computadora ayudaría, pero básicamente hace lo mismo y solo funciona porque puede realizar millones de operaciones por segundo. Preguntar a alguien que sabe es otra opción, pero es posible que no estén disponibles o que quizás no lo recuerden.

Otra tarea más complicada es obtener una visión general rápida del contenido del libro.
Es comparable a la primera tarea, excepto que no sabes lo que estás buscando.

De hecho, este es un problema muy serio, especialmente en los momentos de sobrecarga de información.

Entonces, ¿cómo podría resolverse de la manera más eficiente?


Inspiración # 1: Estrategias de búsqueda de ADN

Cada célula de nuestro cuerpo se enfrenta al mismo problema. Cualquier proceso que implique leer información genética tiene que leer primero esa información de la molécula de ADN larga. Las proteínas de unión podrían simplemente deslizarse a lo largo de la longitud completa del ADN, pero tomaría mucho tiempo y no sería eficiente (también podrían encontrar obstáculos).

La forma en que la evolución resolvió este problema es una búsqueda 1D / 3D (Marcovitz & Levy 2013).



Para encontrar el lugar correcto para unirse a lo largo de la molécula de ADN, una proteína se desliza a través de su longitud por un período de tiempo (esto se denomina búsqueda 1D). Luego, ya sea a intervalos o porque encuentra un obstáculo, realiza un "salto" de un lugar de la molécula a otro (esto se denomina búsqueda 3D).

La combinación de deslizamiento y saltos produce una estrategia de búsqueda muy eficiente donde la proteína se une rápidamente a las partes de la molécula que está buscando.

Inspiración # 2: narrativas adivinatorias

Otro ejemplo proviene de un área, que es diferente, pero todavía está relacionada con el estudio de la vida.

Las narrativas de la Divinidad, como el Tarot y el I Ching, se han usado durante mucho tiempo para proporcionar orientación y ayudar a encontrar la información correcta para actuar.

Tanto el Tarot como el I Ching están estructurados de forma modular. Hay 22 cartas (arcanos mayores) en el Tarot, cada una de las cuales representa un concepto y cuenta una historia (lea nuestro estudio sobre la estructura de la red del Tarot para obtener más información). I Ching tiene 64 hexagramas, cada hexagrama también representa un cierto concepto o una historia.

La lectura divinacional avanza a través de una serie de iteraciones aleatorias donde el lector elige uno o varios puntos de partida para leer. Las cartas (o hexagramas) luego conducen a las otras cartas (o hexagramas), por lo que al final el lector obtiene una muy buena visión general de todo el contenido sin tener que leer todo el libro.

De esta forma, tanto el Tarot como el I Ching son estructuras narrativas muy eficientes en el sentido de que le permiten al lector obtener la esencia del contenido en solo una fracción del tiempo que llevaría revisarlo todo.

Las conexiones entre los elementos no son aleatorias. De hecho, hay una estructura muy precisa en juego, que permite al lector obtener la representación más completa de las diferentes partes de la narración.

Por ejemplo, cada carta en Tarot está conectada a la carta antes y después (simplemente por orden cronológico). Es como abrir una página al azar en un libro y leer un poco antes y después para obtener el contexto correcto.
Luego, hay dos ciclos en arcanos mayores del Tarot, un ciclo procede de la tarjeta n. ° 1 a la n. ° 10, el otro ciclo procede de la n. ° 11 a la n. ° 20. Cada tarjeta en el primer ciclo se conecta a la tarjeta en el ciclo paralelo "paralelo". Este ciclo paralelo es simplemente una línea argumental paralela que comienza en el medio del "libro" del Tarot y pasa por un desarrollo similar a la primera línea argumental, pero con algunas alternancias. Una historia que es más madura, en cierto sentido. Por ejemplo, una tarjeta n. ° 2 está conectada a la tarjeta n. ° 12, n. ° 5 a n. ° 15, y así sucesivamente.
Finalmente, el último enlace es desde el comienzo del primer ciclo hasta el final del ciclo alternativo. Es como abrir un libro de 22 páginas en la página 3 y también leer la página 19, para que pueda hacerse una idea sobre el comienzo y el final de la historia.

Si todas las conexiones que existen entre las diferentes tarjetas se representan como una red, obtendremos una estructura que se ve así:

Conexiones entre cartas del Tarot


Curiosamente, tiene forma de hélice, una estructura que a menudo se encuentra en la biología.

Como podemos ver, este tipo de estructura de red es un mecanismo eficiente para estructurar la narrativa en el sentido de que si comienzas a "leer" esa estructura desde cualquier punto del gráfico, cubrirás toda la forma con solo unos pocos movimientos a lo largo de los vértices .

De esta manera, la estructura de la narrativa del Tarot logra el mismo objetivo que la búsqueda de ADN 1D / 3D: combina los movimientos a lo largo de la línea (cronología) con saltos en 3D a través de la estructura para obtener una visión más completa de una manera más eficiente.

Aún más interesante, este tipo de estructura de hélice se relaciona con la forma en que los cromosomas humanos están conectados entre sí. Si representamos 22 cromosomas como un gráfico (omitimos el 23 porque es un interruptor X / Y masculino / femenino) sus interacciones son muy similares a la hélice del Tarot, que es otra evidencia visual de que este tipo de estructura puede ser muy eficiente para la recuperación de información. (Ver el trabajo de Lieberman-Aiden para los antecedentes científicos detrás de este enfoque)

Análisis de la red de conexiones cromosómicas basado en el método hi-c


De la teoría a la práctica: construcción de la narrativa de un libro

Decidimos aplicar las dos metodologías anteriores para una tarea práctica de estructurar el contenido de un libro.

El tema seleccionado fue la guía de viaje porque ya implica algún tipo de eficiencia en la estructuración y también porque la gente suele leer la guía de viaje de forma rizomática.

En aras de la simplicidad, nos referimos a los métodos anteriores (búsqueda 1D / 3D y estructura narrativa similar a hélice) como Polysingularity. La razón es que ambos métodos combinan movimientos locales dentro de un determinado grupo (página) con saltos de largo recorrido a través de los grupos (de una página a otra). Entonces, si tuviéramos que representar el contenido de un libro como una red, donde los distintos temas son los nodos y sus conexiones son las relaciones entre ellos, obtendríamos una estructura que parece una combinación de singularidades que son lo suficientemente distintas pero que están conectados el uno con el otro.



Siguiendo esta metodología para la estructuración del libro, identificamos varios temas y las relaciones entre ellos.

Por ejemplo, como la guía de viaje es para Rusia, una página trata del Sputnik (el famoso satélite ruso) y la siguiente página sobre el arma Kalashnikov (otro tipo de tecnología militar rusa conocida). Sin embargo, la página del Sputnik también enlaza con el museo de Cosmonáutica en Moscú pero también con un hermoso lago en las montañas Altay donde las partes de los cohetes de la estación de lanzamiento espacial Baikonur caen para producir efectos de iluminación sorprendentes y contaminar la naturaleza circundante.



Una página con consejos de seguridad para los viajeros les aconseja disipar cualquier tensión que pueda surgir durante su viaje a Rusia a través de la disipación, lo que se puede lograr utilizando prácticas físicas (como Systema), pero también, si salen a bailar a música techno o para disparar en el campo de tiro en Moscú. Por lo tanto, la narrativa original se ramifica en muchas direcciones diferentes y permite al lector obtener una gama completa de experiencias contrastantes.



Este tipo de estructura es similar a la estructura de enlace de los documentos de Internet, excepto que conscientemente intenta enfocarse no solo en el contenido que es similar y relacionado, sino también en el contenido que puede estar en el lado opuesto del espectro, enriqueciendo así la experiencia de los viajeros y también proporcionar una especie de narrativa meta-guía a través de la guía en sí.

Referencias

Marcovitz & Levy (2013). Obstacles May Facilitate and Direct DNA Search by Proteins. Biophysics Journal
Lieberman-Aiden et al (2010). Comprehensive mapping of long range interactions reveals folding principles of the human genome. Science Magazine.

domingo, 28 de enero de 2018

ARS aplicado: Una visión del ecosistema de medios alternativos

Guerras de información: una ventana al ecosistema de medios alternativos

Teorías de conspiración, pensamiento abarrotado y desinformación política

Por Kate Starbird
Asst. Professor of Human Centered Design & Engineering at UW. Researcher of crisis informatics and online rumors. Aging athlete. Army brat.

Medium

Antecedentes: examen de "narrativas alternativas" de eventos de crisis

Durante más de tres años, mi laboratorio en la Universidad de Washington ha realizado investigaciones sobre cómo las personas difunden los rumores en línea durante los eventos de crisis. Hemos analizado los desastres naturales como los terremotos y los huracanes, así como los hechos por el hombre, como los tiroteos masivos y los ataques terroristas. Debido a la disponibilidad pública de datos, nos enfocamos principalmente en Twitter, pero también utilizamos los datos recopilados allí (tweets) para exponer una actividad más amplia en el ecosistema de medios circundante.

Con el tiempo, notamos que un tipo similar de rumor seguía apareciendo, una y otra vez, después de cada uno de los eventos de crisis provocados por el hombre: una teoría de conspiración o "narrativa alternativa" del evento que afirmaba que o no había sucedido o que fue perpetrado por alguien más que los sospechosos actuales.

Encontramos este tipo de rumor al estudiar los atentados del Boston Marathon en 2013. Notamos una gran cantidad de tweets (> 4000) que afirmaban que los bombardeos eran una "bandera falsa" perpetrada por los Navy Seals de los EE. UU. La difusión inicial de este rumor implicó una "cascada" de tweets que enlazan a un artículo en el sitio web de InfoWars. En ese momento, nuestros investigadores no sabían qué era InfoWars, pero la importancia de esa conexión se hizo evidente con el tiempo.

En eventos de crisis posteriores, aparecieron rumores similares. Después del tiroteo en Umpqua Community College, se rumoreaba que el evento fue organizado por "actores de crisis" por razones políticas, específicamente para justificar restricciones legales a los derechos de armas. Y después de los tiroteos en el club nocturno Orlando Pulse, un rumor sugirió que fueron cometidos por alguien más que el pistolero acusado, con el propósito de culpar falsamente al ataque contra los musulmanes. Para cada evento de crisis creado por el hombre que estudiamos, encontramos evidencia de narraciones alternativas, a menudo compartidas por algunas de las mismas cuentas y conectadas a algunos de los mismos sitios en línea.

Estos rumores tenían diferentes "firmas" de otros tipos de rumores. En términos de volumen (medido en tweets por minuto), la mayoría de los rumores relacionados con la crisis se disparan rápidamente y luego se desvanecen con relativa rapidez, típicamente "decayendo" a un ritmo exponencial. Pero estos rumores narrativos alternativos aumentaron más lentamente, y luego se demoraron, disminuyendo y fluyendo a lo largo de días o semanas (o años). También tuvieron una participación sostenida de un grupo de usuarios de Twitter (es decir, muchos tweets por usuario durante un período de tiempo prolongado), en lugar de la participación finita de un gran número de usuarios (uno o dos tweets por usuario, todos al mismo tiempo). ) como lo hacen los rumores típicos. Además, los rumores narrativos alternativos a menudo tenían una gran "diversidad de dominio", en los tweets que hacen referencia a los rumores vinculados a un gran número de dominios distintos (diferentes sitios web), incluidos sitios alternativos como InfoWars, BeforeItsNews y RT (también conocido como Russia Today). Varios de estos rumores también tenían una fuerte presencia de "botnet"; en otras palabras, muchas cuentas de Twitter participantes no eran personas "reales", sino que eran operadas por un programa de computadora que controlaba una gran cantidad de cuentas.

En nuestro primer estudio (sobre los atentados con maratón de Boston en 2013) notamos que los rumores narrativos alternativos se cruzaban con el contenido politizado. El análisis de hashtags concurrentes mostró que #falseflag a menudo aparecía en los mismos tweets como #obama, #nra, #teaparty, #tcot, #tlot, # p2. Como investigador de informática de crisis, he observado a menudo cómo las crisis se politizan en espacios en línea (y en otros lugares), pero esto fue diferente, ya que el rumor de falsa bandera parecía estar profundamente conectado a temas políticos y se propagaba con un propósito claramente político.


Extrañas similitudes y conexiones: por qué cambiamos de enfoque

Inicialmente, decidimos no insistir en este tipo de rumores, pensando que tenían poco impacto en nuestras preguntas centrales de investigación: cómo responden las personas a los eventos de crisis y cómo podemos hacer que el espacio de información sea más útil para las personas afectadas por la crisis detectando rumores falsos . Estos rumores narrativos alternativos rara vez resonaron dentro de las poblaciones afectadas por la crisis. Y así, aunque a menudo los comentamos cuando salieron a la luz en nuestros datos, mantuvimos nuestro enfoque de investigación en otra parte.

Sin embargo, a principios de 2016, a raíz de los tiroteos del Umpqua Community College y los ataques terroristas coordinados en París, algunos de mis alumnos decidieron examinar más de cerca lo que percibían como elementos comunes en las narrativas alternativas que se difunden en Twitter sobre el dos eventos diferentes, además de lo que ellos pensaban que era una botnet que manejaba una gran parte de ese contenido.

[Ambas corazonadas resultaron ser ciertas. La botnet estaba conectada a "The Real Strategy" o TheRealStrategy.com. Coordinaron cientos de cuentas que tuiteaban contenido relacionado con varias narrativas alternativas diferentes de estos eventos y otros. Aunque algunas de esas cuentas se han eliminado, otras aún están operativas, se han creado otras nuevas y continúan publicando y publicando en Twitter contenido relacionado con numerosas teorías de conspiración.]

Usando datos de Twitter recopilados durante estos eventos, los estudiantes construyeron grafos de red que revelaron las conexiones entre diferentes cuentas de Twitter, y entre diferentes "comunidades" de cuentas, participando en estas narrativas alternativas. Cuando fuimos a examinar los datos en el invierno de 2016, estábamos muy confundidos por algunas de las intersecciones. ¿Por qué un puñado de cuentas "Anónimas" y GamerGaters estaban conectados con cuentas pro-palestinas de un lado y nacionalistas blancos europeos con otro? ¿Por qué los partidarios aparentemente izquierdistas de Wikileaks se conectaban con partidarios aparentemente derechistas de Donald Trump? ¿Y por qué estos grupos se unieron para hablar sobre narrativas alternativas de los eventos de tiroteo en masa? No tiene sentido. Todavía.


Una exploración sistemática del ecosistema de medios alternativos a través de la lente de narrativas alternativas de eventos de rodaje masivo

Casi un año después, motivados por las interrupciones políticas de 2016, la retórica en torno a las "noticias falsas" y los medios alternativos, y la persistente sensación de que había algo en nuestros datos de rumores en línea que podía darnos una idea de estos problemas, completamos un estudio sistemático de narrativas alternativas de los eventos de tiroteo masivo, mirando específicamente al ecosistema de medios alternativos que los genera y apoya su propagación. Un primer documento resultante de este trabajo fue revisado recientemente y aceptado en la conferencia ICWSM 2017. He subido una versión preimpresa de este documento a mi sitio web.

En el resto de este blog, voy a describir parte de esa investigación, incluidos los métodos y los principales hallazgos. Estos hallazgos tocan la naturaleza de los medios alternativos, incluida la presencia de (y las conexiones entre) teorías de conspiración, propaganda política y desinformación.


Métodos de recopilación y análisis de datos

El 1 de enero de 2016, nuestro laboratorio lanzó una colección de Twitter centrada específicamente en los eventos de rodaje. Mantuvimos esta colección durante más de nueve meses, hasta el 6 de octubre, haciendo un seguimiento de términos (en inglés) que incluyen disparos, disparos, pistoleros y pistoleros. A partir de esta recopilación, identificamos tweets que hacen referencia a narraciones alternativas, es decir, tweets que también contenían términos como "bandera falsa", "engaño" y "agente de crisis".

A continuación, creamos un mapa de red de los dominios de Internet a los que se hace referencia en estos tweets. En otras palabras, queríamos ver qué sitios web citaban las personas mientras hablaban y construíamos estas narrativas alternativas, así como también cómo se conectaban esos diferentes sitios web. Para hacer eso, generamos un grafo donde los nodos eran dominios de Internet (extraídos de enlaces URL en los tweets). En este grafo, los nodos se clasifican por el número total de tweets que se vinculan a ese dominio y existe una ventaja entre dos nodos si la misma cuenta de Twitter publicó un tweet que cita un dominio y otro tweet que cita al otro. Después de algunos recortes (eliminar dominios como sitios de redes sociales y acortadores de URL que están conectados a todo), terminamos con el grafo que ves en la Figura 1. Luego usamos el grafo para explorar el ecosistema de medios a través del cual se producen narrativas alternativas toma lugar.



Figura 1. Grafo de red de dominio, coloreado por tipo de medio
 Púrpura = medios dominantes; Color agua = medios alternativos;
 Rojo = medios controlados por el gobierno

Después de generar el grafo, realizamos un análisis cualitativo exhaustivo de todos los dominios en el grafo, leyendo sus páginas de inicio y Acerca de, identificando los temas destacados en su sitio web actual, buscando temas específicos dentro de su contenido histórico, examinando otra información disponible (en línea) sobre sus propietarios y escritores, etc. A continuación, analizo lo que aprendimos sobre este ecosistema de medios alternativos a través de este análisis.

Se citaron medios alternativos para respaldar narrativas alternativas; Los principales medios de comunicación fueron citados para desafiarlos

El grafo de red representa una subsección del ecosistema de medios más grande: es una instantánea de la "estructura" de la conversación sobre narrativas alternativas. Después de recortar en dominios citados varias veces (y por varias personas), el grafo contiene 117 dominios en total. Determinamos que 80 de ellos pertenecían a "medios alternativos" (Figura 1, color agua) y 27 pertenecían a medios convencionales (Figura 1, color púrpura). Otros dominios incluyen tres pertenecientes a ONG y dos pertenecientes a medios de comunicación financiados por el gobierno ruso (RT.com y SputnikNews.com).

Es importante tener en cuenta que no todos estos dominios contienen contenido que promueve narrativas alternativas de los eventos de disparo. En las conversaciones de Twitter sobre estas narrativas alternativas, los dominios fueron citados de diferentes maneras para diferentes tipos de contenido.

Más de la mitad de los dominios en el grafo (y más del 80% de los dominios de medios alternativos) fueron citados por contenido que apoya explícitamente las narrativas alternativas. Sin embargo, otros (especialmente los principales medios de comunicación) fueron citados por relatos de los hechos, y luego fueron utilizados como evidencia por los teóricos de la conspiración a medida que construían estas teorías. Y algunos fueron mencionados por sus negaciones de estas teorías. A continuación hay ejemplos de cada uno, para darle una idea de cómo los tweets hacen referencia a dominios externos.

Soporte: El siguiente tweet se vincula a un artículo en el dominio WorldTruth.tv que afirma que los testimonios de varios pistoleros (que entran en conflicto con la cuenta oficial) sugieren que el tiroteo en el club nocturno Orlando Pulse es una especie de bandera falsa. La información contradictoria y dinámica, típica de las situaciones del tipo de niebla de guerra que ocurren después de los eventos de crisis, a menudo se usa como "evidencia" para apoyar narrativas alternativas de estos eventos.




Como evidencia: el siguiente tuit afirma que uno de los testigos del tiroteo en Orlando es un actor y que los disparos fueron una falsa bandera. Esto hace eco de un tema común, que aparece en muchas narrativas alternativas en nuestra investigación, que los "actores de crisis" se utilizan para organizar eventos. El tweet se vincula a un artículo en el dominio Toronto Star que contiene una cuenta objetiva neutral del evento.



Negación: este tweet se vincula al dominio del New York Times, a un artículo que refuta varias narrativas alternativas diferentes de los disparos en Orlando. Sin embargo, en lugar de alinearse con los argumentos en ese artículo, este tweet está acusando al New York Times de ser un participante en la bandera de conspiración / engaño / falsa.




[Siguiendo las reglas de Twitter, solo proporciono ejemplos aquí de tweets que todavía están disponibles públicamente en Twitter. También he intentado elegir las cuentas para estos ejemplos que parecen propagar intencionalmente narrativas alternativas; en otras palabras, estoy tratando de evitar llamar individuos / cuentas que podrían ser incómodas al estar asociadas con estas ideas.]

La mayoría de los dominios citados en la producción de narrativas alternativas eran dominios de "medios alternativos", y la mayoría de estos (68 de 80) fueron citados (vinculados) en los tweets que recopilamos para contenido que explícitamente apoyaba narrativas alternativas. Como puede ver en el grafo (Figura 1), el ecosistema de medios alternativos está estrechamente conectado, es decir, los usuarios de Twitter que producen narraciones alternativas suelen citar varios dominios de medios alternativos diferentes en sus tweets de teoría de la conspiración. Los tres centros principales en esta red en particular son VeteransToday.com, BeforeItsNews.com y NoDisinfo.com, pero hay muchos otros dominios de medios alternativos que juegan un papel importante en la producción de narrativas alternativas. Este ecosistema de medios alternativos (un subconjunto del grafo más grande) es el foco del resto de este blog.

Sin embargo, quiero señalar explícitamente y aclarar un aspecto del grafo: aunque los principales dominios de los medios como el Washington Post, el New York Times y Fox News aparecen en el grafo, ninguna cuenta de los medios principales en este grafo alojó ningún contenido que promoviera la alternativa. narrativas que estábamos estudiando. En cambio, en general se citaron en nuestros datos de Twitter para el contenido general sobre el evento que luego se usó como "evidencia" de una conspiración. Los medios convencionales también fueron citados para las correcciones de las narraciones alternativas (a veces en tweets que respaldan esas correcciones, a veces en tweets que los impugnan). En el caso del New York Times, el periódico publicó un artículo que negaba explícitamente las narrativas alternativas del tiroteo en Orlando. Esta negación fue citada varias veces por aquellos que promueven esas narraciones, como incluso más evidencia de su teoría. [Esto demuestra un aspecto irritante de corrección de rumor en este contexto - que las correcciones a menudo son contraproducentes].

El grafo de red revela algunos sitios de medios principales para estar más integrados en el ecosistema de medios alternativos. Por ejemplo, varias personas que twittean enlaces a VeteransToday.com también twittean enlaces a FoxNews.com, acercándolo a esa parte del grafo.

El papel de las botnets en la amplificación de narrativas alternativas

Estos datos también proporcionan información sobre el efecto de las cuentas automatizadas (botnets) en los datos. Por ejemplo, el dominio más tuiteado en nuestros datos fue TheRealStrategy.com. Se tuiteó tantas veces (7436) y se conectó a tantos dominios (en relación con los demás dominios) que tuvimos que eliminarlo del grafo. [Fue el único dominio de medios altamente citado y altamente conectado que eliminamos]. El examen de los patrones temporales (tweets a lo largo del tiempo) sugiere que casi todos los tweets que se vinculó a este dominio fueron generados por un programa de computadora. Ese programa operó cientos de cuentas diferentes, ordenándoles que tuiteen en ráfagas regulares (docenas al mismo tiempo). En la mayoría de los casos, estos tweets están vinculados a TheRealStrategy, pero el programa también está salpicado de tweets que enlazan con otros dominios de medios alternativos. Un análisis más detallado reveló que muchas de estas cuentas de Twitter tienen descripciones de perfil similares y que usan fotos robadas de otras personas en línea. Esta es una botnet muy sofisticada que parece estar trayendo efectivamente cuentas "reales" a sus redes de amigos / seguidores, y principalmente propagando teorías de conspiración y contenido politizado.

El sitio de InfoWars fue el segundo más twitteado en nuestro conjunto de datos (1742 veces). Casi todas las actividades de tweet que citan a InfoWars provenían de un conjunto coordinado de cuentas; todas tenían un nombre similar y cada una enviaba un tweet único que enlazaba a uno de los dos artículos de InfoWars sobre diferentes narrativas alternativas de diferentes eventos de disparos. Todas estas cuentas ahora están suspendidas. Aunque no es tan sofisticado como TheRealStrategy, este botnet amplificó el contenido de InfoWars, que ocasionalmente fue retomado y retuiteado por otros.


Propaganda política: nacionalismo vs. globalismo

Una de las primeras cosas que nos llamó la atención cuando realizamos análisis de contenido cualitativo en los dominios de medios alternativos fue la cantidad de contenido político en los sitios web. Intentamos caracterizar este contenido, pasando por varias rondas de iteración para tratar de reconocer patrones en los sitios y distinguir entre diferentes orientaciones políticas.

Rápidamente quedó claro que el espectro político izquierdo (liberal) frente a derecho (conservador) de los EE. UU. No era apropiado para gran parte de este contenido. En cambio, la principal orientación política fue hacia la antiglobalización. Casi siempre, esta orientación se hizo explícita en el contenido.

El significado del globalismo varió en todos los sitios. Para algunos sitios web enfocados en la audiencia de los EE. UU., El globalismo implicaba una postura pro inmigrante. Para sitios más centrados en el ámbito internacional, se utilizó el globalismo para caracterizar (y criticar) la influencia del gobierno de los EE. UU. En otras partes del mundo. En algunos de los sitios más conspirativos, el término se usaba para sugerir conexiones a una conspiración global por parte de personas ricas y poderosas que manipulaban el mundo para su beneficio. El globalismo también estaba ligado al corporativismo; en otras palabras, las formas en que las grandes compañías multinacionales ejercen poder sobre el mundo. Y el término también estaba conectado, implícita y explícitamente, a los medios convencionales.

De esta manera, ser antiglobalista podría incluir ser medios anti-mainstream, anti-inmigración, anti-corporación, anti-Estados Unidos. gobierno y anti-Unión Europea. Debido a la variedad de significados empleados, el sentimiento de antiglobalización juntó a individuos (e ideologías) tanto del lado derecho como del izquierdo del espectro político de los EE. UU. Es inquietante que gran parte del contenido antiglobalista en estos dominios de medios alternativos fuera también antisemita, haciéndose eco de las teorías conspirativas de larga data sobre poderosos judíos que controlan los acontecimientos mundiales.

Tantas teorías de conspiración: epistemologías paralizadas, pensamiento abarrotado y las huellas dactilares de una campaña de desinformación

Otra cosa que notamos fue la proliferación y la convergencia de diferentes temas conspirativos. Cada dominio que albergaba un artículo que promovía una narrativa alternativa de un evento de tiroteo también contenía contenido que hacía referencia a otras teorías de conspiración, a veces cientos de ellas. No eran todos de naturaleza política. También encontramos teorías de pseudociencias sobre vacunas, transgénicos y "chemtrails". Algunos dominios trataban sobre teorías de conspiración, pero otros presentaban noticias aparentemente normales con teorías de conspiración salpicadas. A través del análisis cualitativo, determinamos que 24 dominios de medios alternativos se enfocaban principalmente en la distribución de teorías de conspiración y se centraban principalmente en comunicar una agenda política.

Aunque hubo muchas teorías diferentes que se extendieron a través de este ecosistema de información, también vimos una convergencia de temas: algunas de las mismas historias aparecieron en varios dominios diferentes. Ocasionalmente, las historias parecían en gran medida independientes (es decir, diferentes perspectivas, diferentes pruebas), pero a menudo se copiaban esencialmente de un sitio a otro, o una historia posterior simplemente sintetizaba un artículo en otro sitio, incluidos extractos largos del original. Además, algunos autores parecían contribuir historias a múltiples dominios en la red.

Por lo tanto, una persona que busca información dentro de este ecosistema puede encontrar un artículo de un sitio web que sintetizó un artículo de un segundo sitio web que se publicó originalmente y se copió de un tercer sitio web. Un efecto de esto es que las personas que buscan información dentro de este espacio pueden pensar que están obteniendo información de muchas fuentes diferentes cuando en realidad están obteniendo información de las mismas o muy similares fuentes, lavadas a través de muchos sitios web diferentes. Sunstein y Vermeule (2009) sostienen que el pensamiento conspirativo se relaciona con una "epistemología paralizada" y que un componente significativo de esto es una dieta de información limitada y / o sesgada (por ejemplo, una conformada por un grupo social). Nuestra investigación sugiere que la dinámica de la información de este ecosistema de medios alternativos, cómo la misma información existe en diferentes formas en diferentes lugares, puede crear una percepción falsa de diversidad de información o triangulación, complicando aún más esta cuestión de las epistemologías paralizadas.

Desde otra perspectiva, estas propiedades del ecosistema de noticias alternativas -la proliferación de muchas e incluso conflictivas teorías de conspiración y la apariencia engañosa de la diversidad de fuentes- pueden reflejar el uso intencional de tácticas de desinformación. Aunque a menudo pensamos que la desinformación se emplea para convencernos de una ideología específica, en un artículo de 2014 titulado "La amenaza de la irrealidad", Pomerantsev y Weiss describen cómo las estrategias de desinformación rusas (que remontan a Lenin) están diseñadas para no convencer pero confundir, crear un "pensamiento confuso" dentro de la sociedad. Su argumento estratégico es que una sociedad que aprende que no puede confiar en la información puede controlarse fácilmente. Es posible que el ecosistema de medios actual, incluidos los dominios de medios alternativos y las plataformas de redes sociales que ayudan a extender los enlaces a estos dominios, esté contribuyendo al pensamiento confuso (un pariente o efecto tal vez de una epistemología paralizada). Aún no está claro si estos efectos están relacionados con campañas de desinformación decididas o son solo efectos emergentes de nuestro espacio de información actual. Parece que los investigadores tienen algo que hacer para aclarar lo que está sucediendo aquí y quizás pensar en diseñar sistemas que sean más resistentes a la desinformación.

Los medios alternativos se copian el pensamiento crítico, los hechos y la verdad

Quizás el hallazgo más desconcertante que surgió de este análisis, especialmente cuando intentamos pensar cómo ayudar a las personas a convertirse en mejores consumidores de información en línea, fue lo que percibimos como una estrategia intencional de muchos sitios web de medios alternativos para aprovechar la retórica sobre noticias falsas y pensamiento crítico para confundir aún más y engañar a los lectores.

Nuestra investigación muestra que el rechazo de las noticias principales es un tema común en todos los dominios de medios alternativos. Tal vez es una perogrullada decir que existen medios alternativos en yuxtaposición con los medios convencionales, pero lo interesante aquí es que muchos sitios de medios alternativos se han establecido explícitamente como oposición a los medios "corporativos" convencionales. También se han aprovechado de los reclamos de parcialidad política en los medios convencionales (hacia ideologías liberales o prooccidentales) y los han aprovechado para apoyar su propia legitimidad.

Además, parece que han cooptado argumentos sobre alfabetización mediática (boyd hace este mismo argumento) y pensamiento crítico. La conversación sobre "noticias falsas" a menudo termina con declaraciones sobre enseñar a las personas a ser mejores consumidores de información, a ser escépticos mientras se educan a sí mismos a través de encuentros con los medios en línea. Sitios de noticias alternativos se han apropiado de estos argumentos y los están usando para apoyar la propagación de narrativas alternativas y otras teorías conspirativas.

Considere el siguiente texto, un extracto de la página Acerca del dominio 21stCenturyWire.com:




21stCenturyWire.com es un dominio típico en nuestro grafo de red, ubicado en la esquina superior izquierda (de la Figura 1) y fuertemente conectado a NoDisinfo y VeteransToday (que difunden un fuerte contenido antisemita). 59 tweets en nuestra colección vinculados a este dominio, haciendo referencia a varios artículos que explícitamente apoyan narrativas alternativas sobre varios tiroteos masivos, incluyendo afirmaciones de que tanto los disparos de la policía de Dallas como los tiroteos en los clubes nocturnos de Orlando fueron eventos escenificados. Sin embargo, el enfoque conspirativo de este dominio se extendió mucho más allá de las narraciones alternativas de los tiroteos. El contenido del dominio apoyó una amplia gama de temas conspirativos, con artículos que promocionan afirmaciones sobre vacunas que causan autismo, eventos meteorológicos diseñados por el gobierno, protestas contra Trump respaldadas por George Soros y anillos de pedófilos operados por personas poderosas. A través de nuestro análisis del contenido del dominio, también determinamos que 21stCenturyWire apoye firmemente los intereses políticos rusos (otro tema prominente en nuestros datos).

El dominio pertenece y es operado por Patrick Henningsen, un periodista que ha trabajado para RT news, Guardian.co.uk, GlobalResearch.ca, e Infowars.com. Quizás no sea sorprendente que todos estos dominios sean nodos en nuestro grafo.

Al examinar la página Acerca de 21stCenturyWire, puede ver cómo el sitio aprovecha la retórica (algo tecno-utópica) de la libertad de información y el periodismo ciudadano, alentando explícitamente a los lectores a usar sus propias habilidades de "pensamiento crítico" e implícitamente felicitándolas por esas habilidades y tal vez activando un sentido de confianza en sus habilidades. Usted puede manejar esto. ¡Le daremos los hechos y usted puede decidir por usted mismo! El sitio también afirma estar fuera del control corporativo y gubernamental. La primera afirmación representa un contraposicionamiento algo natural, es decir, medios alternativos contra los medios dominantes controlados por la empresa. Pero la segunda afirmación es poco sincera, ya que el dominio a menudo alberga contenido que se publica de manera cruzada en RT, anteriormente Russia Today, un medio de comunicación financiado y controlado en gran parte por el gobierno ruso.

Este tipo de posicionamiento de medios alternativos era típico para los dominios que examinamos. A continuación se muestra otro ejemplo, este de la página Propósito y objetivos del dominio NoDisinfo.com:



Observe el lenguaje que enfatiza cómo este sitio web proporciona "hechos". Permite a las personas "tomar sus propias decisiones". Su propósito es desentrañar el "engaño y la desinformación". Es probable que este encuadre sea muy intencional, afirmando que presenta una "verdad" no adulterada y faculta a los usuarios para quizás sentir que están descubriendo esa verdad dentro de este dominio. Y los usuarios pueden encontrar todo tipo de verdad (en forma de teorías de conspiración) aquí: del trinchero 9-11 a las afirmaciones sobre posibles efectos apocalípticos del desastre nuclear de Fukishima que los medios de comunicación dominantes ocultaron intencionadamente.

Resumen y conclusión

Esta investigación intentó tomar un enfoque sistemático para desempacar el ecosistema de medios alternativos. Nos enfocamos en "narrativas alternativas" de eventos de crisis y utilizamos datos de Twitter para mapear la estructura del ecosistema de medios alternativos que impulsa estas narrativas. A través del análisis de contenido, encontramos que estos dominios albergan colectivamente muchos tipos diferentes de teorías de conspiración, desde narrativas políticamente temáticas sobre el "Nuevo Orden Mundial" hasta argumentos anti-vacunas. En este mundo "virtual", los tiroteos de Sandy Hook School fueron organizados por actores de crisis y la tierra en realidad es plana después de todo.

Determinamos que gran parte del contenido de esta red era propaganda política. En su mayor parte, esta propaganda política se centró en torno a "antiglobalización". Este término se usó para designar diferentes cosas en diferentes dominios (e incluso en diferentes artículos dentro de los mismos dominios) - p. anti-inmigración, imperialismo anti-occidental, anti-corporación, anti-medios. Curiosamente, también hubo fuertes corrientes de antisemitismo (a veces explícito, a veces menos) a través de una subsección de este ecosistema. Tomados en conjunto, estas posiciones parecen estar alineadas y utilizadas en apoyo del surgimiento de ideologías nacionalistas en los EE. UU. Y en otros lugares.

También notamos cómo la estructura del ecosistema de medios alternativos y el contenido alojado y difundido allí sugieren el uso de tácticas de desinformación intencional, destinadas a crear un "pensamiento confuso" y una desconfianza general en la información.

Debido a que los datos subyacentes en este análisis son limitados (a los tweets sobre eventos de rodaje), será necesario un trabajo futuro para A) evaluar el ecosistema de medios alternativos más amplio (nuestros datos nos limitan a una visión muy específica); y B) determinen qué tan influyentes son estos medios y sus mensajes en las perspectivas estadounidenses y mundiales de los eventos mundiales y la ciencia. Sin embargo, está claro que la información compartida dentro de este ecosistema de información aparentemente marginal está entrando a la esfera pública en general.

Cuando realizamos este análisis en diciembre, muchos de estos dominios de noticias alternativos comenzaron a apropiarse del término "noticias falsas" para desviar los ataques a los principales medios de comunicación. Semanas más tarde, el recién inaugurado presidente de Estados Unidos, Trump, se hizo eco de este refrán, declarando públicamente (incluso twitteando) que varios medios de comunicación e historias particulares eran "noticias falsas". Se han identificado otras trayectorias de información de sitios web de medios alternativos a declaraciones públicas de la administración Trump (por ejemplo, las recientes escuchas telefónicas), y aunque esto no implica causalidad, sí indica una conexión entre el ecosistema de medios alternativos y el presidente de los EE. UU. La incorporación de Steve Bannon al círculo interno de Trump también subraya esta conexión. Antes de su nombramiento para la campaña de Trump, Bannon publicó las noticias de Breitbart, un sitio web de medios alternativo que aparece en nuestros datos, y que decidimos tener una fuerte perspectiva antiglobalista. De hecho, los recientes comentarios de Bannon en la reunión republicana del CPAC hacen explícita esta orientación ideológica.

Mientras criticaba a los principales medios de comunicación, Bannon dijo esto: "Son medios corporativos y globalistas que se oponen firmemente a una agenda nacionalista económica como la que tiene Donald Trump".

Este comentario resume una gran parte de la investigación que hicimos, demostrando cómo la crítica de los medios dominantes (prácticamente grabada en el ADN de los medios alternativos) se alinea con una agenda política de antiglobalización en favor del nacionalismo, y cómo esa agenda está conectada a las orientaciones políticas y los objetivos de la administración Trump. Quizás la principal contribución de nuestra investigación es simplemente señalar que estas ideologías se extienden dentro de un ecosistema de medios alternativos que utiliza teorías de conspiración como los reclamos de Hook de Sandy Hook y antiguas narrativas antisemitas para atraer lectores y apoyar esta propagación. Y que estos sitios web de medios alternativos no se centran únicamente en el contenido ultraderechista o altísimo de EE. UU., Sino que también usan contenido de alt-left para atraer a los lectores a este ecosistema de información y las ideologías que se extienden allí.

Lo más importante, este trabajo sugiere que Alex Jones es de hecho un profeta. En serio, mientras leía a través de docenas de estos sitios web de medios alternativos y cavaba DEEP en su contenido, me di cuenta de que realmente se está librando una guerra de información. Hace tres años, nuestro laboratorio decidió que estas teorías de conspiración eran demasiado marginales y salaces para ser el centro de nuestra investigación. Casi que estaba por debajo de nuestra dignidad prestar atención y promover este tipo de contenido. Qué terrible error fue ese. Me parece que no fuimos los únicos que lo hicimos. Es (pasado) el momento en que atendemos a esto (como investigadores y diseñadores de los sistemas que conducen este contenido). Espero que no sea demasiado tarde.

[Aquí hay una lista de los dominios que aparecen en nuestro grafo de red. Tenga en cuenta que la codificación cualitativa se realizó a través de un análisis de contenido iterativo e interpretativo. Es posible que otros perciban que una determinación diferente (o un conjunto de categorías) sería mejor para algunos de estos dominios. Por favor avíseme si siente que hay un error de codificación sistemático o un patrón no reconocido en los datos, ya que este trabajo está en curso y me gustaría poder incorporar sus ideas. Gracias.]