Mostrando entradas con la etiqueta Twitter. Mostrar todas las entradas
Mostrando entradas con la etiqueta Twitter. Mostrar todas las entradas

sábado, 14 de mayo de 2022

Análisis técnico de memes y su difusión

¿Qué es un meme, técnicamente hablando?

Digital Methods Initiative


Explorando la tecnicidad de los memes en diferentes entornos digitales

Miembros del equipo


Alberto Olivieri, Alexander, Alice Noris, Andre Theng, Anton Berg, Anunaya Rajhans, Artur Holiavin, Chloë Arkenbout, Giovanni Daniele Starita, Kristen Zheng, Marcantonio Bracale, Marco Valli, Nabeel Siddiqui, Nina Welt, Octavian, Samson Geboers, Swati

Facilitadores: Prof. Richard Rogers, Dra. Janna Joceli Omena, Giulia Giorgi

Resultados clave

  • Los entornos de software afectan en gran medida la conceptualización y la estética de los memes. De hecho, los géneros y formatos dominantes suelen variar según la plataforma de la que se extraen.

  • El análisis visual revela un espectro de formatos, cuya presencia y frecuencia en los entornos de software puede oscilar considerablemente: por ejemplo, Imgur contiene la mayor cantidad de macros de imágenes, a diferencia del conjunto de datos extraído con CrowdTangle , en el que casi no estaban.

  • En general, las capturas de pantalla de los tweets son el formato de memes que se presenta con mayor frecuencia, cruzando transversalmente los cuatro entornos de software considerados en el análisis.

  • Además del análisis visual, las redes de visión por computadora pueden contribuir a la ontología memética. Mientras que la centralidad de la red de las entidades web dominantes captura lo que es un meme, identificando componentes pre-meméticos como 'texto', 'imagen', 'captura de pantalla', 'título', 'dibujo', 'dibujo', 'cita', las zonas periféricas de la red muestran las peculiaridades del meme ligado a entornos web específicos. Finalmente, los grupos de 'puente' revelan las entidades asociadas con dos o más plataformas para clasificar sus imágenes de memes covid. En general, el análisis revela cómo las diferentes plataformas vernáculas dan forma a las culturas de los memes, arrojando luz sobre lo que es común entre dos o más plataformas, y lo que falta o está ausente.

1. Introducción

La investigación que llevamos a cabo durante la Escuela de Invierno de Métodos Digitales 2022 ofrece una descripción de cómo se identifican y detectan los memes dentro y entre diferentes entornos de software, contribuyendo así al campo más amplio de la investigación de memes. Más específicamente, este trabajo tiene como objetivo mapear la composición técnica de las imágenes meméticas y cómo este tecnicismo se relaciona o es específico de uno o varios entornos de software. El proyecto se basa en un artículo de investigación reciente, "¿Qué es un meme, técnicamente hablando?" (Rogers y Giorgi, en revisión), que concibe los memes como colecciones de artefactos moldeados por el software que los genera.

La investigación existente entiende los memes como artefactos culturales multimodales, que los usuarios crean, remezclan y hacen circular a través de plataformas digitales (Shifman, 2014; Milner, 2016; Davison, 2012). Su origen se remonta a los espacios digitales marginales y, hasta principios de la década de 2010, eran una prerrogativa de las comunidades subculturales que poblaban sitios web como 4chan y Reddit (cfr. Zanettou et al., 2018). Sin embargo, se ha hecho evidente que la relevancia de los memes también se ha extendido a los principales medios digitales, ya que se han convertido en una “práctica ubicua, posiblemente fundamental, de los medios digitales” (Miltner, 2018, p. 412). En este sentido, los memes se consideran un género completo, con conjuntos de reglas y convenciones definidas sociológicamente (Wiggins y Bowers, 2015).

En particular, los académicos han puesto énfasis en diferentes aspectos de los memes, como su tipología (Shifman, 2013; Laineste y Voolaid, 2016; Dynel, 2016), su circulación viral (Spitzberg, 2014) y su papel en diferentes entornos subculturales (Nissenbaum & Shifman, 2017; Miltner, 2018). Además del enfoque vernáculo, un aspecto interesante y relativamente poco estudiado consiste en la exploración de la tecnicidad, materialidad y relacionalidad de los memes ligada a las especificidades de la plataforma. Como lo describe Niederer (2019), esta “tecnicidad del contenido” está delimitada y co-constituida por el portador que los proporciona (p. 18). En este sentido, el punto de partida del presente trabajo es la definición de los memes como productos resultantes de una combinación de posibilidades técnicas, prácticas convencionalizadas y cultura participativa digital.

Tomando prestado el término 'tecnicidad' (Niederer & Van Dijck, 2010) para capturar la idea del meme como 'compuesto tecnológicamente' o 'co-constituido' por su entorno de software (Bucher, 2012), nos dispusimos a investigar los memes como productos en línea que pueden etiquetarse y recopilarse en bases de datos, software de creación de medios o generadores, identificados y etiquetados por software analítico y de visión y devueltos por 'búsqueda de memes' en paneles de datos de investigación y marketing. Cada software genera una colección de memes peculiar, destacando ciertas características y eclipsando otras. Es decir, las colecciones de objetos técnicos representados por los entornos de software tienen diferentes características que dependen de si se acumularon a través de una base de datos, plantillas, análisis, coincidencias u otra lógica. En esta luz,

3. Preguntas de investigación

Siguiendo el marco teórico esbozado anteriormente, esta investigación busca dar respuesta a estas preguntas de investigación:

  1. ¿Cómo contribuye el entorno de software en el que se delimitan los memes a dar forma a diferentes colecciones de memes?

  1. ¿Cómo afecta esa creación de conjuntos o colecciones a la investigación de memes?

A través de este estudio empírico, pretendemos mostrar que diferentes entornos de software contienen una lógica diferente a la formación de colecciones de memes. Con esto en mente, formulamos la siguiente hipótesis: las colecciones de objetos técnicos generados por los entornos de software tienen características únicas que dependen de si se acumularon a través de una base de datos, plantillas, análisis, coincidencias u otra lógica.

4. Conjuntos de datos iniciales

Selección de casos. La base de datos para esta investigación fue ensamblada por participantes de la Escuela de Invierno mediante la recopilación de imágenes en cuatro entornos de software seleccionados. Nuestra selección de plataformas, que podría describirse como una forma de muestreo de máxima variación (Etikan et al., 2016) con un enfoque en la diversidad y heterogeneidad de casos, incluye:

  1. CrowdTangle, una herramienta de marketing de la empresa Meta (ex Facebook), que se empleaba para extraer datos de Instagram y Facebook;

  2. Imágenes de Google;

  3. Imgur, un generador digital que proporciona plantillas para macros de imágenes;

  4. KnowYourMeme, uno de los repositorios de memes más antiguos y conocidos.

Recopilación de datos. Para capturar representaciones contemporáneas de lo que puede constituir un meme según estos entornos de software y enfatizar la comparabilidad, decidimos recopilar contenido memético en torno al tema de la pandemia de Covid-19, ya que lo consideramos un contenido altamente mediatizado que ha dado lugar a un intensa producción de contenido en diferentes plataformas (Murru y Vicari, 2021). Para mejorar aún más la operatividad de los resultados de las imágenes, la recopilación de datos se centró en el contenido en inglés (Pearce et al. 2018). Para garantizar un entorno de software "inglés", se utilizaron redes privadas virtuales, imitando un sistema basado en la ubicación en los Estados Unidos (Rogers, 2019).

Para ello, buscamos las palabras clave "covid meme" en las plataformas seleccionadas. El tablero de datos de marketing CrowdTangle ofrece la opción de "búsqueda de memes", donde se puede consultar contenido memético en Facebook e Instagram. Además, el tablero nos permite filtrar el idioma (seleccionamos "Inglés") y el tipo de contenido (seleccionamos "Fotos" para Facebook y "Fotos" y "Álbumes" para Instagram). Datos de Google Imágenes, Imgur y Know Your Meme se recopilaron con la herramienta ImageScraper (disponible en GitHub ). El rango de tiempo para los resultados de la búsqueda se restringió al año 2021.

Muestreo del conjunto de datos. Submuestreamos los datos extraídos con CrowdTangle de Instagram y Facebook, eligiendo las primeras 1000 imágenes ordenadas por el número total de interacciones (uno de los metadatos predeterminados proporcionados por CrowdTangle ). Para Imgur y Know Your Meme, se seleccionaron las primeras 1000 imágenes del resultado de la búsqueda, ordenadas por la calificación de interacción de los sitios web. El conjunto de datos de imágenes de Google consta de los primeros 500 resultados de imágenes debido a las limitaciones del alcance de la investigación. La Figura 1 detalla la composición de cada submuestra en términos del número de elementos considerados por entorno de software.

Figura 1. Proceso de creación de conjuntos de datos

5. Metodología

Nuestra investigación toma la forma de un análisis comparativo, destinado a revelar cómo los diferentes entornos de software identifican y agrupan los memes de manera diferente. Mediante el uso de métodos y herramientas digitales como ImageSorter y Google Vision, los memes recopilados se clasifican según sus propiedades formales, visuales y de contenido, lo que da como resultado un conjunto de formatos de memes, algunos más específicos de la plataforma que otros. Lo que un entorno de software representa como un meme diferencia de un entorno a otro. Por ejemplo, lo que Imgur enumera como un meme difiere de lo que Facebook o Instagram consideran como un meme al mirar sus mejores resultados. Estos contrastes se suman al argumento de Rogers y Giorgi (bajo revisión), de que el entorno del software contribuye a dar forma a las colecciones de memes.

El análisis de los datos digitales consistió en dos secciones de trabajo empírico, realizadas respectivamente por dos subgrupos diferentes de participantes. Específicamente, el análisis realizado por el Grupo 1 se basó en el análisis visual (Rogers, 2021), mientras que el Grupo 2 adoptó un enfoque de red de visión por computadora (Omena et. al. 2021; Omena 2021). En el resto de esta sección, ilustraremos ambos procedimientos metodológicos.

Grupo 1 - Exploración de colecciones de memes a través de un software de análisis visual automatizado. Tomando cada submuestra por separado, empleamos el software ImageSorter para analizar visualmente las colecciones devueltas por los cuatro entornos (Rogers, 2021). Al organizar las imágenes con ImageSorter por tono y color, la herramienta nos permitió identificar tanto grupos homogéneos de imágenes (Warren Pearce et al., 2018) como imágenes que se repiten con frecuencia. Contextualmente, también pudimos distinguir entre copias exactas e imágenes similares (Rogers, 2021). Luego profundizamos en el análisis de las similitudes y diferencias de los conglomerados, realizando una lectura atenta de las muestras, con foco en tres rasgos característicos:

  • Tipos de Imágenes Dominantes: qué tipologías de imágenes ocurrieron más en cada muestra, en términos de imágenes similares y copias;

  • Ontología: qué elementos materiales y estéticos caracterizaron cada plataforma;

  • Epistemología: lo que constituye un meme para cada plataforma a partir de las respectivas imágenes de cada muestra.

Además, con la ayuda de Memespector GUI (Chao, 2021), analizamos los metadatos de la imagen para extraer los sitios web donde se encontraron imágenes totalmente coincidentes. Esto nos ayudó a contextualizar la circulación de imágenes en la web (Omena et. al. 2021), para evaluar en qué medida cada submuestra resultó de imágenes relacionadas con otras plataformas o se compartieron principalmente en la misma plataforma de la que las extrajimos.

Grupo 2 - Exploración de colecciones de memes a través de la visión artificial. En un segundo nivel de análisis, seguimos un enfoque de red de visión por computadora (Omena et. al. 2021; Omena 2021) para estudiar las colecciones de imágenes capturadas en diferentes entornos de software. Se requirió una variedad de herramientas y software de investigación para implementar este método, como DownThemAll (Maier, Parodi & Verna, 2007), Memespector GUI (Chao, 2021), Google Spreadsheets, Table2Net y Gephi (Bastian, Heymann & Jacomy, 2009). ).

Construimos una red con salidas de visión por computadora (detección web Google Vision AI, es decir, entidades web) para nuestra colección de imágenes, creando nodos como plataformas (Facebook, Instagram, Imgur y KnowYourMeme ) y entidades web. Las entidades web pueden describirse como una cosa, una persona, un lugar (ubicación) o el nombre de una organización/evento detectado y reconocido en contenido basado en Internet. En nuestro contexto, proporcionaron referencias contextuales y culturales a nuestras colecciones de imágenes, pero yendo más allá del contenido de las imágenes mismas (Omena et. al. 2021). Sin renderizar las imágenes dentro de la red, pudimos dar sentido a la materialidad de los memes al observar las entidades web dominantes (centro de la red) y los contextos culturales específicos de los memes a través de las zonas periféricas de la red y los grupos de entidades web puente.

En la exploración y análisis visual de la red (Venturini, Jacomy & Jensen, 2019), nos enfocamos en las zonas fijas de la red, pero entendiendo el significado de la posición y el tamaño del nodo para el análisis de imágenes (ver Omena & Amaral, 2019). En la red a continuación, el tamaño del nodo de la plataforma significa el total de entidades web asociadas con la colección de imágenes de memes que provienen de una plataforma. El tamaño del nodo de la entidad web significa la cantidad de veces que se usó una entidad determinada para describir una o más imágenes (considerando todas las imágenes que provienen de diferentes plataformas). Siguiendo las posibilidades del algoritmo de diseño gráfico ForceAtlas2 (Jacomy, Venturini, Heymann & Bastian, 2014), la siguiente tabla explica la posición del nodo y cómo interpretamos la red.

Figura 2. ¿Cómo leer una red de plataformas y entidades web asociadas a imágenes de memes covid? Tabla explicativa y descriptiva (arriba) y visualización de red gif (abajo).

6. Hallazgos

6.1 Exploración de colecciones de memes a través de software para análisis visual automatizado.

Los principales hallazgos generados por el enfoque de análisis visual ilustrado en la sección de métodos se visualizan en la Figura 3. Como se ilustra en la barra de espectro superior, hubo varios formatos de imagen en los conjuntos de datos. Cuando se combinaron todos los conjuntos de datos, las capturas de pantalla de los tweets fueron el formato más dominante: una mirada más cercana reveló que este formato predominaba en CrowdTangle , mientras que el conjunto de datos de Imgur contenía la menor cantidad de ocurrencias, como se ilustra en la segunda barra de espectro en la Figura 3.

Si bien algunos de los conjuntos tenían formatos superpuestos, también había distinciones claras entre ellos. Mirando las especificidades de la plataforma, la mayor cantidad de macros de imágenes (es decir, imágenes con texto sobre una imagen y generalmente vistas como un formato de meme tradicional) se encontró en Imgur, mientras que CrowdTangle (Facebook e Instagram) contenía la menor cantidad de macros de imágenes. Por su parte, el conjunto de datos recuperado de CrowdTangleformatos destacados como retratos (imágenes de prensa de personas famosas, portadas de revistas y selfies), imágenes de texto de redes sociales (texto sin formato que está formateado en un diseño específico con colores específicos como una imagen para Historias de Instagram o publicaciones de Facebook, por ejemplo), redes sociales tarjetas de declaración (información que está formateada con texto e imágenes, para noticias o citas inspiradoras, por ejemplo) e infografías (que a menudo contienen gráficos y tablas). KnowYourMeme incluía múltiples plantillas de macros de imágenes (imágenes sin texto que se utilizan en los generadores de memes) y logotipos, mientras que los datos de Google Image mostraban imágenes de mercancías.

Al observar la aparición de imágenes, surge que las muestras extraídas de los conjuntos de datos de Google Images e Imgur contienen una cantidad significativa de imágenes similares. Estos conjuntos también presentaban una cantidad relativamente pequeña de imágenes iguales (duplicados), que en su mayoría eran macros de imágenes.

Al observar estos resultados, se puede argumentar que los entornos de software afectan en gran medida los conjuntos de imágenes recopilados. De hecho, los géneros dominantes de imágenes tienden a variar según la plataforma de la que se extraen. Si uno considerara como memes solo los formatos presentes en todos los conjuntos de datos, entonces los memes serían capturas de pantalla de tweets.

Figura 3. El espectro de formatos de memes y su circulación en la web.

6.2 Exploración de colecciones de memes a través de la visión artificial.

La detección de entidades web de #Google Vision como una herramienta precisa para identificar memes

La siguiente imagen-pared se genera con la técnica de reducción de dimensionalidad UMAP y se agrupa mediante PixPlot. Como puede ver, cómo las entidades web de Google Vision son sorprendentemente precisas en la identificación de memes, superando a Crowdtangle. Todas las imágenes tienen 'meme' en su descripción de entidad web, y la clasificación devuelve todos los memes de facto, construidos a través de plantillas familiares y macros de imágenes. La precisión de Google Vision al separar los memes de los que no son memes destaca la especificidad del medio de los memes: son colecciones digitales nativas, co-constituidas por los entornos de software en los que se difunden y circulan. De hecho, la detección de entidades web considera los sitios de circulación entre sus parámetros, mejorando así su precisión de clasificación. En otras palabras, si una imagen circula en un entorno memético y es parte de una extensa colección de imágenes similares, entonces esta imagen es probablemente un meme. Por lo tanto,

Figura 4. Uso de Pixplot para interrogar la precisión de las entidades web para la identificación de memes.

#Redes de visión por computadora para dar sentido a la colección de imágenes de memes

Las redes de visión por computadora se construyen sobre las características de visión por computadora, como la clasificación de imágenes y la detección de entidades web. Aquí utilizamos la detección de entidades web, yendo más allá y detrás del contenido de la imagen inmediata, y utilizando el entorno web como fuente de conocimiento contextual y cultural para aumentar y enriquecer el análisis de la imagen. A partir de las entidades web detectadas, construimos una red bipartita con un nodo de plataforma al que se vinculan las entidades web específicas de la plataforma. En el centro, encontramos entidades web compartidas, mientras que en la periferia las entidades web están asociadas con entornos web específicos y culturas de memes (Imgur, FB, IG, KnowYourMeme ). Entre pares de plataformas, podemos ver grupos puente que representan entidades web compartidas, en otras palabras, qué plataformas tienen en común.

Las redes de visión por computadora se construyen sobre las características de visión por computadora, como la clasificación de imágenes y la detección de entidades web. Aquí utilizamos la detección de entidades web, yendo más allá y detrás del contenido de la imagen inmediata, y utilizando el entorno web como fuente de conocimiento contextual y cultural para aumentar y enriquecer el análisis de la imagen. A partir de las entidades web detectadas, construimos una red bipartita con un nodo de plataforma al que se vinculan las entidades web específicas de la plataforma. En el centro, encontramos entidades web compartidas, mientras que en la periferia las entidades web están asociadas con entornos web específicos y culturas de memes (Imgur, FB, IG, KnowYourMeme ). Entre pares de plataformas podemos ver grupos puente que representan entidades web compartidas, en otras palabras, qué plataformas tienen en común.

 

Figura 5. Los elementos formales y temáticos que constituyen las imágenes de los memes covid. Entidades web compartidas asociadas con la colección de imágenes de memes multiplataforma (arriba).

Un análisis del grupo central muestra cómo las redes de visión artificial pueden contribuir a la ontología memética. La centralidad de la red de las entidades web dominantes, que funcionan como puentes entre plataformas, muestra a través de la planitud para el análisis de redes cómo la jerarquía ontológica de los modelos de visión por computadora captura lo que es un meme. Entidades como 'texto', 'imagen', 'captura de pantalla', 'título', 'caricatura', 'dibujo', 'cita' son componentes pre-meméticos que aún no son memes. En otras palabras, los elementos formales de los memes, sus bloques de construcción y las condiciones necesarias son, desde una perspectiva de red, entidades web multiplataforma. Estas entidades web centrales constituyen las primitivas ontológicas y epistemológicas del medio memético: qué es un meme, cómo podemos reconocerlo y cómo podemos crearlo. Como podemos ver, el único clúster temático en el centro está compuesto por entidades relacionadas con Covid, reflejando el diseño de consulta original y representándolo como centralidad de red. Un razonamiento similar se aplica a la ontología de un 'meme covid': debe decir algo sobre la pandemia, la campaña de vacunación y comprometerse con la política. Podemos argumentar que la investigación de memes realizada a través de redes de visión por computadora a menudo arrojará resultados similares: en el centro encontraremos primitivos meméticos, formales y temáticos, mientras que las constelaciones periféricas expresarán culturas de memes locales. debe decir algo sobre la pandemia, la campaña de vacunación y comprometerse con la política. 

Figura 6. Las zonas periféricas: culturas meme y vernáculos de plataforma

En las zonas periféricas de la red vemos una clara división. Por un lado, los memes covid están más orientados a la corriente principal, siendo Facebook presentado por la política dominante, mientras que Instagram es la cultura dominante. Por otro lado, vemos memes de nicho relacionados con la cultura nerd (Imgur) y la política alternativa (Know Your Meme). Ambos casos refuerzan el argumento de los memes como colecciones que responden al entorno de software en el que se insertan.

Las entidades web asociadas a los memes covid de Facebook exponen la pandemia y sus noticias relacionadas, también eventos actuales con especial enfoque en noticias políticas, personalidades políticas, políticas y políticas del país. Los memes están desconectados de la cultura pop y las referencias a la cultura de Internet. A continuación, ejemplos de entidades web asociadas exclusivamente con los memes covid de Facebook.

  • Memes como política dominante/figuras políticas:

    • modi, greg abbott, servicio nacional de salud, ron desantis, gobernador, florida, gobierno de la india

  • Los memes como noticias principales:

    • oficina de información de prensa, ministerio de salud, variante omicron, investigador diario filipino, transmisión de covid, ocupar demócratas, variante lambda, lavado de manos, covid largo, dosis, variante lambda

Figura 7. Red de entidades web de Facebook

En Instagram vemos una relación directa con los aspectos principales de la cultura pop. Por ejemplo, deportes y celebridades con entidades como messi, ronaldo, real madrid, equipo de fútbol de inglaterra . Además, el lenguaje visual obvio de Instagram, por ejemplo, moda, glamour y exageración, se identificó a través de entidades como socialité, vestimenta, turquesa, gafas de sol, criptomonedas, bitcoin, ethereum, belleza, estado físico, modelo . La cultura memética de los memes covid en Instagram no está directamente relacionada con la pandemia, las noticias o la política.

Figura 8. Red de entidades web de Instagram

Las entidades web exclusivas del entorno de software de Imgur se asocian principalmente con referencias culturales pop y se ubican en el cruce de la cultura pop y la cultura de Internet. Dentro de ellos, podemos detectar dos conjuntos distintos pero interrelacionados: el primero contiene referencias a la cultura nerd, mostrando entidades como Harry Potter, Batman, Voldemort, Hobbit, Studio Ghibli, Star Wars, Lord of the Rings, Dungeons and Dragons, Pixar, y Fullmetal Alchemist . El segundo conjunto parece estar relacionado con la cultura viral de internet y los fenómenos culturales en general: entre las entidades encontramos 'i can has cheezburger', tiger king, dog videos, okay boomer, guitar, depression .

Figura 8. Red de entidades web de Imgur

Mirando las entidades web asociadas con el archivo web Know Your Meme, surge un grupo de referencias de nicho y, por lo tanto, no convencionales. Al mismo tiempo, hay una falta sustancial de referencias a la política dominante oa la cultura dominante de las celebridades. En cambio, es posible identificar un enfoque general en los fenómenos de Internet y específico en la web vernácula profunda (Tuters, 2019), como lo sugieren entidades como wojak, corona chan, space karen, wookiepedia, 4 chan, deviantart, cheems . Además de eso, se puede observar que las referencias políticas son más representativas de las ideologías políticas extremas (tanto de extrema derecha como de extrema izquierda), como lo insinúa un grupo de entidades asociadas a la ideología Alt-right:Pepe the Frog, derecha, anthony fauci, espectro político, brújula política, autoritarismo y controversias sobre vacunas.

Figura 9. Red de entidades web KnowYourMeme

Mirando las entidades web de los cuatro clústeres, se puede argumentar que KnowYourMeme e Imgur juntos son más específicos y menos convencionales, con respecto a los otros dos entornos web considerados. Finalmente, la red también permite mirar el “al revés” de cada entorno de software, que contiene las entidades web comunes a las otras plataformas. En este sentido, es posible definir la producción memética de un espacio digital específico a partir de sus “sombras”, es decir, considerando lo que falta en los memes que produce y difunde. Es el caso del clúster de entidades web compartidas por Instagram, Know Your Meme e Imgur pero no por Facebook, como know your meme, broma, risa, entretenimiento, youtube, video viral, grogu, imgflip.

Figura 10. La “sombra de Facebook” o “al revés”

7. Discusión

Esta investigación, realizada durante la Escuela de Invierno de Métodos Digitales 2022, analiza la tecnicidad de los memes en relación con las especificidades de la plataforma. Este estudio sigue la trayectoria de investigación establecida por Rogers & Giorgi (en revisión) en su artículo '¿Qué es un meme, técnicamente hablando?', que propone demarcar la tecnicidad de los memes como colecciones de contenido generado por entornos de software.

Hablando epistemológicamente, cuando se observan los hallazgos, vale la pena discutir algunos puntos. En primer lugar, al observar qué es un meme técnicamente hablando con una lente lógica de tablero de marketing de redes sociales, esto constituye la ontología más amplia de lo que se considera un meme; Aquí no solo está presente el formato macro de imagen clásico, sino también muchos otros formatos diferentes. En segundo lugar, al observar qué es un meme técnicamente hablando con una lente lógica de generador y servidor de alojamiento de imágenes, esto constituye la ontología más estrecha de lo que se considera un meme; un formato macro de imagen clásico. En tercer lugar, al observar qué es un meme técnicamente hablando con un archivo de base de datos y una lente lógica de motor de búsqueda, la ontología se encuentra en algún punto intermedio; las macros de imagen clásicas se combinan con un par de otros formatos. Por último,

Desde el punto de vista del análisis de visión por computadora, inferimos qué es un meme a través de la detección de entidades web de Google Vision. La técnica de creación de redes permitió el análisis multiplataforma de imágenes utilizando todos los idiomas de Google y su soporte de tecnología Vision, pero sin ver las imágenes. No solo pudimos informar qué constituyen técnicamente los memes covid, sino que también captamos las lenguas vernáculas de los memes en varias plataformas. Inferimos temas específicos de la plataforma derivados de entidades web al cerrar la lectura de la periferia y las zonas medias de la red. Aquí, el análisis de memes requirió la experiencia de un equipo multidisciplinario y el reconocimiento de la tecnicidad del medio memético y sus entornos web.

8. Conclusión

La pregunta de investigación de qué es un meme, técnicamente hablando y cómo las plataformas de software construyen las colecciones de memes, es muy amplia. Nuestro proyecto de investigación solo ha comenzado a rascar la superficie de cómo se puede investigar empíricamente la tecnicidad de los memes. Al observar los resultados, se puede argumentar en general que lo que constituye un meme depende en gran medida del entorno del software, ya que un entorno web contextual específico de la plataforma y las definiciones difieren ampliamente según la plataforma. De hecho, este proyecto proporciona hallazgos empíricos que respaldan la afirmación principal de Rogers y Giorgi (en revisión), es decir, que los memes tienen una tecnicidad que los afecta materialmente como colecciones en estudio.

Aunque limitados, estos hallazgos también nos permiten concluir con una declaración especulativa sobre lo que lo anterior podría significar para la investigación de memes en general. La definición ontológica de lo que es un meme, basada en el entorno de software que analizamos, es más amplia de lo que los investigadores probablemente clasificarían como un meme (la macro de imagen clásica) e incluye más formatos de imagen. Esto implica que cuando los investigadores utilizan estas herramientas para realizar investigaciones de memes, lo que están investigando se está moviendo hacia un modo más amplio de análisis de imágenes virales, pasando de un tipo de investigación más vernáculo de nicho.

9. Referencias

Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. Third International AAAI Conference on Weblogs and Social Media, 361–362. https://doi.org/10.1136/qshc.2004.010033

Bucher, T. (2012). A technicity of attention: How software 'makes sense'. Culture Machine, 13, 1-23.

Chao, J. (2021). Memespector GUI: Graphical User Interface Client for Computer Vision APIs (Version 0.2) [Software]. Available from https://github.com/jason-chao/memespector-gui.

Davison, P. (2012). The language of internet memes. The social media reader, 120-134.

Dynel, M. (2016). “I has seen Image Macros!” Advice Animals memes as visual-verbal jokes. International Journal of Communication, 10, 29.

Jacomy M, Venturini T, Heymann S, Bastian M (2014) ForceAtlas2, a Continuous Graph Layout Algorithm for Handy Network Visualization Designed for the Gephi Software. PLoS ONE 9(6): e98679. https://doi.org/10.1371/journal.pone.0098679

Laineste, L., & Voolaid, P. (2016). Laughing across borders: Intertextuality of internet memes. The European Journal of Humour Research, 4(4), 26-49.

Maier, Nils; Parodi, Federico & Verna, Stefano (2007). DownThemAll (Version 4.04) [browser extention] . Available from https://www.downthemall.org/

Medialab Tools. Table2Net Available from https://medialab.github.io/table2net/

Milner, R. M. (2018). The world made meme: Public conversations and participatory media. MIT Press.

Miltner, K. M. (2014). “There’s no place for lulz on LOLCats”: The role of genre, gender, and group identity in the interpretation and enjoyment of an Internet meme. First Monday.

Miltner, K. M. (2018). Internet memes. The SAGE handbook of social media, 55, 412-428.

Niederer, S. (2019). Networked Content Analysis: The case of climate change. (1 ed.)

(Theory on Demand; No. 32). Hogeschool van Amsterdam, Lectoraat Netwerkcultuur.

Niederer, S., & Van Dijck, J. (2010). Wisdom of the crowd or technicity of content? Wikipedia as a sociotechnical system. New media & society, 12(8), 1368-1387.

Nissenbaum, A., & Shifman, L. (2017). Internet memes as contested cultural capital: The case of 4chan’s/b/board. New Media & Society, 19(4), 483-501.

Omena, J. J. (2021). Digital Methods and Technicity-of-the-Mediums. From Regimes of Functioning to Digital Research [Universidade Nova de Lisboa]. Available from https://run.unl.pt/handle/10362/127961

Omena, J. J., Elena, P., Gobbo, B., & Jason, C. (2021). The Potentials of Google Vision API-based Networks to Study Natively Digital Images. Diseña, (19), 1-1.

Omena, J. J., & Amaral, I. (2019). Sistemas de leitura de redes digitais multiplatform. In J. J. Omena (Ed.) Métodos Digitais: Teoria-Prática-Crítica. Lisboa: ICNOVA. ISBN: 978‐972‐9347‐34‐4

Rogers, R. (2019). Doing digital methods. Sage.

Rogers, R. (2021). Visual media analysis for Instagram and other online platforms. London. SAGE Publications Ltd.

Rogers, R., and Giorgi, G. (under review). ‘What is a meme, technically speaking?’.

Shifman, L. (2014). Memes in digital culture. MIT press.

Tuters, M. (2019). LARPing & liberal tears: Irony, belief and idiocy in the deep vernacular web. Available from https://mediarep.org/bitstream/handle/doc/13282/Post_Digital_Cultures_37-48_Tuters_LARPing_Liberal_Tears.pdf?sequence=1

Venturini, T., Jacomy, M., & Jensen, P. (2019). What do we see when we look at networks. arXiv preprint arXiv:1905.02202.

Pearce, W., Özkula, S. M., Greene, A. K., Teeling, L., Bansard, J. S., Omena, J. J., & Rabello, E. T. (2020). Visual cross-platform analysis: Digital methods to research social media images. Information, Communication & Society, 23(2), 161-180.

Spitzberg, B. H. (2014). Toward a model of meme diffusion (M3D). Communication Theory, 24(3), 311-339.

Wiggins, B. E., & Bowers, G. B. (2015). Memes as genre: A structurational analysis of the memescape. New media & society, 17(11), 1886-1906.

Zannettou, S., Caulfield, T., Blackburn, J., De Cristofaro, E., Sirivianos, M., Stringhini, G., & Suarez-Tangil, G. (2018, October). On the origins of memes by means of fringe web communities. In Proceedings of the Internet Measurement Conference 2018 (pp. 188-202).

 

domingo, 26 de julio de 2020

Dime que twitteas y te diré quién eres

Lo que dicen tus tweets sobre ti


Por Maria Konnikova || The New Yorker
17 de marzo de 2015


Ilustración de Keith Negley.

¿Cuánto pueden revelar tus tweets sobre ti? A juzgar por las últimas novecientas setenta y dos palabras que usé en Twitter, soy casi normal cuando se trata de sentirme optimista y ser agradable, y tengo menos probabilidades que la mayoría de las personas de estar deprimido o enojado. Esa, al menos, es la instantánea proporcionada por AnalyzeWords, una de las últimas creaciones de James Pennebaker, un psicólogo de la Universidad de Texas que estudia cómo el lenguaje se relaciona con el bienestar y la personalidad. Uno de los proyectos más famosos de Pennebaker es un programa de computadora llamado Investigación lingüística y recuento de palabras (LIWC), que analiza las palabras que usamos, y en qué frecuencia y contexto, y utiliza esta información para medir nuestros estados psicológicos y varios aspectos de nuestra personalidad. .

Desde la creación de L.I.W.C., en 1993, los estudios que utilizan el programa han sugerido una estrecha conexión entre nuestro lenguaje, nuestro estado mental y nuestro comportamiento. Han demostrado, por ejemplo, que las palabras que se usan durante las citas rápidas pueden predecir el interés romántico mutuo y el contacto futuro deseado; que las elecciones de palabras de una persona pueden revelar su lugar en una jerarquía social o profesional; y que el uso de diferentes palabras de relleno ("quiero decir"; "Sabes") puede sugerir si un hablante es hombre o mujer, más joven o más viejo y más o menos concienzudo. Incluso las formas en que usamos palabras como "y", "debajo" o "el" pueden estar relacionadas con la depresión, las reacciones al estrés, el estado social, las normas culturales, el género y la edad. "Las palabras que usamos en lenguaje natural reflejan nuestros pensamientos y sentimientos de maneras a menudo impredecibles", escribieron Pennebaker y su colega Cindy Chung.

Las redes sociales parecen hechas a medida para llevar este tipo de análisis de lenguaje al siguiente nivel. No tiene que solicitar escribir muestras o entradas de diario. Ya está todo en línea: los tweets, las publicaciones de Tumblr e incluso los subtítulos de Instagram brindan a los investigadores acceso al lenguaje que las personas usan en una escala sin precedentes. Pero el mundo del análisis del lenguaje de las redes sociales también está lleno de dificultades. "El mayor problema con este enfoque es establecer la causalidad", dijo Pennebaker, cuando hablé con él la semana pasada.

Tome un estudio, el mes pasado, de un grupo de investigadores con sede en la Universidad de Pennsylvania. El psicólogo Johannes Eichstaedt y sus colegas analizaron ochocientos veintiseis millones de tweets en mil cuatrocientos condados estadounidenses. (Los condados contenían cerca del noventa por ciento de la población de los EE. UU.) luego, usando listas de palabras, algunas desarrolladas por Pennebaker **, otras por el equipo de Eichstaedt, que pueden asociarse de manera confiable con ira, ansiedad, compromiso social ** ** y emociones positivas y negativas, le dieron a cada condado un perfil emocional. Finalmente, hicieron una pregunta simple: ¿podrían esos perfiles ayudar a determinar qué condados tendrían más muertes por enfermedad cardíaca?

La respuesta resultó ser que sí. Los condados donde los tweets de los residentes incluían palabras relacionadas con la hostilidad, la agresión, el odio y la fatiga (palabras como "imbécil", "celoso" y "aburrido") tenían tasas significativamente más altas de muerte por enfermedad cardíaca aterosclerótica, incluidos ataques cardíacos y trazos Por el contrario, donde los tweets de las personas reflejaban emociones y compromiso más positivos, la enfermedad cardíaca era menos común. El modelo basado en tweets incluso tenía más poder predictivo que otros modelos basados ​​en factores demográficos, socioeconómicos y de riesgo para la salud tradicionales.

Hace tiempo que se sabe que el estrés, la ira y la soledad aumentan el riesgo de ataques cardíacos y otras afecciones cardíacas, a menudo fatales. Pero eso no hace que los resultados de este estudio sean menos extraños. Incluso los investigadores hacen sonar una nota de advertencia: "Las personas que tuitean no son las personas que mueren", señalan. No se demostró que los tweets de una persona predicen su riesgo de enfermedad cardíaca; en cambio, los tweets colectivos negativos en ciertas partes del país correspondieron a tasas de mortalidad más altas en esas áreas. Esa correlación es especialmente extraña porque las personas que tuitean son, en general, más jóvenes que las personas que mueren de enfermedades cardíacas. Según las estadísticas más recientes del Pew Research Center, alrededor del diecinueve por ciento de los adultos estadounidenses usan Twitter; de esos usuarios, solo el 22% son mayores de 50 años. El riesgo de ataques cardíacos, por otro lado, aumenta con la edad, aumenta bruscamente en los años sesenta y continúa aumentando durante los ochenta. ¿Cómo pueden los hábitos negativos de tuiteo de algunos jóvenes revelar que las personas mayores no relacionadas pero cercanas están en riesgo?

Los investigadores tienen una teoría: sugieren que "el lenguaje de Twitter puede ser una ventana a los efectos agregados y poderosos del contexto comunitario". Señalan otros estudios epidemiológicos que han demostrado que los hechos generales sobre una comunidad, como su "cohesión social y capital social", tienen consecuencias para la salud de las personas. En términos generales, las personas que viven en comunidades más pobres y fragmentadas son menos saludables que las personas que viven en comunidades más ricas e integradas. "Cuando hacemos un subanálisis, encontramos que el poder que tiene Twitter es en gran parte responsable de la comunidad y variables socioeconómicas ”, me dijo Eichstaedt cuando hablamos por Skype. En resumen, los tweets negativos, enojados y estresados de una persona joven pueden reflejar su entorno inductor de estrés, y ese mismo entorno puede tener repercusiones negativas para la salud de otros miembros mayores de la misma comunidad.
Y, sin embargo, esa historia es solo especulación: nada en el estudio examina directamente cómo los niveles de estrés varían de un condado a otro o vincula los sentimientos de los usuarios de Twitter con la salud de sus mayores. La semana pasada, cuando hablé con Pennebaker sobre estos hallazgos, él también me instó a tener cuidado al sacar conclusiones causales del estudio. (No participó en la investigación y no está afiliado a nadie en el equipo). "Decir que los jóvenes de dieciocho años que twittean mensajes hostiles está asociado con la muerte súbita de sus bisabuelos es un gran salto de lógica, " él dijo. La relación podría ser tanto estadísticamente significativa como algo casual. Sin embargo, esa posibilidad no necesariamente hace que el trabajo sea menos valioso: "Incluso si resulta que en realidad no hay una conexión real, te obliga a pensar. ¿Cuál es la causalidad? Pennebaker dijo. El análisis del lenguaje a gran escala puede ser interesante precisamente porque plantea preguntas, no porque las responda.

Mientras tanto, el equipo de Eichstaedt está refinando su trabajo. Los investigadores ahora están colaborando con un grupo que realiza investigación epidemiológica longitudinal; el plan es rastrear comunidades e individuos a lo largo del tiempo, en lugar de mirar una instantánea a gran altitud. (Los tweets en el estudio de enfermedades del corazón eran parte de una muestra aleatoria del diez por ciento que Twitter puso a disposición de los investigadores entre junio de 2009 y marzo de 2010; idealmente, la investigación seguiría a usuarios individuales durante muchos meses, si no años.) Eichstaedt también está en el proceso de mirar los perfiles de Facebook: los datos de Twitter, dice, arrojan una amplia red, pero no es tan expresiva, profunda e individual como la información en Facebook. No todos los grandes datos se crean de la misma manera.

La investigación de Eichstaedt es típica de la psicología de big data de hoy: es fascinante, pero un trabajo en progreso. Por un lado, se basa en la correlación más que en la causalidad; Por otro lado, puede ofrecer una ventana más rápida y barata a los modelos causales existentes. Y, para los psicólogos, ese trabajo es una forma de arrojar luz sobre tendencias culturales y sociales más grandes que son difíciles de capturar a través de la investigación de laboratorio ordinaria. Pennebaker, por ejemplo, actualmente utiliza datos de Twitter para identificar y rastrear cómo ciertos valores, como la cohesión familiar y la fe religiosa, cambian con el tiempo.

Los datos del lenguaje de las redes sociales, además, no tienen que usarse para estudiar grupos grandes; puede aplicarse de manera útil a individuos en lugar de comunidades. En 2013, un grupo de Microsoft Research analizó unos setenta mil tweets escritos por personas que sufren de depresión; Luego crearon un índice predictivo que podría identificar a otros usuarios que probablemente estaban deprimidos en función de sus publicaciones en las redes sociales. El mismo grupo también creó un modelo para predecir el riesgo de depresión posparto en nuevas madres. Analiza los tweets de personas que han hecho anuncios de bebés y luego realiza un seguimiento de los cambios en el lenguaje emocional antes, durante y después del embarazo. (Alice Gregory, en un artículo reciente de esta revista, describió un esfuerzo similar de "análisis predictivo" en Crisis Text Line, un servicio de asesoramiento basado en mensajes de texto para adolescentes). Eichstaedt imagina un mundo en el que un psiquiatra, por ejemplo, podría solicite permiso para monitorear el teléfono de un paciente, analizar correos electrónicos, mensajes de texto, actualizaciones de redes sociales y similares, y enviar una alerta si aumentan los riesgos de ciertos estados psicológicos, como la depresión.

Y, señaló Pennebaker, escribir en las redes sociales puede tener valor terapéutico, independientemente de su valor predictivo para los experimentadores. Durante décadas, los estudios de Pennebaker han demostrado que cuando las personas llevan un diario, tienden a mejorar emocionalmente, a recuperarse más rápidamente de las experiencias negativas y a obtener más logros académicos y profesionales. Otro trabajo reciente sugiere que las redes sociales brindan los mismos beneficios, a pesar del hecho de que, a diferencia de una revista, es inherentemente público. Un estudio de 2013 encontró que los bloggers recibieron los mismos estímulos terapéuticos que las personas que mantienen diarios regulares; Además, los mayores beneficios se obtuvieron al escribir entradas que estaban abiertas a comentar, que en realidad fueron más beneficiosas que las entradas de diario privadas. Los investigadores quieren usar las redes sociales para aprender sobre ti. Pero al escribir en un espacio público también puede estar aprendiendo y ayudándose a sí mismo.

viernes, 22 de mayo de 2020

COVid19: Caracterizando influyentes en Twitter

Caracterización de líderes de información en Twitter durante la crisis COVID-19


David Pastor-Escudero, Carlota Tarazona
ARXiv

La información es clave durante una crisis como la actual pandemia de COVID-19, ya que da forma a la opinión, el comportamiento e incluso su estado psicológico. El Secretario General de las Naciones Unidas ha reconocido que la infodemia de desinformación es una importante crisis secundaria producida por la pandemia. La infodemia puede amplificar las verdaderas consecuencias negativas de la pandemia en diferentes dimensiones: social, económica e incluso sanitaria. Por ejemplo, la infodemia puede generar odio entre los grupos de población que fragmentan la sociedad que influye en su respuesta o dan como resultado hábitos negativos que ayudan a propagar la pandemia. Por el contrario, se puede utilizar información confiable y confiable junto con mensajes de esperanza y solidaridad para controlar la pandemia, construir redes de seguridad y ayudar a promover la resiliencia y la antifragilidad. Proponemos un marco para caracterizar a los líderes en Twitter basado en el análisis del gráfico social derivado de la actividad en esta red social. Las métricas de centralidad se utilizan para identificar nodos relevantes que se caracterizan aún más en términos de parámetros de usuarios administrados por Twitter. Luego evaluamos la topología resultante de grupos de líderes. Aunque esta herramienta puede usarse para la vigilancia de individuos, la proponemos como la base para una aplicación constructiva para empoderar a los usuarios con una influencia positiva en el comportamiento colectivo de la red y la propagación de información.



martes, 5 de mayo de 2020

Usando aprendizaje automático para predicción del brote de COVID-19

Una metodología de aprendizaje automático para la predicción en tiempo real del brote COVID-19 2019-2020 mediante búsquedas en Internet, alertas de noticias y estimaciones de modelos mecanicistas

Dianbo Liu, Leonardo Clemente, Canelle Poirier, Xiyu Ding, Matteo Chinazzi, Jessica T Davis, Alessandro Vespignani, Mauricio Santillana
ArXiv


Presentamos una metodología oportuna y novedosa que combina estimaciones de enfermedades a partir de modelos mecanicistas con trazas digitales, a través de metodologías de aprendizaje automático interpretables, para pronosticar de manera confiable la actividad COVID-19 en las provincias chinas en tiempo real. Específicamente, nuestro método es capaz de producir pronósticos estables y precisos 2 días antes de la hora actual, y se utiliza como insumos (a) informes oficiales de salud del Centro Chino para el Control y la Prevención de Enfermedades (CDC de China), (b) relacionados con COVID-19 actividad de búsqueda en Internet de Baidu, (c) actividad de medios informativos informada por Media Cloud, y (d) pronósticos diarios de actividad COVID-19 de GLEAM, un modelo mecanicista basado en agentes. Nuestra metodología de aprendizaje automático utiliza una técnica de agrupamiento que permite la explotación de sincronías geoespaciales de la actividad COVID-19 en las provincias chinas, y una técnica de aumento de datos para tratar el pequeño número de observaciones históricas de actividad de la enfermedad, característica de brotes emergentes. El poder predictivo de nuestro modelo supera a una colección de modelos de referencia en 27 de las 32 provincias chinas, y podría extenderse fácilmente a otras geografías actualmente afectadas por el brote de COVID-19 para ayudar a los tomadores de decisiones.







jueves, 6 de febrero de 2020

Dinámica de la expresión afectiva en redes sociales

La dinámica individual de la expresión afectiva en las redes sociales


Max Pellert, Simon Schweighofer y David García

EPJ Data Science volumen 9, Número de artículo: 1 (2020)

Citar como:
Pellert, M., Schweighofer, S. & Garcia, D. The individual dynamics of affective expression on social media. EPJ Data Sci. 9, 1 (2020). https://doi.org/10.1140/epjds/s13688-019-0219-3

Resumen
Comprender la dinámica temporal del afecto es crucial para comprender las emociones humanas en general. En este estudio, probamos empíricamente un modelo computacional de dinámica afectiva analizando un conjunto de datos a gran escala de actualizaciones de estado de Facebook utilizando técnicas de análisis de texto. Nuestros análisis respaldan los supuestos centrales de nuestro modelo: después de la estimulación, los estados afectivos, cuantificados como valencia y excitación, regresan exponencialmente a una línea de base específica de cada individuo. En promedio, esta línea base tiene un valor de valencia ligeramente positivo y un punto de activación moderado por debajo del punto medio. Además, la expresión afectiva, en este caso publicar una actualización de estado en Facebook, empuja inmediatamente la excitación y la valencia hacia la línea de base en un valor proporcional. Estos resultados son sólidos para la elección de la técnica de análisis de texto e ilustran la rápida escala de tiempo de la dinámica afectiva a través del texto de las redes sociales. Estos resultados son de gran relevancia para la computación afectiva, la detección y el modelado de emociones colectivas, el refinamiento de la metodología de investigación psicológica y la detección de dinámicas de afectos individuales anormales y potencialmente patológicos.

“Cuando estés enojado, cuenta diez antes de hablar; si estás muy enojado, cuenta hasta cien.

Thomas Jefferson



Introducción

Las emociones tienen una profunda influencia en la cognición y el comportamiento humano en muchos dominios [1]: sesgan la memoria, la percepción y la toma de decisiones [2] y proporcionan retroalimentación sobre el pasado y orientación para el comportamiento actual [3]. Algunos de los trastornos mentales más frecuentes, como la depresión y el trastorno de ansiedad, se caracterizan por estados emocionales anormales [4–6]. Además, las emociones tienen una función social. Experimentar emociones induce una tendencia a compartirlas con otros, haciéndolas experimentar también estas emociones [7], dando lugar a emociones colectivas con un impacto a menudo profundo en la sociedad en general [8, 9].

Si bien la influencia de las emociones en la cognición y el comportamiento está bien establecida, la mayoría de los estudios dejan de lado un aspecto crucial: la dinámica temporal de los estados emocionales. Se supone comúnmente que las emociones se relajan con el tiempo si no se reestimulan [10-12]. ¿Pero a qué ritmo se relajan los estados emocionales? Saber esto nos dirá cuánto tiempo después de un evento inductor de emociones se puede esperar que dure el impacto cognitivo y conductual de las emociones. Por ejemplo, ¿es suficiente seguir los consejos de Jefferson y contar hasta diez o cien para evitar los efectos negativos de la ira? Una segunda pregunta se refiere a la línea de base a la que regresan las emociones después de un evento inductor de emociones: ¿volvemos a un estado de emociones completamente neutrales o hay líneas de base individuales desplazadas del punto medio? Además, la expresión de las emociones puede tener un efecto en la dinámica afectiva: si ignoramos el consejo de Jefferson y expresamos nuestras opiniones mientras todavía estamos enojados, ¿este acto expresivo relajará nuestro estado emocional y, de ser así, en qué medida?

En este estudio, queremos abordar estas preguntas (i) formulando un modelo matemático de dinámica afectiva y (ii) probando este modelo analizando los rastros digitales de la expresión afectiva espontánea, en forma de un conjunto de datos a gran escala de Facebook actualizaciones de estado.

Este enfoque de probar hipótesis psicológicas con datos en línea todavía es nuevo, pero ya ha demostrado su valía [13]. Por ejemplo, se ha demostrado que la experiencia de estados emocionales excitados conduce al intercambio de información en las redes sociales [14] y, a su vez, que la expresión emocional en línea puede impulsar el contagio emocional [15], puede regular las emociones a través del etiquetado [16], y puede afectar la felicidad a través de la comparación social [17] y la popularidad a través de la regulación social de las emociones [18]. Otros estudios han demostrado cómo el estado de ánimo oscila durante las estaciones [19] y cómo la contaminación del aire está relacionada con el bienestar expresado [20]. Según los datos en línea, también es posible detectar emociones colectivas fuertes, tal como aparecieron en Francia después de los ataques terroristas de París en noviembre de 2015, y mostrar cómo pueden contribuir al aumento de la solidaridad y la resiliencia social [21].

Analizar los datos en línea nos ayuda a evitar algunas de las limitaciones de los métodos más tradicionales para cuantificar los estados emocionales. Si bien los autoinformes de estados emocionales momentáneos pueden mostrar su dinámica cuando se recopilan a través de dispositivos de mano [10], este método requiere que los participantes evalúen sus emociones varias veces al día, interrumpiendo su rutina diaria y afectando su atención. La alta demanda de los participantes del estudio limita el tamaño de las muestras y la aplicabilidad de este método. Otra investigación ha utilizado experimentos controlados para provocar reacciones emocionales y rastrear su evolución a lo largo del tiempo [12]. Si bien esto tiene la ventaja de resaltar la dinámica de las emociones en contraste con las fuentes externas de ruido, sufre una serie de limitaciones a la validez externa. La exposición artificial a estímulos en experimentos puede diferir mucho de las propiedades de la exposición natural en situaciones del mundo real [22]. La investigación de laboratorio también puede sufrir otras limitaciones, como los efectos experimentales que distorsionan la dinámica de las emociones [23].
Las grandes cantidades de datos producidos por los usuarios de las redes sociales ofrecen una forma de complementar la investigación previa sobre la dinámica de las emociones. Pero el uso de datos de redes sociales en la ciencia afectiva también tiene limitaciones. El resultado de los métodos de análisis de sentimientos comunes en las publicaciones en las redes sociales durante largos períodos de tiempo tiene una baja correlación con el resultado de cuestionarios sobre estados de ánimo persistentes [24]. Sin embargo, a escalas de tiempo más rápidas, el análisis de sentimientos del texto de las redes sociales se correlaciona con autoinformes individuales de estados afectivos momentáneos [12]. Por lo tanto, el análisis de los datos en línea puede, a pesar de sus limitaciones, complementar métodos psicológicos más tradicionales de manera importante.

La cuantificación de las dinámicas emocionales tiene potenciales aplicaciones de investigación adicionales que motivan nuestro trabajo. A través de un enfoque social-interaccionista [25], una mejor comprensión de la dinámica afectiva individual también puede ayudarnos a explicar la aparición de emociones colectivas. Se presume que las emociones colectivas se sostienen por períodos más largos que las reacciones emocionales puramente individuales [9]. Por lo tanto, tener una mejor estimación de la escala de tiempo promedio de las emociones individuales puede ayudarnos a identificar empíricamente las emociones colectivas. Y, por último, el conocimiento sobre la dinámica afectiva típica en la población general también puede ayudarnos a detectar dinámicas anormales, que se han relacionado con trastornos mentales como la depresión [6, 26].

Modelando dinámicas afectivas

La dinámica individual del afecto captura los cambios en los estados emocionales a lo largo del tiempo independientemente de la interacción social u otros estímulos externos. En 2010, dos equipos de investigación formularon de forma independiente modelos de dinámica individual de afecto: el marco Cyberemotions [11] y el modelo DynAffect [10]. Ambos grupos se centraron en el núcleo afectan las dimensiones de la valencia (agradable frente a desagradable) y la excitación (excitado frente a la calma) [27]. Además, ambos grupos asumieron que el afecto (tanto la valencia como la excitación) se relajan exponencialmente hacia una línea de base. El marco de Cyberemotions tiene como objetivo modelar la aparición de emociones colectivas en las comunidades en línea, dejando que cada modelo en el marco defina detalles sobre la interacción en línea [11]. Para este fin, este marco también incluye los antecedentes y efectos de la expresión emocional en la dinámica afectiva. En particular, el marco de Cyberemotions supone que expresar emociones tendría un efecto de retroalimentación reguladora sobre el estado emocional, una afirmación respaldada por la investigación psicológica [28].

Algunos supuestos del marco de Cyberemotions han sido probados empíricamente en experimentos que involucran leer y escribir publicaciones emocionales en línea [12]. El efecto se cuantificó mediante autoevaluaciones y detección de sentimientos en los mensajes de los participantes. El modelo DynAffect se probó en dos experimentos utilizando el muestreo de experiencia repetida de una cohorte de estudiantes en circunstancias de la vida cotidiana [10]. Si bien la evidencia valida en gran medida la dinámica de Dynaffect, los estudios produjeron resultados desconcertantes con respecto a la fuerza de la relajación exponencial del afecto: las estimaciones de los parámetros de relajación afectiva fueron mucho mayores en el primer experimento que en el segundo. Esto fue inesperado, porque la única diferencia importante entre los dos experimentos fue que la tasa de muestreo de la experiencia, es decir, con qué frecuencia los participantes tenían que calificar su valencia y excitación actuales, era más frecuente en el primer experimento. Sin embargo, si vemos estas calificaciones como una forma de expresión afectiva, el efecto de retroalimentación de regulación postulado por el modelo Cyberemotions puede explicar por qué las expresiones más frecuentes conducen a una relajación afectiva aparentemente más rápida.

Por lo tanto, para nuestro estudio actual, combinamos el supuesto de relajación exponencial de ambos modelos con el postulado de DynAffect de líneas de base afectivas individuales [10] y el efecto de regulación de la expresión afectiva del modelo Cyberemotions [11, 12].

Formalizamos estos supuestos siguiendo el formalismo del marco de Cyberemotions [11, 12]. Cuantificamos el estado emocional de un individuo en el tiempo t a través de su valencia y excitación . La dinámica de valencia y excitación solo difiere en sus valores de parámetros, no en su forma matemática, y por lo tanto denotamos como valencia o excitación en las ecuaciones generales.

Nuestro modelo de emociones individuales consta de dos partes. Primero, el efecto de la expresión, mediante el cual la acción de publicar una actualización de estado induce una regulación descendente instantánea de la emoción por un factor constante k:


(1)

En la ecuación anterior, individualmente comencé a escribir una actualización de estado en el momento anterior, expresando un estado emocionale , cuantificado como valencia o excitación. El estado emocional del individuo cuando publica la actualización de estado es . Para simplificar, suponemos que la escala de tiempo de la escritura es más rápida que la escala de tiempo entre la publicación de actualizaciones de estado, y por lo tanto modelamos el efecto de la escritura en xi como un cambio instantáneo. La línea de base de x para el individuo es μi, que denota el estado fundamental en el que las emociones del individuo tenderían a ser estables a lo largo del tiempo en ausencia de estímulos. Esta línea de base individual se puede medir a través del promedio de varios estados emocionales (valencia y excitación) medidos para el mismo individuo durante largos períodos de tiempo. Utilizamos este enfoque como explicamos más adelante en la Secta. 3.3. Después de la expresión de la emoción, el estado del individuo cambia instantáneamente a un valor ajustado por la distancia a la línea de base multiplicado por un factor constante k. Esta ecuación modela una regulación estable hacia la línea base cuando , que se ha observado previamente en experimentos [12]. En nuestros análisis empíricos, probamos las hipótesis de que k es mayor que cero y menor que 1, es decir, que existe un efecto de expresión que atenúa las emociones hacia una línea de base individual fija.

El segundo componente de la dinámica emocional en nuestro modelo es la relajación interna de los estados emocionales. Siguiendo el marco de modelado [11] y las observaciones empíricas [10], modelamos la relajación interna de las emociones como un proceso de reversión de la media hacia la línea de base:


(2)

En la ecuación anterior, el cambio en el estado emocional por unidad de tiempo es proporcional a la diferencia de ese estado emocional a la línea de base individual μi
. El término de ruido ξ (t) captura las fuerzas externas que cambian las emociones y que no estamos modelando en este caso. El coeficiente γ cuantifica esa relajación proporcional hacia la línea de base. Cuando 0 <γ <1, el valor de se aproxima a la línea de base con el tiempo. Este tipo de relajación exponencial se ha observado en investigaciones empíricas anteriores [10, 12], que sirve como punto de partida de nuestro modelo de dinámica individual. En este caso, cuando el valor de está por debajo de la línea de base, el valor de aumenta con el tiempo, acercándose a la línea de base desde abajo. Nuestro análisis empírico tiene como objetivo probar las hipótesis de que γ está por debajo de 1 y por encima de cero, estimando el mejor valor de γ.

La ecuación (2) es un ejemplo de un proceso de Ornstein-Uhlenbeck [29]. Podemos formular el valor esperado de después de un tiempo Δt fijo:
:

(3)

Combinamos esta solución con el efecto de expresión de la ecuación (1) para formular el modelo estadístico explicado en la sección. 3.3.

Datos y métodos.

Análisis de texto de expresión afectiva

Estudiamos las emociones como afecto central [30], es decir, estados psicológicos de corta duración de alta relevancia para el individuo que no necesitan tener un objetivo particular. Los estados en el núcleo del afecto se miden en términos de valencia y excitación. La valencia cuantifica el grado de placer asociado con una emoción y excita la activación inducida por esa emoción. Por ejemplo, la palabra "alegría" manifiesta una valencia positiva, un estado de alta excitación, mientras que la palabra "tristeza" se usa para expresar una valencia negativa, un estado de baja excitación. Se pueden anotar más palabras en este espacio de valencia y excitación, un método popularizado por el léxico ANEW [31] que se basa en el método diferencial semántico [32]. Tenga en cuenta que este enfoque supone que el afecto se puede medir a partir de su expresión a través de la comunicación humana. Si bien se puede esperar un nivel sustancial de ruido al usar estos métodos de análisis de texto para cuantificar las emociones, el uso de datos a gran escala de las redes sociales y otros recursos digitales permite el análisis de las emociones individuales y colectivas a través de patrones temporales y estructurales [16, 19 21, 33, 34].

Cuantificamos la valencia y la excitación expresada en cada actualización de estado a través de métodos no supervisados ​​que calculan las puntuaciones medias sobre términos derivados en un texto [35]. Para verificar que nuestros resultados no son un artefacto de un léxico particular, empleamos dos léxicos generados con diferentes esquemas de anotación: el léxico de las Normas Afectivas (WKB: Warriner – Kuperman – Brysbaert) [36], que incluye 13,915 lemmas que cubren los términos más frecuentes de un corpus de subtítulos, y el léxico NRC (National Research Council Canada) Valence, Arousal, and Dominance (NRC-VAD) [37], que incluye más de 20,000 términos seleccionados de varias fuentes. Nos referimos a estos métodos de análisis de texto para cuantificar la valencia y la excitación como el método WKB y el método NRC-VAD respectivamente. En el texto principal presentamos los resultados utilizando el método WKB e informamos los resultados utilizando el método NRC-VAD como alternativa en los materiales complementarios.

Si bien se han desarrollado otros métodos además de WKB y NRC-VAD para medir el sentimiento o el afecto del texto de las redes sociales, el léxico de estos dos métodos es el más completo, cubre los rangos más amplios de términos emocionales, y su principio fundamental ha sido validado en referencia estudios [38, 39]. La flexibilidad de estos métodos no supervisados ​​para cuantificar la expresión afectiva permite la generalización de nuestros análisis más allá de Facebook. Esto no sería posible si aplicamos métodos supervisados ​​entrenados solo para Facebook como un dominio particular [40]. Otros métodos no supervisados ​​han alcanzado altos niveles de precisión para las tareas de anotación de sentimientos en términos de clases de sentimientos (positivo, negativo, neutral) [38]. Entre los mejores se encuentra VADER [41], una herramienta que devuelve un puntaje numérico de sentimiento que ha sido entrenado y validado contra datos categóricos. Si bien esta herramienta se ha demostrado útil para caracterizar la valencia promedio del conjunto en Twitter [16], no podemos usarla para rastrear los valores de valencia a nivel individual debido a la distribución trimodal de las puntuaciones VADER (ver Fig. 9 en Materiales suplementarios).

Conjunto de datos de actualizaciones de estado de Facebook

Analizamos un conjunto de datos de actualizaciones de estado de Facebook generadas por el proyecto MyPersonality [42]. Este conjunto de datos contiene más de 22 millones de actualizaciones de estado que fueron provistas voluntariamente para la investigación académica por 153,727 usuarios de Facebook entre 2009 y 2011. A través del consorcio MyPersonality, accedimos a un conjunto de datos anónimo de actualizaciones de estado sin ninguna información de identificación personal. Este conjunto de datos y subconjuntos han sido utilizados en investigaciones previas sobre el reconocimiento computacional de la personalidad [43], la preferencia en la música [44] y el sentimiento de afiliación religiosa [45]. Filtramos las observaciones del conjunto de datos sin procesar de acuerdo con la siguiente directriz: Primero, descartamos pares de actualizaciones de estado posteriores que no pueden asignarse al menos un término de nuestro léxico de sentimientos cada una. Además, eliminamos los usuarios de baja actividad que actualizaron su estado menos de 20 veces durante todo el período de observación. Después del preprocesamiento de datos, 114,967 usuarios nos dejan 16,9 millones de actualizaciones de estado.

Los usuarios incluidos en este conjunto de datos se autoseleccionan al decidir usar la aplicación de Facebook MyPersonality. Esto podría implicar que sus características demográficas y personalidades difieren de la población general [46], en línea con las limitaciones generales para el uso de datos de redes sociales en las ciencias sociales [47]. Sin embargo, vale la pena señalar que esta muestra de usuarios es más diversa que la típica muestra participante de investigación psicológica, a menudo compuesta por estudiantes de alto estatus socioeconómico [48]. Las actualizaciones de estado de Facebook del conjunto de datos se asemejan a registros tipo diario en los que las personas escriben sobre momentos de su vida. Esto se puede observar en la nube de palabras del panel izquierdo de la Fig. 1, que muestra las palabras típicas que se encuentran en un diario (día, bueno, tener, ser, amar, querer, hora). El conjunto de datos no incluye respuestas o comentarios en conversaciones más amplias. Solo contiene actualizaciones de estado que los usuarios escribieron por iniciativa propia. Los usuarios optaron por compartir sus líneas de tiempo completo de actualizaciones de estado para la investigación. Si bien estas actualizaciones de estado siguen siendo actos de actuación frente al entorno social del usuario, componen la comunicación espontánea en un medio utilizado para hablar sobre la vida de uno. A diferencia de otros medios como Reddit, las actualizaciones de estado de Facebook carecen de un tema o contexto fijo en particular más allá de lo que el usuario individual elige hablar. Con un promedio de 143 actualizaciones de estado por usuario, este conjunto de datos compone un registro longitudinal y completo del texto de las redes sociales.



Histograma bidimensional de líneas de base de usuario y nube de palabras. El panel izquierdo muestra el histograma 2D de las líneas de base de valencia y excitación (valores medios) del usuario. Las líneas discontinuas rojas resaltan el punto medio de las escalas de valencia y excitación 1–9. Las líneas de base individuales se concentran por debajo del punto medio de la escala de excitación y por encima del punto medio de la escala de valencia. El panel derecho muestra la nube de palabras en el léxico WKB con un tamaño correspondiente a su frecuencia y un color correspondiente a su valor de valencia, de negativo en rojo a positivo en azul. Se muestran palabras con más de 5000 ocurrencias en el conjunto de datos

Todos los datos fueron donados voluntariamente por los usuarios de MyPersonality. Por lo tanto, las cuentas de bot y spam en este estudio no son un problema como en otras redes sociales como Twitter. Sin embargo, Twitter tiene el beneficio de un acceso generalizado para los investigadores y de volúmenes de datos muy altos, que permitieron análisis previos de la dinámica emocional [16]. La desventaja de esta facilidad de acceso es el problema del organismo modelo de Twitter [49], que requiere estudios en otras redes sociales para generalizar el comportamiento humano [50].

Modelo estadístico

Ahora derivamos un modelo estadístico basado en los principios expuestos en la sección Modelado de la dinámica afectiva anterior y que puede ajustarse con el resultado del análisis de texto del conjunto de datos de actualizaciones de estado de Facebook. Como paso previo al análisis estadístico, calculamos las líneas de base individuales de valencia y excitación como la media sobre las actualizaciones de estado analizadas de cada individuo. Luego restamos esta línea base de la secuencia de expresiones emocionales de un usuario. De este modo, simplificamos el modelo de modo que la relajación ocurra hacia cero, eliminando las diferencias persistentes interindividuales de las líneas de base afectivas. Para cada par secuencial de actualizaciones de estado del usuario i entre el tiempo t y t + Δt , ajustamos las siguientes ecuaciones del valor de valencia Vi, t + Δt y excitación Ai, t + Δt

expresado en la segunda actualización de estado:
:

(4)

donde  and cuantifica el efecto de regulación de la expresión en línea,  y cuantifican la velocidad de relajación, y y son residuos de regresión que se supone están normalmente distribuidos y no correlacionados. Ajustamos el modelo anterior con la función nls del paquete de estadísticas para el lenguaje estadístico R [51]. Ajustamos el modelo con pesos para cada muestra proporcional al logaritmo de Δt + 1

para enfocarse en la escala de tiempo rápida de valencia y excitación. Una alternativa a esta decisión es utilizar un método empírico para encontrar un límite de tiempo [16]. Sin embargo, para incluir todos los datos en nuestro análisis, elegimos un esquema de regresión ponderado en lugar de encontrar una escala de tiempo de corte. Calculamos intervalos de confianza del 95% y valores p con la función coeftest del paquete lmtest para R y ejecutamos una serie de diagnósticos de regresión para validar los supuestos de nuestro modelo estadístico.

Tenga en cuenta que, a diferencia de investigaciones anteriores [16], ajustamos la expresión emocional al nivel de actualización del estado individual en lugar del valor medio agrupado frente al tiempo. Esto tiene la ventaja de que nuestras estimaciones se pueden utilizar para calibrar modelos de emociones individuales y proporcionar estimaciones precisas de los parámetros de la dinámica emocional.

Resultados

El histograma 2d de las líneas de base individuales de valencia y excitación se muestra en el panel izquierdo de la Fig. 1. Las líneas de base de la excitación generalmente se encuentran por debajo de su punto medio, con un valor medio de 4,13. Con muy pocas excepciones, las líneas de base de valencia se concentran alrededor de un valor por encima del punto medio, con una media de 5.88. Estos dos valores están muy cerca de las observaciones empíricas en los autoinformes [10]. Las líneas de base de valencia positivas también son consistentes con el principio de Pollyanna [52], que se ha observado previamente en otros tipos de expresiones en línea [53, 54] y texto general [36, 55]. Se pueden encontrar más figuras descriptivas en los materiales complementarios, incluidos ejemplos de trayectorias individuales de valencia y excitación expresadas.
Memoria afectiva

Las emociones expresadas se relajan hacia la línea de base, pero esto no sucede instantáneamente. La Figura 2 muestra los cambios medios en la valencia y la excitación expresadas en función de la valencia y la excitación de las actualizaciones de estado anteriores en tres escalas de tiempo. La primera actualización de estado pertenece a un contenedor de una cuadrícula afectiva de 9 × 9 y el valor medio de su posterior actualización de estado se dirigen hacia la línea de base. Las actualizaciones de estado escritas en plazos cortos (con un Δt máximo de 5 minutos) no alcanzan completamente el valor de referencia. En escalas de tiempo más largas (Δt hasta 2 años), el valor esperado de valencia y activación de la segunda actualización de estado está claramente en la línea de base, como se muestra en el panel derecho de la Fig. 2. Estos patrones ilustran la existencia de una fuerza atractiva tanto y una memoria afectiva en la que las emociones expresadas en dos estados consecutivos están relacionadas siempre que el tiempo intermedio sea corto.


Figura 2


Cambios en la valencia y excitación expresadas en diferentes escalas de tiempo. Las flechas comienzan en el punto medio de los valores de valencia y excitación en una cuadrícula de  9 × 9 cuadrícula y terminar en el valor medio de la valencia y la activación de la próxima actualización de estado (ver [10] para una gráfica similar usando autoinformes). La valencia y la excitación regresan rápidamente a un punto con una valencia superior a 5 y una excitación alrededor de 4. La expresión emocional se relaja rápidamente pero no instantáneamente, ya que los cambios en escalas temporales breves se dirigen hacia la posición de referencia pero no convergen completamente. La transparencia de la flecha corresponde al número de observaciones en el contenedor.

A continuación, presentamos los patrones generales de la dinámica de las emociones de hasta 300 segundos, pero nuestro análisis estadístico incluye todos los intervalos de tiempo entre las publicaciones posteriores del mismo usuario. Presentamos figuras con patrones de hasta 300 minutos en los materiales complementarios.

Evaluamos cuantitativamente la existencia de memoria afectiva a través de la función de autocorrelación de valencia y excitación en actualizaciones de estado consecutivas del mismo individuo. La Figura 3 muestra el coeficiente de correlación de Pearson en función del tiempo entre las actualizaciones de estado para la excitación y la valencia, con intervalos de confianza de arranque del 95% calculados en más de 10,000 muestras. Para escalas de tiempo cortas, los coeficientes de correlación son significativos, alcanzando valores superiores a 0.4. El valor disminuye durante intervalos de tiempo más largos, alcanzando por primera vez valores no significativos después de 141 segundos para la valencia y después de 129 segundos para la excitación. Esto muestra que hay una memoria afectiva robusta en escalas de tiempo cortas. Sin embargo, cuando consideramos las actualizaciones de estado separadas por unos pocos minutos, la correlación entre la valencia expresada y la excitación es indistinguible de cero. Estos resultados son los mismos utilizando un método de análisis de texto alternativo, como se muestra en la Fig. 1 de los materiales complementarios.

Figura 3

Autocorrelación de valencia y excitación en actualizaciones de estado. Coeficientes de correlación de actualizaciones de estado posteriores por el mismo usuario (corrigiendo las líneas de base individuales) después de que Δt segundos pasaron entre ellas. Las áreas sombreadas tienen intervalos de confianza de arranque del 95%. Existe una fuerte correlación entre dos actualizaciones de estado posteriores en una escala de tiempo muy rápida. Si el tiempo entre las actualizaciones de estado aumenta, ambos coeficientes de correlación disminuyen y rápidamente se vuelven no significativos


Afecta los ajustes del modelo dinámico

Cuando se parte de un valor dado de valencia y excitación, el valor esperado de las emociones expresadas en las próximas actualizaciones de estado se muestra en la Fig. 4 en función del tiempo entre actualizaciones de estado. El proceso es reversible a la media: cuando se parte de un valor negativo (tenga en cuenta que hemos restado las líneas de base individuales), el valor esperado se aproxima a cero desde abajo. Cuando se parte de un valor positivo, este enfoque ocurre desde arriba. El valor esperado se vuelve indistinguible de cero en escalas de tiempo más largas, como se muestra en la Figura 3 de los materiales complementarios.

Figura 4

La valencia y la excitación se relajan hacia una línea de base afectiva. Valores medios de valencia y excitación (después de corregir las líneas de base individuales) en las actualizaciones de estado después de una anterior generada Δt segundos antes. Las líneas se agregan por las emociones expresadas en el primer mensaje para ilustrar las tendencias de relajación. Las medias se calculan sobre una ventana móvil de tamaño 15 (segundos) sobre todas las actualizaciones de estado de todos los usuarios y se trazan hasta un Δt máximo de 300 segundos. La relajación ocurre homogéneamente por encima y por debajo de la línea de base tanto para la valencia como para la excitación.
Imagen a tamaño completo

Validamos las observaciones anteriores ajustando el modelo estadístico introducido en la sección. 3.3. Los coeficientes estimados de los ajustes de valencia y excitación se muestran en la Tabla 1. El coeficiente de relajación para la excitación (, ) es más fuerte que para la valencia (, ). Esta observación es consistente con resultados previos de experimentos [12] y autoinformes in vivo [10]. Los usuarios que escriben actualizaciones de estado con alto contenido de excitación tienen menos probabilidades de tener una gran excitación comparable en la próxima actualización de estado si pasan más de unos minutos entre ellos. Tenga en cuenta que estas medidas reescaladas deben interpretarse como desviaciones de la línea de base afectiva de cada usuario. El efecto de retroalimentación de la expresión es capturado por las estimaciones de y , tomando valores de 0.38 y 0.45 respectivamente. Esto indica que una gran fracción del estado emocional inicial está regulada por la expresión, con aproximadamente el 40% de valencia y excitación restantes. Nuestras hipótesis iniciales de γ y k entre cero y uno, tanto para la valencia como para la excitación, están respaldadas por estos resultados, lo que indica la presencia de una relajación emocional estable hacia las líneas de base individuales y un efecto regulador de la expresión afectiva.


Tabla 1. Estimaciones de parámetros del modelo de regresión para valencia y excitación. Se proporcionan valores P e intervalos de confianza del 95% para las estimaciones de parámetros




Se puede observar una ilustración de la relajación rápida hacia la línea de base que captura el modelo en la Fig. 5. Los valores iniciales de alta valencia o excitación se regulan instantáneamente por un factor proporcional y luego se acercan exponencialmente a cero desde arriba. Lo inverso también es observable para los valores de excitación y valencia por debajo de cero, que primero regulan hacia cero y luego se acercan exponencialmente desde abajo (también observable en la Fig. 4).

Figura 5


Perfiles dinámicos de emoción en los modelos equipados. Próximo valor estimado de valencia y excitación después de Δt segundos en ambos modelos ajustados. La excitación se relaja más rápido que la valencia.

Las estimaciones consistentes con heteroscedasticidad y autocorrelación para los modelos arrojan estimaciones de coeficientes muy cercanas a las reportadas en la Tabla 1 y siguen siendo significativas. Estos resultados son muy similares cuando se usa el método de análisis de sentimiento alternativo, como se informa en la Tabla complementaria 1. Esto indica que nuestros resultados principales no son un artefacto de algunos errores o sesgos particulares de la herramienta de análisis de texto.

Ambos modelos superan a otros enfoques para modelar dinámicas emocionales. La suma residual de los cuadrados de nuestros ataques de valencia y excitación son más bajos que los de los modelos sin relajación (γ = 0), sin efecto de expresión (k = 0) y que modelos de una relajación lineal en el tiempo y de un polinomio cúbico de tiempo. En ambos ajustes, los residuos de regresión son aproximadamente normales (el estadístico de Shapiro-Wilk de los residuos para los modelos de valencia y excitación están por encima de 0.95), sin correlación con los valores ajustados (valencia ρ = −0.0017, excitación ρ = −0.0014) y con variables independientes (ρ como máximo 0.016 para valencia y como máximo 0.013 para excitación). Los residuos no muestran correlación entre las actualizaciones de estado posteriores de los mismos individuos (ρ = 0.015 para valencia y ρ = 0.013

para la excitación). Esto evidencia la validez de la formulación de dinámicas emocionales como una combinación de un efecto de expresión y una relajación proporcional hacia una línea de base individual, como se presenta en la Sección 2.

Los patrones de memoria de nuestro modelo, si bien son consistentes con investigaciones anteriores, también podrían explicarse por procesos de sincronización colectiva y cultural que influyen en la expresión emocional. Por ejemplo, los saludos estacionales como "feliz año nuevo" o "feliz Navidad" podrían introducir artefactos en nuestra medición como manifestaciones del estado de ánimo colectivo [34]. Tenemos en cuenta estos efectos en nuestros análisis, repetimos los ajustes del modelo que incluyen líneas de base semanales interindividuales adicionales para valencia y excitación. Los resultados son muy similares con estas correcciones estacionales, como se presenta más detalladamente en la sección "corrección estacional" en los Materiales suplementarios.

Conclusiones

Nuestro análisis de la dinámica temporal de la expresión afectiva en Facebook valida nuestro modelo de dinámica afectiva. Confirmamos la existencia de líneas de base afectivas individuales, que se concentran alrededor de una valencia ligeramente positiva y un punto de activación moderado. Además, utilizando un modelo de regresión no lineal, validamos la suposición de que la valencia y la excitación se relajan exponencialmente hacia la línea de base individual. Esto puede verse como un recuerdo a corto plazo de la expresión emocional: la valencia y la excitación de dos actualizaciones de estado consecutivas del mismo individuo están altamente correlacionadas hasta unos pocos minutos, pero no se correlacionan durante períodos de tiempo más largos. Encontramos que existe un considerable efecto de regulación tanto para la valencia como para la excitación, lo que significa que las expresiones afectivas reducen instantáneamente la magnitud de los estados afectivos en un factor proporcional.

Nuestros resultados son consistentes con análisis observacionales previos del etiquetado de emociones en Twitter [16]. En comparación con nuestro trabajo, el análisis de [16] se centró en la relajación de las emociones después de un informe de etiquetado explícito, un fenómeno que opera a una escala de tiempo más larga que nuestro análisis de relajación espontánea de valencia y excitación. Esto ilustra que varios aspectos y escalas temporales de la vida afectiva pueden analizarse a través de los datos de las redes sociales, capturando tanto las tendencias de relajación del afecto central como del estado de ánimo y otros fenómenos más persistentes.

Si bien nuestro análisis ha revelado propiedades fundamentales de la dinámica de las emociones, es importante resaltar sus limitaciones. Nuestro modelo no es una herramienta predictiva que pueda proporcionar estimaciones precisas de los sentimientos en el futuro, especialmente cuando se consideran escalas de tiempo largas. Sin embargo, el conjunto de datos a gran escala que analizamos nos permitió hacer inferencias robustas que apuntan a la dinámica de las emociones en general. Los estudios futuros pueden incluir datos externos adicionales (por ejemplo, interacción social, hora del día, atributos demográficos) para generar herramientas predictivas más allá de nuestro trabajo. Además, la actividad de las redes sociales tiene una naturaleza performativa y los datos se generan con sesgos de autoselección que pueden afectar los resultados del análisis de texto. No obstante, nuestros análisis nos permiten superar algunas limitaciones de los métodos tradicionales, rastreando las emociones durante largos períodos de tiempo en una gran muestra de usuarios más diversos que la muestra típica de un estudio de psicología. Además, nuestros resultados concuerdan con los resultados anteriores y son consistentes en los dos métodos de análisis de sentimientos que aplicamos. Todos los métodos en psicología tienen limitaciones, solo comparando sus resultados en varios escenarios podemos converger a una comprensión unificada del comportamiento humano.

La evidencia reunida por nuestro análisis contribuye a una línea de investigación emergente de modelado computacional de las emociones [9, 11]. Los modelos computacionales, en particular los modelos basados ​​en agentes, formalizan la dinámica de las propiedades individuales y la interacción y comunicación entre los individuos para explicar el comportamiento colectivo y complejo. Para que estos modelos vayan más allá de los argumentos teóricos, es necesario probar empíricamente sus supuestos y calibrar sus valores de parámetros con datos empíricos. Nuestro trabajo ha validado una serie de supuestos de estos modelos [12] y hemos calculado valores precisos para los parámetros de la dinámica emocional individual como se manifiesta a través de las redes sociales.

Tales modelos cuantitativos de dinámica afectiva también pueden contribuir a la comprensión y el tratamiento de los trastornos afectivos. Si bien las dinámicas psicológicas complejas medidas con cuestionarios aportan información limitada para evaluar el bienestar [56], un escenario más rico en datos (como la investigación en redes sociales) podría proporcionar suficiente precisión para revelar el papel de las dinámicas afectivas complejas. Además de la psicopatología, los modelos dinámicos de emoción empíricamente calibrados también se pueden aplicar para simular reacciones emocionales en tecnologías informáticas afectivas [57]. Por ejemplo, las expresiones faciales de humanos virtuales se pueden simular con nuestro modelo [58], y los sistemas de diálogo pueden proporcionar dinámicas emocionales plausibles con los parámetros apropiados [59].

Además, nuestros hallazgos tienen algunas implicaciones para la metodología de la psicología afectiva. En particular, nuestro modelo puede ayudar a los investigadores a (i) estimar el impacto afectivo real de un estímulo dado, en función de su relajación dinámica, (ii) determinar la duración necesaria de los intervalos de medición y los descansos entre estímulos, para evitar la transferencia efectos de las emociones, y (iii) cuidado y control para el efecto de retroalimentación de regulación de la expresión afectiva, que también puede ocurrir después de las autoevaluaciones.

Los parámetros de nuestros modelos son muy similares a los encontrados en los experimentos de interacción en línea [12]. A pesar de utilizar un diseño muy diferente (observación versus experimento), metodología (análisis de texto versus autoevaluación) y composición de la muestra (muestra de estudiantes versus usuarios de Facebook), obtenemos estimaciones muy similares para las líneas de base afectivas y los parámetros de relajación. Esto constituye una fuerte validación de nuestro modelo de dinámica afectiva, mucho más que una simple replicación de estudios previos. Más allá de eso, nuestros métodos tienen ventajas adicionales en comparación con los métodos tradicionales: incluyen muestras de participantes más grandes y representativas, el comportamiento se puede medir por períodos de tiempo más largos y el costo de la recopilación y reutilización de datos es sustancialmente menor. Esto muestra cómo se puede avanzar en la investigación psicológica a través de la ciencia de datos, especialmente a través del análisis de conjuntos de datos a gran escala de rastros de comportamiento en línea.


Referencias