Análisis de redes sociales: nube de palabras

Mostrando entradas con la etiqueta nube de palabras. Mostrar todas las entradas

jueves, 6 de febrero de 2020

Dinámica de la expresión afectiva en redes sociales

La dinámica individual de la expresión afectiva en las redes sociales

Max Pellert, Simon Schweighofer y David García

EPJ Data Science volumen 9, Número de artículo: 1 (2020)

Citar como:
Pellert, M., Schweighofer, S. & Garcia, D. The individual dynamics of affective expression on social media. EPJ Data Sci. 9, 1 (2020). https://doi.org/10.1140/epjds/s13688-019-0219-3

Resumen
Comprender la dinámica temporal del afecto es crucial para comprender las emociones humanas en general. En este estudio, probamos empíricamente un modelo computacional de dinámica afectiva analizando un conjunto de datos a gran escala de actualizaciones de estado de Facebook utilizando técnicas de análisis de texto. Nuestros análisis respaldan los supuestos centrales de nuestro modelo: después de la estimulación, los estados afectivos, cuantificados como valencia y excitación, regresan exponencialmente a una línea de base específica de cada individuo. En promedio, esta línea base tiene un valor de valencia ligeramente positivo y un punto de activación moderado por debajo del punto medio. Además, la expresión afectiva, en este caso publicar una actualización de estado en Facebook, empuja inmediatamente la excitación y la valencia hacia la línea de base en un valor proporcional. Estos resultados son sólidos para la elección de la técnica de análisis de texto e ilustran la rápida escala de tiempo de la dinámica afectiva a través del texto de las redes sociales. Estos resultados son de gran relevancia para la computación afectiva, la detección y el modelado de emociones colectivas, el refinamiento de la metodología de investigación psicológica y la detección de dinámicas de afectos individuales anormales y potencialmente patológicos.

“Cuando estés enojado, cuenta diez antes de hablar; si estás muy enojado, cuenta hasta cien.

Thomas Jefferson

Introducción

Las emociones tienen una profunda influencia en la cognición y el comportamiento humano en muchos dominios [1]: sesgan la memoria, la percepción y la toma de decisiones [2] y proporcionan retroalimentación sobre el pasado y orientación para el comportamiento actual [3]. Algunos de los trastornos mentales más frecuentes, como la depresión y el trastorno de ansiedad, se caracterizan por estados emocionales anormales [4–6]. Además, las emociones tienen una función social. Experimentar emociones induce una tendencia a compartirlas con otros, haciéndolas experimentar también estas emociones [7], dando lugar a emociones colectivas con un impacto a menudo profundo en la sociedad en general [8, 9].

Si bien la influencia de las emociones en la cognición y el comportamiento está bien establecida, la mayoría de los estudios dejan de lado un aspecto crucial: la dinámica temporal de los estados emocionales. Se supone comúnmente que las emociones se relajan con el tiempo si no se reestimulan [10-12]. ¿Pero a qué ritmo se relajan los estados emocionales? Saber esto nos dirá cuánto tiempo después de un evento inductor de emociones se puede esperar que dure el impacto cognitivo y conductual de las emociones. Por ejemplo, ¿es suficiente seguir los consejos de Jefferson y contar hasta diez o cien para evitar los efectos negativos de la ira? Una segunda pregunta se refiere a la línea de base a la que regresan las emociones después de un evento inductor de emociones: ¿volvemos a un estado de emociones completamente neutrales o hay líneas de base individuales desplazadas del punto medio? Además, la expresión de las emociones puede tener un efecto en la dinámica afectiva: si ignoramos el consejo de Jefferson y expresamos nuestras opiniones mientras todavía estamos enojados, ¿este acto expresivo relajará nuestro estado emocional y, de ser así, en qué medida?

En este estudio, queremos abordar estas preguntas (i) formulando un modelo matemático de dinámica afectiva y (ii) probando este modelo analizando los rastros digitales de la expresión afectiva espontánea, en forma de un conjunto de datos a gran escala de Facebook actualizaciones de estado.

Este enfoque de probar hipótesis psicológicas con datos en línea todavía es nuevo, pero ya ha demostrado su valía [13]. Por ejemplo, se ha demostrado que la experiencia de estados emocionales excitados conduce al intercambio de información en las redes sociales [14] y, a su vez, que la expresión emocional en línea puede impulsar el contagio emocional [15], puede regular las emociones a través del etiquetado [16], y puede afectar la felicidad a través de la comparación social [17] y la popularidad a través de la regulación social de las emociones [18]. Otros estudios han demostrado cómo el estado de ánimo oscila durante las estaciones [19] y cómo la contaminación del aire está relacionada con el bienestar expresado [20]. Según los datos en línea, también es posible detectar emociones colectivas fuertes, tal como aparecieron en Francia después de los ataques terroristas de París en noviembre de 2015, y mostrar cómo pueden contribuir al aumento de la solidaridad y la resiliencia social [21].

Analizar los datos en línea nos ayuda a evitar algunas de las limitaciones de los métodos más tradicionales para cuantificar los estados emocionales. Si bien los autoinformes de estados emocionales momentáneos pueden mostrar su dinámica cuando se recopilan a través de dispositivos de mano [10], este método requiere que los participantes evalúen sus emociones varias veces al día, interrumpiendo su rutina diaria y afectando su atención. La alta demanda de los participantes del estudio limita el tamaño de las muestras y la aplicabilidad de este método. Otra investigación ha utilizado experimentos controlados para provocar reacciones emocionales y rastrear su evolución a lo largo del tiempo [12]. Si bien esto tiene la ventaja de resaltar la dinámica de las emociones en contraste con las fuentes externas de ruido, sufre una serie de limitaciones a la validez externa. La exposición artificial a estímulos en experimentos puede diferir mucho de las propiedades de la exposición natural en situaciones del mundo real [22]. La investigación de laboratorio también puede sufrir otras limitaciones, como los efectos experimentales que distorsionan la dinámica de las emociones [23].
Las grandes cantidades de datos producidos por los usuarios de las redes sociales ofrecen una forma de complementar la investigación previa sobre la dinámica de las emociones. Pero el uso de datos de redes sociales en la ciencia afectiva también tiene limitaciones. El resultado de los métodos de análisis de sentimientos comunes en las publicaciones en las redes sociales durante largos períodos de tiempo tiene una baja correlación con el resultado de cuestionarios sobre estados de ánimo persistentes [24]. Sin embargo, a escalas de tiempo más rápidas, el análisis de sentimientos del texto de las redes sociales se correlaciona con autoinformes individuales de estados afectivos momentáneos [12]. Por lo tanto, el análisis de los datos en línea puede, a pesar de sus limitaciones, complementar métodos psicológicos más tradicionales de manera importante.

La cuantificación de las dinámicas emocionales tiene potenciales aplicaciones de investigación adicionales que motivan nuestro trabajo. A través de un enfoque social-interaccionista [25], una mejor comprensión de la dinámica afectiva individual también puede ayudarnos a explicar la aparición de emociones colectivas. Se presume que las emociones colectivas se sostienen por períodos más largos que las reacciones emocionales puramente individuales [9]. Por lo tanto, tener una mejor estimación de la escala de tiempo promedio de las emociones individuales puede ayudarnos a identificar empíricamente las emociones colectivas. Y, por último, el conocimiento sobre la dinámica afectiva típica en la población general también puede ayudarnos a detectar dinámicas anormales, que se han relacionado con trastornos mentales como la depresión [6, 26].

Modelando dinámicas afectivas

La dinámica individual del afecto captura los cambios en los estados emocionales a lo largo del tiempo independientemente de la interacción social u otros estímulos externos. En 2010, dos equipos de investigación formularon de forma independiente modelos de dinámica individual de afecto: el marco Cyberemotions [11] y el modelo DynAffect [10]. Ambos grupos se centraron en el núcleo afectan las dimensiones de la valencia (agradable frente a desagradable) y la excitación (excitado frente a la calma) [27]. Además, ambos grupos asumieron que el afecto (tanto la valencia como la excitación) se relajan exponencialmente hacia una línea de base. El marco de Cyberemotions tiene como objetivo modelar la aparición de emociones colectivas en las comunidades en línea, dejando que cada modelo en el marco defina detalles sobre la interacción en línea [11]. Para este fin, este marco también incluye los antecedentes y efectos de la expresión emocional en la dinámica afectiva. En particular, el marco de Cyberemotions supone que expresar emociones tendría un efecto de retroalimentación reguladora sobre el estado emocional, una afirmación respaldada por la investigación psicológica [28].

Algunos supuestos del marco de Cyberemotions han sido probados empíricamente en experimentos que involucran leer y escribir publicaciones emocionales en línea [12]. El efecto se cuantificó mediante autoevaluaciones y detección de sentimientos en los mensajes de los participantes. El modelo DynAffect se probó en dos experimentos utilizando el muestreo de experiencia repetida de una cohorte de estudiantes en circunstancias de la vida cotidiana [10]. Si bien la evidencia valida en gran medida la dinámica de Dynaffect, los estudios produjeron resultados desconcertantes con respecto a la fuerza de la relajación exponencial del afecto: las estimaciones de los parámetros de relajación afectiva fueron mucho mayores en el primer experimento que en el segundo. Esto fue inesperado, porque la única diferencia importante entre los dos experimentos fue que la tasa de muestreo de la experiencia, es decir, con qué frecuencia los participantes tenían que calificar su valencia y excitación actuales, era más frecuente en el primer experimento. Sin embargo, si vemos estas calificaciones como una forma de expresión afectiva, el efecto de retroalimentación de regulación postulado por el modelo Cyberemotions puede explicar por qué las expresiones más frecuentes conducen a una relajación afectiva aparentemente más rápida.

Por lo tanto, para nuestro estudio actual, combinamos el supuesto de relajación exponencial de ambos modelos con el postulado de DynAffect de líneas de base afectivas individuales [10] y el efecto de regulación de la expresión afectiva del modelo Cyberemotions [11, 12].

Formalizamos estos supuestos siguiendo el formalismo del marco de Cyberemotions [11, 12]. Cuantificamos el estado emocional de un individuo en el tiempo t a través de su valencia

v (t)

y excitación

a (t)

. La dinámica de valencia y excitación solo difiere en sus valores de parámetros, no en su forma matemática, y por lo tanto denotamos

x (t)

como valencia o excitación en las ecuaciones generales.

Nuestro modelo de emociones individuales consta de dos partes. Primero, el efecto de la expresión, mediante el cual la acción de publicar una actualización de estado induce una regulación descendente instantánea de la emoción por un factor constante k:

x i (t a f t e r) = (x i (t b e f o r e) - μ i) * k + μ i .

(1)

En la ecuación anterior, individualmente comencé a escribir una actualización de estado en el momento anterior, expresando un estado emocionale

x_{i} (t_{b e f o r e})

, cuantificado como valencia o excitación. El estado emocional del individuo cuando publica la actualización de estado es

x_{i} (t_{a f t e r})

. Para simplificar, suponemos que la escala de tiempo de la escritura es más rápida que la escala de tiempo entre la publicación de actualizaciones de estado, y por lo tanto modelamos el efecto de la escritura en xi como un cambio instantáneo. La línea de base de x para el individuo es μi, que denota el estado fundamental en el que las emociones del individuo tenderían a ser estables a lo largo del tiempo en ausencia de estímulos. Esta línea de base individual se puede medir a través del promedio de varios estados emocionales (valencia y excitación) medidos para el mismo individuo durante largos períodos de tiempo. Utilizamos este enfoque como explicamos más adelante en la Secta. 3.3. Después de la expresión de la emoción, el estado del individuo cambia instantáneamente a un valor ajustado por la distancia a la línea de base multiplicado por un factor constante k. Esta ecuación modela una regulación estable hacia la línea base cuando

0 < k < 1

, que se ha observado previamente en experimentos [12]. En nuestros análisis empíricos, probamos las hipótesis de que k es mayor que cero y menor que 1, es decir, que existe un efecto de expresión que atenúa las emociones hacia una línea de base individual fija.

El segundo componente de la dinámica emocional en nuestro modelo es la relajación interna de los estados emocionales. Siguiendo el marco de modelado [11] y las observaciones empíricas [10], modelamos la relajación interna de las emociones como un proceso de reversión de la media hacia la línea de base:

d x i ( t ) d t = - γ (x i (t) - μ i) + ξ (t) .

(2)

En la ecuación anterior, el cambio en el estado emocional por unidad de tiempo es proporcional a la diferencia de ese estado emocional a la línea de base individual μi
. El término de ruido ξ (t) captura las fuerzas externas que cambian las emociones y que no estamos modelando en este caso. El coeficiente γ cuantifica esa relajación proporcional hacia la línea de base. Cuando 0 <γ <1, el valor de

x_{i} (t)

se aproxima a la línea de base

μ_{i}

con el tiempo. Este tipo de relajación exponencial se ha observado en investigaciones empíricas anteriores [10, 12], que sirve como punto de partida de nuestro modelo de dinámica individual. En este caso, cuando el valor de

x_{i} (t)

está por debajo de la línea de base, el valor de

x_{i} (t)

aumenta con el tiempo, acercándose a la línea de base desde abajo. Nuestro análisis empírico tiene como objetivo probar las hipótesis de que γ está por debajo de 1 y por encima de cero, estimando el mejor valor de γ.

La ecuación (2) es un ejemplo de un proceso de Ornstein-Uhlenbeck [29]. Podemos formular el valor esperado de

x_{i}

después de un tiempo Δt fijo:
:

E [x i (t + Δ t)] = e - γ Δ t (x i (t) - μ i) + μ i .

(3)

Combinamos esta solución con el efecto de expresión de la ecuación (1) para formular el modelo estadístico explicado en la sección. 3.3.

Datos y métodos.

Análisis de texto de expresión afectiva

Estudiamos las emociones como afecto central [30], es decir, estados psicológicos de corta duración de alta relevancia para el individuo que no necesitan tener un objetivo particular. Los estados en el núcleo del afecto se miden en términos de valencia y excitación. La valencia cuantifica el grado de placer asociado con una emoción y excita la activación inducida por esa emoción. Por ejemplo, la palabra "alegría" manifiesta una valencia positiva, un estado de alta excitación, mientras que la palabra "tristeza" se usa para expresar una valencia negativa, un estado de baja excitación. Se pueden anotar más palabras en este espacio de valencia y excitación, un método popularizado por el léxico ANEW [31] que se basa en el método diferencial semántico [32]. Tenga en cuenta que este enfoque supone que el afecto se puede medir a partir de su expresión a través de la comunicación humana. Si bien se puede esperar un nivel sustancial de ruido al usar estos métodos de análisis de texto para cuantificar las emociones, el uso de datos a gran escala de las redes sociales y otros recursos digitales permite el análisis de las emociones individuales y colectivas a través de patrones temporales y estructurales [16, 19 21, 33, 34].

Cuantificamos la valencia y la excitación expresada en cada actualización de estado a través de métodos no supervisados que calculan las puntuaciones medias sobre términos derivados en un texto [35]. Para verificar que nuestros resultados no son un artefacto de un léxico particular, empleamos dos léxicos generados con diferentes esquemas de anotación: el léxico de las Normas Afectivas (WKB: Warriner – Kuperman – Brysbaert) [36], que incluye 13,915 lemmas que cubren los términos más frecuentes de un corpus de subtítulos, y el léxico NRC (National Research Council Canada) Valence, Arousal, and Dominance (NRC-VAD) [37], que incluye más de 20,000 términos seleccionados de varias fuentes. Nos referimos a estos métodos de análisis de texto para cuantificar la valencia y la excitación como el método WKB y el método NRC-VAD respectivamente. En el texto principal presentamos los resultados utilizando el método WKB e informamos los resultados utilizando el método NRC-VAD como alternativa en los materiales complementarios.

Si bien se han desarrollado otros métodos además de WKB y NRC-VAD para medir el sentimiento o el afecto del texto de las redes sociales, el léxico de estos dos métodos es el más completo, cubre los rangos más amplios de términos emocionales, y su principio fundamental ha sido validado en referencia estudios [38, 39]. La flexibilidad de estos métodos no supervisados para cuantificar la expresión afectiva permite la generalización de nuestros análisis más allá de Facebook. Esto no sería posible si aplicamos métodos supervisados entrenados solo para Facebook como un dominio particular [40]. Otros métodos no supervisados han alcanzado altos niveles de precisión para las tareas de anotación de sentimientos en términos de clases de sentimientos (positivo, negativo, neutral) [38]. Entre los mejores se encuentra VADER [41], una herramienta que devuelve un puntaje numérico de sentimiento que ha sido entrenado y validado contra datos categóricos. Si bien esta herramienta se ha demostrado útil para caracterizar la valencia promedio del conjunto en Twitter [16], no podemos usarla para rastrear los valores de valencia a nivel individual debido a la distribución trimodal de las puntuaciones VADER (ver Fig. 9 en Materiales suplementarios).

Conjunto de datos de actualizaciones de estado de Facebook

Analizamos un conjunto de datos de actualizaciones de estado de Facebook generadas por el proyecto MyPersonality [42]. Este conjunto de datos contiene más de 22 millones de actualizaciones de estado que fueron provistas voluntariamente para la investigación académica por 153,727 usuarios de Facebook entre 2009 y 2011. A través del consorcio MyPersonality, accedimos a un conjunto de datos anónimo de actualizaciones de estado sin ninguna información de identificación personal. Este conjunto de datos y subconjuntos han sido utilizados en investigaciones previas sobre el reconocimiento computacional de la personalidad [43], la preferencia en la música [44] y el sentimiento de afiliación religiosa [45]. Filtramos las observaciones del conjunto de datos sin procesar de acuerdo con la siguiente directriz: Primero, descartamos pares de actualizaciones de estado posteriores que no pueden asignarse al menos un término de nuestro léxico de sentimientos cada una. Además, eliminamos los usuarios de baja actividad que actualizaron su estado menos de 20 veces durante todo el período de observación. Después del preprocesamiento de datos, 114,967 usuarios nos dejan 16,9 millones de actualizaciones de estado.

Los usuarios incluidos en este conjunto de datos se autoseleccionan al decidir usar la aplicación de Facebook MyPersonality. Esto podría implicar que sus características demográficas y personalidades difieren de la población general [46], en línea con las limitaciones generales para el uso de datos de redes sociales en las ciencias sociales [47]. Sin embargo, vale la pena señalar que esta muestra de usuarios es más diversa que la típica muestra participante de investigación psicológica, a menudo compuesta por estudiantes de alto estatus socioeconómico [48]. Las actualizaciones de estado de Facebook del conjunto de datos se asemejan a registros tipo diario en los que las personas escriben sobre momentos de su vida. Esto se puede observar en la nube de palabras del panel izquierdo de la Fig. 1, que muestra las palabras típicas que se encuentran en un diario (día, bueno, tener, ser, amar, querer, hora). El conjunto de datos no incluye respuestas o comentarios en conversaciones más amplias. Solo contiene actualizaciones de estado que los usuarios escribieron por iniciativa propia. Los usuarios optaron por compartir sus líneas de tiempo completo de actualizaciones de estado para la investigación. Si bien estas actualizaciones de estado siguen siendo actos de actuación frente al entorno social del usuario, componen la comunicación espontánea en un medio utilizado para hablar sobre la vida de uno. A diferencia de otros medios como Reddit, las actualizaciones de estado de Facebook carecen de un tema o contexto fijo en particular más allá de lo que el usuario individual elige hablar. Con un promedio de 143 actualizaciones de estado por usuario, este conjunto de datos compone un registro longitudinal y completo del texto de las redes sociales.

Histograma bidimensional de líneas de base de usuario y nube de palabras. El panel izquierdo muestra el histograma 2D de las líneas de base de valencia y excitación (valores medios) del usuario. Las líneas discontinuas rojas resaltan el punto medio de las escalas de valencia y excitación 1–9. Las líneas de base individuales se concentran por debajo del punto medio de la escala de excitación y por encima del punto medio de la escala de valencia. El panel derecho muestra la nube de palabras en el léxico WKB con un tamaño correspondiente a su frecuencia y un color correspondiente a su valor de valencia, de negativo en rojo a positivo en azul. Se muestran palabras con más de 5000 ocurrencias en el conjunto de datos

Todos los datos fueron donados voluntariamente por los usuarios de MyPersonality. Por lo tanto, las cuentas de bot y spam en este estudio no son un problema como en otras redes sociales como Twitter. Sin embargo, Twitter tiene el beneficio de un acceso generalizado para los investigadores y de volúmenes de datos muy altos, que permitieron análisis previos de la dinámica emocional [16]. La desventaja de esta facilidad de acceso es el problema del organismo modelo de Twitter [49], que requiere estudios en otras redes sociales para generalizar el comportamiento humano [50].

Modelo estadístico

Ahora derivamos un modelo estadístico basado en los principios expuestos en la sección Modelado de la dinámica afectiva anterior y que puede ajustarse con el resultado del análisis de texto del conjunto de datos de actualizaciones de estado de Facebook. Como paso previo al análisis estadístico, calculamos las líneas de base individuales de valencia y excitación como la media sobre las actualizaciones de estado analizadas de cada individuo. Luego restamos esta línea base de la secuencia de expresiones emocionales de un usuario. De este modo, simplificamos el modelo de modo que la relajación ocurra hacia cero, eliminando las diferencias persistentes interindividuales de las líneas de base afectivas. Para cada par secuencial de actualizaciones de estado del usuario i entre el tiempo t y t + Δt , ajustamos las siguientes ecuaciones del valor de valencia Vi, t + Δt y excitación Ai, t + Δt

expresado en la segunda actualización de estado:
:

V i, t + Δ t = e - γ v Δ t (k v * V i, t) + ϵ v, A i, t + Δ t = e - γ a Δ t (k a * A i, t) + ϵ a,

(4)

donde

k_{v}

and

k_{a}

cuantifica el efecto de regulación de la expresión en línea,

γ_{v}

γ_{a}

cuantifican la velocidad de relajación, y

ϵ_{v}

ϵ_{a}

son residuos de regresión que se supone están normalmente distribuidos y no correlacionados. Ajustamos el modelo anterior con la función nls del paquete de estadísticas para el lenguaje estadístico R [51]. Ajustamos el modelo con pesos para cada muestra proporcional al logaritmo de Δt + 1

para enfocarse en la escala de tiempo rápida de valencia y excitación. Una alternativa a esta decisión es utilizar un método empírico para encontrar un límite de tiempo [16]. Sin embargo, para incluir todos los datos en nuestro análisis, elegimos un esquema de regresión ponderado en lugar de encontrar una escala de tiempo de corte. Calculamos intervalos de confianza del 95% y valores p con la función coeftest del paquete lmtest para R y ejecutamos una serie de diagnósticos de regresión para validar los supuestos de nuestro modelo estadístico.

Tenga en cuenta que, a diferencia de investigaciones anteriores [16], ajustamos la expresión emocional al nivel de actualización del estado individual en lugar del valor medio agrupado frente al tiempo. Esto tiene la ventaja de que nuestras estimaciones se pueden utilizar para calibrar modelos de emociones individuales y proporcionar estimaciones precisas de los parámetros de la dinámica emocional.

Resultados

El histograma 2d de las líneas de base individuales de valencia y excitación se muestra en el panel izquierdo de la Fig. 1. Las líneas de base de la excitación generalmente se encuentran por debajo de su punto medio, con un valor medio de 4,13. Con muy pocas excepciones, las líneas de base de valencia se concentran alrededor de un valor por encima del punto medio, con una media de 5.88. Estos dos valores están muy cerca de las observaciones empíricas en los autoinformes [10]. Las líneas de base de valencia positivas también son consistentes con el principio de Pollyanna [52], que se ha observado previamente en otros tipos de expresiones en línea [53, 54] y texto general [36, 55]. Se pueden encontrar más figuras descriptivas en los materiales complementarios, incluidos ejemplos de trayectorias individuales de valencia y excitación expresadas.
Memoria afectiva

Las emociones expresadas se relajan hacia la línea de base, pero esto no sucede instantáneamente. La Figura 2 muestra los cambios medios en la valencia y la excitación expresadas en función de la valencia y la excitación de las actualizaciones de estado anteriores en tres escalas de tiempo. La primera actualización de estado pertenece a un contenedor de una cuadrícula afectiva de 9 × 9 y el valor medio de su posterior actualización de estado se dirigen hacia la línea de base. Las actualizaciones de estado escritas en plazos cortos (con un Δt máximo de 5 minutos) no alcanzan completamente el valor de referencia. En escalas de tiempo más largas (Δt hasta 2 años), el valor esperado de valencia y activación de la segunda actualización de estado está claramente en la línea de base, como se muestra en el panel derecho de la Fig. 2. Estos patrones ilustran la existencia de una fuerza atractiva tanto y una memoria afectiva en la que las emociones expresadas en dos estados consecutivos están relacionadas siempre que el tiempo intermedio sea corto.

Figura 2

Cambios en la valencia y excitación expresadas en diferentes escalas de tiempo. Las flechas comienzan en el punto medio de los valores de valencia y excitación en una cuadrícula de 9 × 9 cuadrícula y terminar en el valor medio de la valencia y la activación de la próxima actualización de estado (ver [10] para una gráfica similar usando autoinformes). La valencia y la excitación regresan rápidamente a un punto con una valencia superior a 5 y una excitación alrededor de 4. La expresión emocional se relaja rápidamente pero no instantáneamente, ya que los cambios en escalas temporales breves se dirigen hacia la posición de referencia pero no convergen completamente. La transparencia de la flecha corresponde al número de observaciones en el contenedor.

A continuación, presentamos los patrones generales de la dinámica de las emociones de hasta 300 segundos, pero nuestro análisis estadístico incluye todos los intervalos de tiempo entre las publicaciones posteriores del mismo usuario. Presentamos figuras con patrones de hasta 300 minutos en los materiales complementarios.

Evaluamos cuantitativamente la existencia de memoria afectiva a través de la función de autocorrelación de valencia y excitación en actualizaciones de estado consecutivas del mismo individuo. La Figura 3 muestra el coeficiente de correlación de Pearson en función del tiempo entre las actualizaciones de estado para la excitación y la valencia, con intervalos de confianza de arranque del 95% calculados en más de 10,000 muestras. Para escalas de tiempo cortas, los coeficientes de correlación son significativos, alcanzando valores superiores a 0.4. El valor disminuye durante intervalos de tiempo más largos, alcanzando por primera vez valores no significativos después de 141 segundos para la valencia y después de 129 segundos para la excitación. Esto muestra que hay una memoria afectiva robusta en escalas de tiempo cortas. Sin embargo, cuando consideramos las actualizaciones de estado separadas por unos pocos minutos, la correlación entre la valencia expresada y la excitación es indistinguible de cero. Estos resultados son los mismos utilizando un método de análisis de texto alternativo, como se muestra en la Fig. 1 de los materiales complementarios.

Figura 3

Autocorrelación de valencia y excitación en actualizaciones de estado. Coeficientes de correlación de actualizaciones de estado posteriores por el mismo usuario (corrigiendo las líneas de base individuales) después de que Δt segundos pasaron entre ellas. Las áreas sombreadas tienen intervalos de confianza de arranque del 95%. Existe una fuerte correlación entre dos actualizaciones de estado posteriores en una escala de tiempo muy rápida. Si el tiempo entre las actualizaciones de estado aumenta, ambos coeficientes de correlación disminuyen y rápidamente se vuelven no significativos

Afecta los ajustes del modelo dinámico

Cuando se parte de un valor dado de valencia y excitación, el valor esperado de las emociones expresadas en las próximas actualizaciones de estado se muestra en la Fig. 4 en función del tiempo entre actualizaciones de estado. El proceso es reversible a la media: cuando se parte de un valor negativo (tenga en cuenta que hemos restado las líneas de base individuales), el valor esperado se aproxima a cero desde abajo. Cuando se parte de un valor positivo, este enfoque ocurre desde arriba. El valor esperado se vuelve indistinguible de cero en escalas de tiempo más largas, como se muestra en la Figura 3 de los materiales complementarios.

Figura 4

La valencia y la excitación se relajan hacia una línea de base afectiva. Valores medios de valencia y excitación (después de corregir las líneas de base individuales) en las actualizaciones de estado después de una anterior generada Δt segundos antes. Las líneas se agregan por las emociones expresadas en el primer mensaje para ilustrar las tendencias de relajación. Las medias se calculan sobre una ventana móvil de tamaño 15 (segundos) sobre todas las actualizaciones de estado de todos los usuarios y se trazan hasta un Δt máximo de 300 segundos. La relajación ocurre homogéneamente por encima y por debajo de la línea de base tanto para la valencia como para la excitación.
Imagen a tamaño completo

Validamos las observaciones anteriores ajustando el modelo estadístico introducido en la sección. 3.3. Los coeficientes estimados de los ajustes de valencia y excitación se muestran en la Tabla 1. El coeficiente de relajación para la excitación (

γ_{a} = 0.0105 s^{- 1}

C I = [0.0101, 0.0108]

) es más fuerte que para la valencia (

γ_{v} = 0.0070 s^{- 1}

C I = [0.0068, 0.0072]

). Esta observación es consistente con resultados previos de experimentos [12] y autoinformes in vivo [10]. Los usuarios que escriben actualizaciones de estado con alto contenido de excitación tienen menos probabilidades de tener una gran excitación comparable en la próxima actualización de estado si pasan más de unos minutos entre ellos. Tenga en cuenta que estas medidas reescaladas deben interpretarse como desviaciones de la línea de base afectiva de cada usuario. El efecto de retroalimentación de la expresión es capturado por las estimaciones de

k_{v}

k_{a}

, tomando valores de 0.38 y 0.45 respectivamente. Esto indica que una gran fracción del estado emocional inicial está regulada por la expresión, con aproximadamente el 40% de valencia y excitación restantes. Nuestras hipótesis iniciales de γ y k entre cero y uno, tanto para la valencia como para la excitación, están respaldadas por estos resultados, lo que indica la presencia de una relajación emocional estable hacia las líneas de base individuales y un efecto regulador de la expresión afectiva.

Tabla 1. Estimaciones de parámetros del modelo de regresión para valencia y excitación. Se proporcionan valores P e intervalos de confianza del 95% para las estimaciones de parámetros

Se puede observar una ilustración de la relajación rápida hacia la línea de base que captura el modelo en la Fig. 5. Los valores iniciales de alta valencia o excitación se regulan instantáneamente por un factor proporcional y luego se acercan exponencialmente a cero desde arriba. Lo inverso también es observable para los valores de excitación y valencia por debajo de cero, que primero regulan hacia cero y luego se acercan exponencialmente desde abajo (también observable en la Fig. 4).

Figura 5

Perfiles dinámicos de emoción en los modelos equipados. Próximo valor estimado de valencia y excitación después de Δt segundos en ambos modelos ajustados. La excitación se relaja más rápido que la valencia.

Las estimaciones consistentes con heteroscedasticidad y autocorrelación para los modelos arrojan estimaciones de coeficientes muy cercanas a las reportadas en la Tabla 1 y siguen siendo significativas. Estos resultados son muy similares cuando se usa el método de análisis de sentimiento alternativo, como se informa en la Tabla complementaria 1. Esto indica que nuestros resultados principales no son un artefacto de algunos errores o sesgos particulares de la herramienta de análisis de texto.

Ambos modelos superan a otros enfoques para modelar dinámicas emocionales. La suma residual de los cuadrados de nuestros ataques de valencia y excitación son más bajos que los de los modelos sin relajación (γ = 0), sin efecto de expresión (k = 0) y que modelos de una relajación lineal en el tiempo y de un polinomio cúbico de tiempo. En ambos ajustes, los residuos de regresión son aproximadamente normales (el estadístico de Shapiro-Wilk de los residuos para los modelos de valencia y excitación están por encima de 0.95), sin correlación con los valores ajustados (valencia ρ = −0.0017, excitación ρ = −0.0014) y con variables independientes (ρ como máximo 0.016 para valencia y como máximo 0.013 para excitación). Los residuos no muestran correlación entre las actualizaciones de estado posteriores de los mismos individuos (ρ = 0.015 para valencia y ρ = 0.013

para la excitación). Esto evidencia la validez de la formulación de dinámicas emocionales como una combinación de un efecto de expresión y una relajación proporcional hacia una línea de base individual, como se presenta en la Sección 2.

Los patrones de memoria de nuestro modelo, si bien son consistentes con investigaciones anteriores, también podrían explicarse por procesos de sincronización colectiva y cultural que influyen en la expresión emocional. Por ejemplo, los saludos estacionales como "feliz año nuevo" o "feliz Navidad" podrían introducir artefactos en nuestra medición como manifestaciones del estado de ánimo colectivo [34]. Tenemos en cuenta estos efectos en nuestros análisis, repetimos los ajustes del modelo que incluyen líneas de base semanales interindividuales adicionales para valencia y excitación. Los resultados son muy similares con estas correcciones estacionales, como se presenta más detalladamente en la sección "corrección estacional" en los Materiales suplementarios.

Conclusiones

Nuestro análisis de la dinámica temporal de la expresión afectiva en Facebook valida nuestro modelo de dinámica afectiva. Confirmamos la existencia de líneas de base afectivas individuales, que se concentran alrededor de una valencia ligeramente positiva y un punto de activación moderado. Además, utilizando un modelo de regresión no lineal, validamos la suposición de que la valencia y la excitación se relajan exponencialmente hacia la línea de base individual. Esto puede verse como un recuerdo a corto plazo de la expresión emocional: la valencia y la excitación de dos actualizaciones de estado consecutivas del mismo individuo están altamente correlacionadas hasta unos pocos minutos, pero no se correlacionan durante períodos de tiempo más largos. Encontramos que existe un considerable efecto de regulación tanto para la valencia como para la excitación, lo que significa que las expresiones afectivas reducen instantáneamente la magnitud de los estados afectivos en un factor proporcional.

Nuestros resultados son consistentes con análisis observacionales previos del etiquetado de emociones en Twitter [16]. En comparación con nuestro trabajo, el análisis de [16] se centró en la relajación de las emociones después de un informe de etiquetado explícito, un fenómeno que opera a una escala de tiempo más larga que nuestro análisis de relajación espontánea de valencia y excitación. Esto ilustra que varios aspectos y escalas temporales de la vida afectiva pueden analizarse a través de los datos de las redes sociales, capturando tanto las tendencias de relajación del afecto central como del estado de ánimo y otros fenómenos más persistentes.

Si bien nuestro análisis ha revelado propiedades fundamentales de la dinámica de las emociones, es importante resaltar sus limitaciones. Nuestro modelo no es una herramienta predictiva que pueda proporcionar estimaciones precisas de los sentimientos en el futuro, especialmente cuando se consideran escalas de tiempo largas. Sin embargo, el conjunto de datos a gran escala que analizamos nos permitió hacer inferencias robustas que apuntan a la dinámica de las emociones en general. Los estudios futuros pueden incluir datos externos adicionales (por ejemplo, interacción social, hora del día, atributos demográficos) para generar herramientas predictivas más allá de nuestro trabajo. Además, la actividad de las redes sociales tiene una naturaleza performativa y los datos se generan con sesgos de autoselección que pueden afectar los resultados del análisis de texto. No obstante, nuestros análisis nos permiten superar algunas limitaciones de los métodos tradicionales, rastreando las emociones durante largos períodos de tiempo en una gran muestra de usuarios más diversos que la muestra típica de un estudio de psicología. Además, nuestros resultados concuerdan con los resultados anteriores y son consistentes en los dos métodos de análisis de sentimientos que aplicamos. Todos los métodos en psicología tienen limitaciones, solo comparando sus resultados en varios escenarios podemos converger a una comprensión unificada del comportamiento humano.

La evidencia reunida por nuestro análisis contribuye a una línea de investigación emergente de modelado computacional de las emociones [9, 11]. Los modelos computacionales, en particular los modelos basados en agentes, formalizan la dinámica de las propiedades individuales y la interacción y comunicación entre los individuos para explicar el comportamiento colectivo y complejo. Para que estos modelos vayan más allá de los argumentos teóricos, es necesario probar empíricamente sus supuestos y calibrar sus valores de parámetros con datos empíricos. Nuestro trabajo ha validado una serie de supuestos de estos modelos [12] y hemos calculado valores precisos para los parámetros de la dinámica emocional individual como se manifiesta a través de las redes sociales.

Tales modelos cuantitativos de dinámica afectiva también pueden contribuir a la comprensión y el tratamiento de los trastornos afectivos. Si bien las dinámicas psicológicas complejas medidas con cuestionarios aportan información limitada para evaluar el bienestar [56], un escenario más rico en datos (como la investigación en redes sociales) podría proporcionar suficiente precisión para revelar el papel de las dinámicas afectivas complejas. Además de la psicopatología, los modelos dinámicos de emoción empíricamente calibrados también se pueden aplicar para simular reacciones emocionales en tecnologías informáticas afectivas [57]. Por ejemplo, las expresiones faciales de humanos virtuales se pueden simular con nuestro modelo [58], y los sistemas de diálogo pueden proporcionar dinámicas emocionales plausibles con los parámetros apropiados [59].

Además, nuestros hallazgos tienen algunas implicaciones para la metodología de la psicología afectiva. En particular, nuestro modelo puede ayudar a los investigadores a (i) estimar el impacto afectivo real de un estímulo dado, en función de su relajación dinámica, (ii) determinar la duración necesaria de los intervalos de medición y los descansos entre estímulos, para evitar la transferencia efectos de las emociones, y (iii) cuidado y control para el efecto de retroalimentación de regulación de la expresión afectiva, que también puede ocurrir después de las autoevaluaciones.

Los parámetros de nuestros modelos son muy similares a los encontrados en los experimentos de interacción en línea [12]. A pesar de utilizar un diseño muy diferente (observación versus experimento), metodología (análisis de texto versus autoevaluación) y composición de la muestra (muestra de estudiantes versus usuarios de Facebook), obtenemos estimaciones muy similares para las líneas de base afectivas y los parámetros de relajación. Esto constituye una fuerte validación de nuestro modelo de dinámica afectiva, mucho más que una simple replicación de estudios previos. Más allá de eso, nuestros métodos tienen ventajas adicionales en comparación con los métodos tradicionales: incluyen muestras de participantes más grandes y representativas, el comportamiento se puede medir por períodos de tiempo más largos y el costo de la recopilación y reutilización de datos es sustancialmente menor. Esto muestra cómo se puede avanzar en la investigación psicológica a través de la ciencia de datos, especialmente a través del análisis de conjuntos de datos a gran escala de rastros de comportamiento en línea.

Referencias

Páginas