miércoles, 26 de febrero de 2020

Introducción a la visualización de redes

lunes, 24 de febrero de 2020

Contagios interactivos añaden complejidad a las epidemias

Contagios interactivos

Los contagios complejos, por ejemplo, cuando las ideas se extienden a través de una red, se consideran diferentes de los contagios simples observados para las infecciones. Ahora se muestra que los contagios simples exhiben una característica macroscópica clave del comportamiento complejo cuando interactúan.
Por Sune Lehmann - Springer Nature


Los procesos de difusión en las redes, como la propagación de enfermedades o ideas, funcionan constantemente en sistemas humanos que van desde el nivel microscópico de señalización en células individuales hasta el flujo de información en sistemas tecnológicos a escala global. Incluso cuando se restringen a las redes sociales, estos procesos son ubicuos en las sociedades dinámicas y en red de hoy en día: muchas infecciones se propagan de persona a persona, al igual que la información (y la desinformación). Los fenómenos sociales más complejos, como los comportamientos y las opiniones, también se propagan en las redes. El consenso científico solía ser que todas estas formas de propagación se regían por mecanismos similares, pero en los últimos años, ha surgido una distinción interesante entre el contagio simple y complejo de la literatura de difusión social 1. Ahora, escribiendo en Nature Physics, Laurent Hébert-Dufresne y sus colegas han argumentado que debido a que estos mecanismos de propagación fundamentalmente diferentes tienen una dinámica de nivel de población indistinguible cuando interactúan múltiples contagios, todos los procesos de propagación deben modelarse como complejos 2.

La idea detrás de la distinción entre contagios simples y complejos es que los mecanismos subyacentes a la propagación social son diferentes de los que dan forma a la propagación de la enfermedad 3. Para este último, lo único que importa es la duración de la exposición a agentes infecciosos. En el caso de contagios complejos, la exposición a múltiples fuentes tiene diferentes efectos que la misma cantidad de exposición a una sola fuente. Para comprender el mecanismo detrás de la difusión social compleja, quizás sea mejor usar un ejemplo. Intuitivamente, aprender durante un almuerzo de una hora que cinco de cada diez amigos que anteriormente habían comido carne eligieron volverse vegetarianos tendrá un impacto diferente que sentarse durante cinco horas con un amigo promoviendo los beneficios de una dieta libre de carne. La propagación a través de contagios simples no depende de que suceda nada más a los individuos infectados, mientras que en el caso de contagios complejos, el contexto del evento de contagio, como el número de fuentes u otras propiedades de la estructura de la red local, juega un papel clave. Es importante distinguir entre los dos mecanismos al analizar la propagación en las redes, ya que cada uno conduce a dinámicas sustancialmente diferentes, lo que a su vez puede dar lugar a conclusiones contradictorias sobre el riesgo potencial o la estrategia de intervención correcta.



Fig. 1 | Potencial latente. Dos enfermedades A y B se propagan a través de una red. Algunos de los individuos ya han sido infectados por la enfermedad A, haciéndolos más susceptibles a la enfermedad B. El grupo de individuos infectados por A constituye un potencial latente que permite grandes saltos en la fracción de la población infectada por B.

Hébert-Dufresne y sus colegas se centraron en una diferencia clave en la dinámica. En los modelos de contagio estándar, existe una relación directa entre la tasa de transmisión y el tamaño de la epidemia. Sin embargo, en el caso de contagios complejos, la dependencia del estado del vecindario de la red implica que cambios muy pequeños en la tasa de transmisión pueden conducir a saltos dramáticos en el tamaño esperado de una epidemia. La intuición aquí es que en el caso complejo, una población puede desarrollar un "potencial latente". Volviendo al ejemplo anterior, imagine que la fracción de vegetarianos aumenta lentamente en una población. A cierto valor de la fracción general de vegetarianos, la probabilidad de situaciones como el almuerzo discutido anteriormente será más probable y se producirá un cambio dramático en el número total de vegetarianos.

Trabajos recientes4–8 han argumentado que dos contagios que interactúan pueden resultar en un potencial latente similar en una población. Una de las formas en que dos infecciones distintas pueden interactuar es cuando la exposición a una infección debilita el sistema inmunitario de una persona haciéndola más susceptible a la segunda infección (Fig. 1). Por lo tanto, los individuos debilitados funcionan efectivamente de la misma manera que los vegetarianos en el ejemplo anterior, creando un potencial latente, que a su vez puede permitir que los saltos macroscópicos sean un sello distintivo de contagios complejos. En el caso de poblaciones bien mezcladas, donde cada individuo tiene la misma probabilidad de infectar a todos los demás, Hébert-Dufresne y sus colegas produjeron un mapeo de contagios interactivos a un contagio complejo, mostrando así de manera general que los contagios simples interactivos son un subconjunto de contagios complejos.

A primera vista, este hallazgo parece enturbiar las aguas. Sin embargo, cavando más profundo hay un lado positivo. Hébert-Dufresne y sus colegas argumentaron que, en casi todos los casos del mundo real, los contagios están, de hecho, interactuando. Incluso en el caso de patógenos individuales, puede haber saltos en el tamaño esperado de una epidemia cuando diferentes modos de transmisión tienen probabilidades de transmisión muy diferentes, por ejemplo, en la propagación del VIH a través de la transmisión sexual en comparación con el intercambio de agujas. Por esta razón, la visión central y simplificadora de este trabajo es que cuando solo hay datos disponibles a nivel de población, todos los contagios del mundo real deben modelarse como contagios complejos.

Utilizando su mapeo desde contagios simples interactivos hasta contagios complejos, los autores propusieron un marco de contagio complejo, completo con potentes procedimientos de inferencia, para modelar datos del mundo real. Este marco tiene varias ventajas prácticas para distinguir y clasificar contagios: por ejemplo, proporciona una forma directa de comparar contagios independientemente del tiempo y las condiciones iniciales.

Una de las limitaciones de este enfoque es que el mapeo desde contagios simples interactivos hasta comportamientos complejos se enfoca principalmente en poblaciones bien mezcladas en las cuales cualquiera puede infectar a cualquier otra persona. Sin embargo, la investigación sobre datos que describen los patrones de conexión entre humanos de redes sociales, llamadas telefónicas y muchas otras fuentes ha demostrado que esta suposición de mezcla completa es demasiado simplista. De hecho, la investigación existente sobre los procesos de difusión en redes empíricas sugiere que la estructura de red subyacente puede cambiar fundamentalmente el comportamiento de las características clave de dichos procesos 9.

Aunque Hébert-Dufresne y sus colegas consideraron algunos datos de la red, el foco principal estaba en simulaciones de redes sintéticas poco realistas y redes empíricas seleccionadas. Por lo tanto, un desafío futuro interesante será comprender más profundamente cómo la idea de contagios complejos, como un marco eficaz para todo tipo de contagios, debe aplicarse a los casos en los que se dispone de información detallada sobre la red subyacente y los patrones de infección.

❐ Sune Lehmann 1,2 
1 Departamento de Matemática Aplicada y Ciencias de la Computación, Universidad Técnica de Dinamarca, Kongens Lyngby, Dinamarca. 
2 Centro de Copenhague para la Ciencia de los Datos Sociales, Universidad de Copenhague, Copenhague, Dinamarca. correo electrónico: sljo@dtu.dk 
Publicado: 24 de febrero de 2020
https://doi.org/10.1038/s41567-020-0817-9 

Referencias 

1. Centola, D. & Macy, M. Am. J. Sociol. 113, 702–734 (2007). 
2. Hébert-Dufresne, L., Scarpino, S. V. y Young, J.-G. Nat. Phys. https://doi.org/10.1038/s41567-020-0791-2 (2020). 
3. Lehmann S. y Ahn, Y. Y. (eds) Fenómenos de difusión complejos en sistemas sociales (Springer, 2018). 
4. O'Sullivan, D. J., O'Keeffe, G. J., Fennell, P. G. y Gleeson, J. P. Front. Phys. 3, 71 (2015). 
5. Funk, S. y Jansen, V. A. Phys. Rev. E 81, 036118 (2010). 
6. Marceau, V., Nöel, P.-A., Hébert-Dufresne, L., Allard, A. y Dubé, L. J. Phys. Rev. E 84, 026105 (2011). 
7. Bauch, C. T. y Galvani, A. P. Science 342, 47–49 (2013). 
8. Fu, F., Christakis, N. A. y Fowler, J. H. Sci. Rep. 7, 43634 (2017). 
9. Holme, P. y Saramäki, J. Phys. Rep. 519, 97-125 (2012).



domingo, 23 de febrero de 2020

Guerra de bots en el FC Barcelona

‘Barçagate’: Así actúan los ejércitos de bots maliciosos

Los algoritmos que dirigen a los bots se han convertido en un medio poderoso de comunicación política y es muy difícil llegar a descubrir quiénes son los creadores que están detrás
La Vanguardia

Por Patricia Plaza



Los usuarios que aparecen como destacados, son los más centrales (los que catalizan las conversaciones recibiendo más respuestas, retuits o menciones) en la conversación sobre el hashtag #bartomeuOUT (Social Elephants y Gephi)


Muchos políticos, famosos e influencers se jactan de tener muchos seguidores en las redes sociales. Sin embargo, gran parte de ellos no son de carne y hueso. A estas alturas, la compra de seguidores es un secreto a voces. Algunas empresas ofertan paquetes de 1.000 seguidores falsos en Twitter, Facebook, Instagram o YouTube por el módico precio de 0,89€ (‘Me gustas’ y retuits van aparte).

Pero más allá de engrosar las listas de seguidores, likes y retuits, en los últimos años los bots se han convertido en una forma de manipular a los ciudadanos, siendo también generadores de opinión. Programas informáticos diseñados que actúan como ejércitos para crear comentarios y reforzar la imagen de su amo. Usados por empresas para brindar servicio de atención a sus clientes, o potenciales clientes, para dar una buena experiencia de compra o información. Por ejemplo, un estudio publicado por FakeSpot, denunciaba que el 61% de las reseñas de productos electrónicos de Amazon eran falsas.

La Cadena Ser destapaba esta semana la caja de los truenos, según este medio el FC Barcelona habría contratado una empresa que utilizaba cuentas falsas en las redes para criticar a jugadores y opositores. Un contrato de un millón de euros repartidos en seis cuentas falsas de Facebook distintas. Esa empresa es I3 Ventures, la misma que en junio presentaba un estudio encargado por el FC Barcelona en el que alertaba sobre la presencia de bots. El análisis detectaba que el 30% de los usuarios que hablaban sobre el Barça eran cuentas automatizadas. El propio FC Barcelona presentaba ese estudio y lo publicaba íntegramente en su página web con la voluntad de conocer la percepción de la marca Barça en las redes sociales. Titulado como Análisis del comportamiento de la conversación global digital en torno al FC Barcelona, el informe analizaba la actividad de enero de 2018 a junio de 2019.


Los bots pueden desempeñar actividades maliciosas, como enviar spam, acosar o promover discursos de odio

En un estudio de la Universidad de Oxford sobre las campañas de Trump y Clinton en Twitter en 2016, Phil Howard, profesor de estudios de internet, explicaba que cada vez más políticos y gobiernos de todo el mundo “emplean” tanto bots como personas para gestionar sus conversaciones políticas en las redes sociales. Los bots “pueden desempeñar tareas como suministrar noticias e información”. Y también “actividades maliciosas, como enviar spam, acosar o promover discursos de odio”.

Los algoritmos que dirigen a los bots se han convertido en un medio poderoso de comunicación política y es muy difícil llegar a descubrir quiénes son los creadores que están detrás. Auténticas campañas de marketing diseñadas desde distintas cuentas falsas para llegar a un objetivo común. Es lo que en la jerga marketiniana se denomina astroturfing . Una técnica de propaganda que pretende dar impresión de espontaneidad y popularidad, ocultando al verdadero emisor del mensaje.
Cómo identificar un bot

Los bots intentan actuar como si fueran humanos, pero su intensa actividad les delata. Además de una imagen de perfil y nombre de usuario sospechoso, suele seguir a muchas más cuentas de las que le siguen. Pero lo más relevante es la monotemática de sus publicaciones y su ritmo de publicación constante en el que no parece tener prisa por irse a dormir. Y su velocidad de respuesta sin apenas tiempo para leer los comentarios. Si la cuenta es de muy reciente creación o si descubrimos que usa una App para publicar, también son datos que nos pueden llevar a sospechar.


Si se detectan desviaciones la probabilidad que se trate de un bot es mayor”
Alessandro Bernardi Analista de redes sociales y cofundador de ‘Social Elephants’

Al igual que los virus de ordenador, los criadores de “granjas de bots” han ido perfeccionándolos con el tiempo, emulando cada vez mejor el comportamiento humano. Algunas herramientas como Botometer tratan de detectar bots de Twitter, monitorizando datos públicos de la cuenta y comparándolos con los patrones típicos de cuentas reales. “Si se detectan desviaciones la probabilidad que se trate de un bot es mayor”, explica Alessandro Bernardi, analista de redes sociales y cofundador de Social Elephants.

Por ejemplo, si analizamos la actividad del perfil oficial del FC Barcelona en Twitter (@FCBarcelona_es), Botometer nos indica que tiene 0.1/5 probabilidades de ser un bot, es decir que tiene un comportamiento muy humano:

Botometer establece que la cuenta de Twitter @FCBarcelona_es solo tiene 0.1/5 probabilidades de ser un bot (Botometer)

En el caso del Barçagate las supuestas cuentas falsas son páginas de Facebook, una red social que ofrece muy pocos datos públicos, lo que limita mucho poder identificar si se trata de bots o no. Un estudio de la israelí Reblaze llamado El Estado de la Protección de los Bots 2019 muestra que 62% de los usuarios de internet, donde se incluyen las redes sociales, son bots. Y de esos, el 38% son denominados “malos”, es decir, que atentan contra la integridad de las personas, de las empresas o son usadas en favor de un gobierno o partido político. “Según un reportaje de Wired con datos de Robhat Labs se ha estimado que en el caso de ciertos eventos de debate político los bots pueden llegar a contribuir hasta un 60% de toda la actividad”, afirma Bernardi.

Bots de guerrilla usados para destruir, acosar y promover discursos de odio. Una sutileza y hostilidad que preocupa tanto a autoridades como a empresarios y a usuarios de las redes.

Aunque en realidad, según Bernardi, en el caso del Barçagate no haría falta usar bots para realizar una acción en redes sociales: “Con un presupuesto de un millón de euros sería más fácil poner un equipo humano a gestionar personalmente ciertas cuentas distribuyendo ciertos contenidos estratégicamente preparados”.

Sean humanos o bots los que estén detrás de estos perfiles de Facebook, la verdad es que es muy difícil descubrir quién es el verdadero emisor de los mensajes y quién está detrás de todas las publicaciones que difaman a jugadores. Y aquí está el quid de la cuestión: si es el FC Barcelona el que desarrolla su propia campaña o si se trata de una fuente externa. Las dudas son muy amplias y la incertidumbre se ciñe sobre la sombra del propio Bartomeu. El Barça rompía su contrato con I3 Ventures, al mismo tiempo que I3 Ventures negaba haber cobrado un millón de euros del Barça para monitorizar las redes.

¿Las redes sociales están haciendo algo para frenar la presencia de bots?


Twitter lleva tiempo diciendo que está trabajando en un “sello” (similar al de las cuentas verificadas) para poder distinguir entre cuentas de humanos y de bots. “Tanta tiene que ser la desesperación de esta red social que recientemente su fundador (Jack Dorsey) le llegó a preguntar a Elon Musk si se les ocurría una manera de ‘arreglar Twitter’”, explica Bernardi.

De todas formas Twitter ya ha bloqueado unas cuantas de las cuentas implicadas en el reciente Barçagate. A lo mejor por denuncia de alguien o porque la misma red social ha detectado un comportamiento anómalo que incumple sus normas, no necesariamente de bot:


Twitter ha bloqueado alguna de las cuentas en Twitter vinculadas al 'Barçagate' (Twitter)

Alessandro Bernardi ha analizado en Botometer las distintas cuentas que en la información de la Cadena Ser se citan como bots y que no aparecen como bloqueadas. “En dos casos detectamos algo de probabilidad que realmente sea un bot, pero por ejemplo la cuenta de ‘Mes Que un Club’, sale un comportamiento prácticamente humano. Así que quizás tendríamos que dejar de pensar si hablamos de bots o no, y poner el foco en si hubo o no una estrategia maliciosa y un intento de manipulación, aunque sea que fuera operado por humanos”.

Según la actividad de la cuenta en Twitter de @AlterSports, Botometer detecta que tiene 2,1/5 probabilidades de ser un bot (Botometer) Según la actividad de la cuenta @SportsLeaksCom en Twitter, Botometer detecta que tiene 1,4/5 probabilidades de ser un bot (Botometer) Según la actividad de la cuenta @MésQueUnClub en Twitter, Botometer detecta que tiene 0,2/5 probabilidades de ser un bot (Botometer)

A modo de ejemplo, el analista de redes sociales y cofundador de Social Elephants ha elaborado para La Vanguardia una monitorización del hashtag #bartomeuOUT durante esta semana, antes y después que saliera a la luz la información de la Cadena Ser sobre las supuestas cuentas falsas de Facebook.

Social Elephants ha contabilizado más de 90.000 tuits esta semana con el hahstag #bartomeuOut:
Este gráfico muestra la actividad de unos 90.000 tuits que usaron el hashtag #bartmeuOUT en Twitter entre el 12 y el 20 de febrero. (Social Elephants)

Los autores de los tuits son sobre todo hombres y medios de comunicación:
Los autores de los tuits que han usado el hashtag #BartomeuOUT entre el 12 y el 20 de febrero son sobre todo hombres y medios (Social Elephants)

Los usuarios son en su mayoría de Barcelona: Los usuarios que han usado el hashtag #bartomeuOUT entre el 12 y el 20 de febrero son en su mayoría de Barcelona (Social Elephants)

Analizando las conversaciones, este mapa identifica quién habla con quién y cuáles son los diferentes grupos de usuarios que hablan de temas en común (identificados por colores diferentes). Los usuarios que aparecen como destacados son los usuarios mas centrales (los que catalizan las conversaciones recibiendo más respuestas, retuits o menciones) en la conversación sobre el hashtag #bartomeuOUT:

  Los usuarios que aparecen como destacados, son los más centrales (los que catalizan las conversaciones recibiendo más respuestas, retuits o menciones) en la conversación sobre el hashtag #bartomeuOUT (Social Elephants y Gephi)

También puede ser interesante tratar de identificar bots que hayan usado el hashtag #bartomeuOUT, por ejemplo buscando entre los usuarios que sospechosamente hacen muchos retuits a los demás: Estos son los usuarios que sospechosamente hacen muchos RTs a los demás con el hashtag #bartomeuOUT (Social Elephants)

Entre estos destaca el caso de @BartomeuVerdugo. Esta cuenta tiene solo seis seguidores y más de 300 retuits tan solo a tuits que contienen el hashtag #bartomeuOUT:
Curioso el caso de @BartmoeuVerdugo con tan solo 6 followers y mas de 300 Retweets tan solo a tweets que contengan el hashtag #bartmeuOUT (Twitter)

Irónico que en su perfil, este usuario se defina como “no soy un robot”. Sin embargo, como siempre hay bots que saben disimular peor o mejor, Botometer es bastante claro en identificarlo como bot con un 3.9/5 de probabilidad:
Según la actividad de la cuenta @BartmoeuVerdugo en Twitter, Botometer detecta que tiene 3,9/5 probabilidades de ser un bot (Botometer)

Tras este análisis, podemos concluir que la guerra de bots no solo la juega una parte. Sea o no sea el FC Barcelona quien está detrás de las cuentas falsas que refuerzan la imagen de Bartomeu y atacan a los jugadores, lo que sí es cierto es que, como en todos los ámbitos de la vida, la guerra también se lucha desde el otro lado. Todo es un tira y afloja en el que existen bots para todos los gustos.

jueves, 6 de febrero de 2020

Dinámica de la expresión afectiva en redes sociales

La dinámica individual de la expresión afectiva en las redes sociales


Max Pellert, Simon Schweighofer y David García

EPJ Data Science volumen 9, Número de artículo: 1 (2020)

Citar como:
Pellert, M., Schweighofer, S. & Garcia, D. The individual dynamics of affective expression on social media. EPJ Data Sci. 9, 1 (2020). https://doi.org/10.1140/epjds/s13688-019-0219-3

Resumen
Comprender la dinámica temporal del afecto es crucial para comprender las emociones humanas en general. En este estudio, probamos empíricamente un modelo computacional de dinámica afectiva analizando un conjunto de datos a gran escala de actualizaciones de estado de Facebook utilizando técnicas de análisis de texto. Nuestros análisis respaldan los supuestos centrales de nuestro modelo: después de la estimulación, los estados afectivos, cuantificados como valencia y excitación, regresan exponencialmente a una línea de base específica de cada individuo. En promedio, esta línea base tiene un valor de valencia ligeramente positivo y un punto de activación moderado por debajo del punto medio. Además, la expresión afectiva, en este caso publicar una actualización de estado en Facebook, empuja inmediatamente la excitación y la valencia hacia la línea de base en un valor proporcional. Estos resultados son sólidos para la elección de la técnica de análisis de texto e ilustran la rápida escala de tiempo de la dinámica afectiva a través del texto de las redes sociales. Estos resultados son de gran relevancia para la computación afectiva, la detección y el modelado de emociones colectivas, el refinamiento de la metodología de investigación psicológica y la detección de dinámicas de afectos individuales anormales y potencialmente patológicos.

“Cuando estés enojado, cuenta diez antes de hablar; si estás muy enojado, cuenta hasta cien.

Thomas Jefferson



Introducción

Las emociones tienen una profunda influencia en la cognición y el comportamiento humano en muchos dominios [1]: sesgan la memoria, la percepción y la toma de decisiones [2] y proporcionan retroalimentación sobre el pasado y orientación para el comportamiento actual [3]. Algunos de los trastornos mentales más frecuentes, como la depresión y el trastorno de ansiedad, se caracterizan por estados emocionales anormales [4–6]. Además, las emociones tienen una función social. Experimentar emociones induce una tendencia a compartirlas con otros, haciéndolas experimentar también estas emociones [7], dando lugar a emociones colectivas con un impacto a menudo profundo en la sociedad en general [8, 9].

Si bien la influencia de las emociones en la cognición y el comportamiento está bien establecida, la mayoría de los estudios dejan de lado un aspecto crucial: la dinámica temporal de los estados emocionales. Se supone comúnmente que las emociones se relajan con el tiempo si no se reestimulan [10-12]. ¿Pero a qué ritmo se relajan los estados emocionales? Saber esto nos dirá cuánto tiempo después de un evento inductor de emociones se puede esperar que dure el impacto cognitivo y conductual de las emociones. Por ejemplo, ¿es suficiente seguir los consejos de Jefferson y contar hasta diez o cien para evitar los efectos negativos de la ira? Una segunda pregunta se refiere a la línea de base a la que regresan las emociones después de un evento inductor de emociones: ¿volvemos a un estado de emociones completamente neutrales o hay líneas de base individuales desplazadas del punto medio? Además, la expresión de las emociones puede tener un efecto en la dinámica afectiva: si ignoramos el consejo de Jefferson y expresamos nuestras opiniones mientras todavía estamos enojados, ¿este acto expresivo relajará nuestro estado emocional y, de ser así, en qué medida?

En este estudio, queremos abordar estas preguntas (i) formulando un modelo matemático de dinámica afectiva y (ii) probando este modelo analizando los rastros digitales de la expresión afectiva espontánea, en forma de un conjunto de datos a gran escala de Facebook actualizaciones de estado.

Este enfoque de probar hipótesis psicológicas con datos en línea todavía es nuevo, pero ya ha demostrado su valía [13]. Por ejemplo, se ha demostrado que la experiencia de estados emocionales excitados conduce al intercambio de información en las redes sociales [14] y, a su vez, que la expresión emocional en línea puede impulsar el contagio emocional [15], puede regular las emociones a través del etiquetado [16], y puede afectar la felicidad a través de la comparación social [17] y la popularidad a través de la regulación social de las emociones [18]. Otros estudios han demostrado cómo el estado de ánimo oscila durante las estaciones [19] y cómo la contaminación del aire está relacionada con el bienestar expresado [20]. Según los datos en línea, también es posible detectar emociones colectivas fuertes, tal como aparecieron en Francia después de los ataques terroristas de París en noviembre de 2015, y mostrar cómo pueden contribuir al aumento de la solidaridad y la resiliencia social [21].

Analizar los datos en línea nos ayuda a evitar algunas de las limitaciones de los métodos más tradicionales para cuantificar los estados emocionales. Si bien los autoinformes de estados emocionales momentáneos pueden mostrar su dinámica cuando se recopilan a través de dispositivos de mano [10], este método requiere que los participantes evalúen sus emociones varias veces al día, interrumpiendo su rutina diaria y afectando su atención. La alta demanda de los participantes del estudio limita el tamaño de las muestras y la aplicabilidad de este método. Otra investigación ha utilizado experimentos controlados para provocar reacciones emocionales y rastrear su evolución a lo largo del tiempo [12]. Si bien esto tiene la ventaja de resaltar la dinámica de las emociones en contraste con las fuentes externas de ruido, sufre una serie de limitaciones a la validez externa. La exposición artificial a estímulos en experimentos puede diferir mucho de las propiedades de la exposición natural en situaciones del mundo real [22]. La investigación de laboratorio también puede sufrir otras limitaciones, como los efectos experimentales que distorsionan la dinámica de las emociones [23].
Las grandes cantidades de datos producidos por los usuarios de las redes sociales ofrecen una forma de complementar la investigación previa sobre la dinámica de las emociones. Pero el uso de datos de redes sociales en la ciencia afectiva también tiene limitaciones. El resultado de los métodos de análisis de sentimientos comunes en las publicaciones en las redes sociales durante largos períodos de tiempo tiene una baja correlación con el resultado de cuestionarios sobre estados de ánimo persistentes [24]. Sin embargo, a escalas de tiempo más rápidas, el análisis de sentimientos del texto de las redes sociales se correlaciona con autoinformes individuales de estados afectivos momentáneos [12]. Por lo tanto, el análisis de los datos en línea puede, a pesar de sus limitaciones, complementar métodos psicológicos más tradicionales de manera importante.

La cuantificación de las dinámicas emocionales tiene potenciales aplicaciones de investigación adicionales que motivan nuestro trabajo. A través de un enfoque social-interaccionista [25], una mejor comprensión de la dinámica afectiva individual también puede ayudarnos a explicar la aparición de emociones colectivas. Se presume que las emociones colectivas se sostienen por períodos más largos que las reacciones emocionales puramente individuales [9]. Por lo tanto, tener una mejor estimación de la escala de tiempo promedio de las emociones individuales puede ayudarnos a identificar empíricamente las emociones colectivas. Y, por último, el conocimiento sobre la dinámica afectiva típica en la población general también puede ayudarnos a detectar dinámicas anormales, que se han relacionado con trastornos mentales como la depresión [6, 26].

Modelando dinámicas afectivas

La dinámica individual del afecto captura los cambios en los estados emocionales a lo largo del tiempo independientemente de la interacción social u otros estímulos externos. En 2010, dos equipos de investigación formularon de forma independiente modelos de dinámica individual de afecto: el marco Cyberemotions [11] y el modelo DynAffect [10]. Ambos grupos se centraron en el núcleo afectan las dimensiones de la valencia (agradable frente a desagradable) y la excitación (excitado frente a la calma) [27]. Además, ambos grupos asumieron que el afecto (tanto la valencia como la excitación) se relajan exponencialmente hacia una línea de base. El marco de Cyberemotions tiene como objetivo modelar la aparición de emociones colectivas en las comunidades en línea, dejando que cada modelo en el marco defina detalles sobre la interacción en línea [11]. Para este fin, este marco también incluye los antecedentes y efectos de la expresión emocional en la dinámica afectiva. En particular, el marco de Cyberemotions supone que expresar emociones tendría un efecto de retroalimentación reguladora sobre el estado emocional, una afirmación respaldada por la investigación psicológica [28].

Algunos supuestos del marco de Cyberemotions han sido probados empíricamente en experimentos que involucran leer y escribir publicaciones emocionales en línea [12]. El efecto se cuantificó mediante autoevaluaciones y detección de sentimientos en los mensajes de los participantes. El modelo DynAffect se probó en dos experimentos utilizando el muestreo de experiencia repetida de una cohorte de estudiantes en circunstancias de la vida cotidiana [10]. Si bien la evidencia valida en gran medida la dinámica de Dynaffect, los estudios produjeron resultados desconcertantes con respecto a la fuerza de la relajación exponencial del afecto: las estimaciones de los parámetros de relajación afectiva fueron mucho mayores en el primer experimento que en el segundo. Esto fue inesperado, porque la única diferencia importante entre los dos experimentos fue que la tasa de muestreo de la experiencia, es decir, con qué frecuencia los participantes tenían que calificar su valencia y excitación actuales, era más frecuente en el primer experimento. Sin embargo, si vemos estas calificaciones como una forma de expresión afectiva, el efecto de retroalimentación de regulación postulado por el modelo Cyberemotions puede explicar por qué las expresiones más frecuentes conducen a una relajación afectiva aparentemente más rápida.

Por lo tanto, para nuestro estudio actual, combinamos el supuesto de relajación exponencial de ambos modelos con el postulado de DynAffect de líneas de base afectivas individuales [10] y el efecto de regulación de la expresión afectiva del modelo Cyberemotions [11, 12].

Formalizamos estos supuestos siguiendo el formalismo del marco de Cyberemotions [11, 12]. Cuantificamos el estado emocional de un individuo en el tiempo t a través de su valencia y excitación . La dinámica de valencia y excitación solo difiere en sus valores de parámetros, no en su forma matemática, y por lo tanto denotamos como valencia o excitación en las ecuaciones generales.

Nuestro modelo de emociones individuales consta de dos partes. Primero, el efecto de la expresión, mediante el cual la acción de publicar una actualización de estado induce una regulación descendente instantánea de la emoción por un factor constante k:


(1)

En la ecuación anterior, individualmente comencé a escribir una actualización de estado en el momento anterior, expresando un estado emocionale , cuantificado como valencia o excitación. El estado emocional del individuo cuando publica la actualización de estado es . Para simplificar, suponemos que la escala de tiempo de la escritura es más rápida que la escala de tiempo entre la publicación de actualizaciones de estado, y por lo tanto modelamos el efecto de la escritura en xi como un cambio instantáneo. La línea de base de x para el individuo es μi, que denota el estado fundamental en el que las emociones del individuo tenderían a ser estables a lo largo del tiempo en ausencia de estímulos. Esta línea de base individual se puede medir a través del promedio de varios estados emocionales (valencia y excitación) medidos para el mismo individuo durante largos períodos de tiempo. Utilizamos este enfoque como explicamos más adelante en la Secta. 3.3. Después de la expresión de la emoción, el estado del individuo cambia instantáneamente a un valor ajustado por la distancia a la línea de base multiplicado por un factor constante k. Esta ecuación modela una regulación estable hacia la línea base cuando , que se ha observado previamente en experimentos [12]. En nuestros análisis empíricos, probamos las hipótesis de que k es mayor que cero y menor que 1, es decir, que existe un efecto de expresión que atenúa las emociones hacia una línea de base individual fija.

El segundo componente de la dinámica emocional en nuestro modelo es la relajación interna de los estados emocionales. Siguiendo el marco de modelado [11] y las observaciones empíricas [10], modelamos la relajación interna de las emociones como un proceso de reversión de la media hacia la línea de base:


(2)

En la ecuación anterior, el cambio en el estado emocional por unidad de tiempo es proporcional a la diferencia de ese estado emocional a la línea de base individual μi
. El término de ruido ξ (t) captura las fuerzas externas que cambian las emociones y que no estamos modelando en este caso. El coeficiente γ cuantifica esa relajación proporcional hacia la línea de base. Cuando 0 <γ <1, el valor de se aproxima a la línea de base con el tiempo. Este tipo de relajación exponencial se ha observado en investigaciones empíricas anteriores [10, 12], que sirve como punto de partida de nuestro modelo de dinámica individual. En este caso, cuando el valor de está por debajo de la línea de base, el valor de aumenta con el tiempo, acercándose a la línea de base desde abajo. Nuestro análisis empírico tiene como objetivo probar las hipótesis de que γ está por debajo de 1 y por encima de cero, estimando el mejor valor de γ.

La ecuación (2) es un ejemplo de un proceso de Ornstein-Uhlenbeck [29]. Podemos formular el valor esperado de después de un tiempo Δt fijo:
:

(3)

Combinamos esta solución con el efecto de expresión de la ecuación (1) para formular el modelo estadístico explicado en la sección. 3.3.

Datos y métodos.

Análisis de texto de expresión afectiva

Estudiamos las emociones como afecto central [30], es decir, estados psicológicos de corta duración de alta relevancia para el individuo que no necesitan tener un objetivo particular. Los estados en el núcleo del afecto se miden en términos de valencia y excitación. La valencia cuantifica el grado de placer asociado con una emoción y excita la activación inducida por esa emoción. Por ejemplo, la palabra "alegría" manifiesta una valencia positiva, un estado de alta excitación, mientras que la palabra "tristeza" se usa para expresar una valencia negativa, un estado de baja excitación. Se pueden anotar más palabras en este espacio de valencia y excitación, un método popularizado por el léxico ANEW [31] que se basa en el método diferencial semántico [32]. Tenga en cuenta que este enfoque supone que el afecto se puede medir a partir de su expresión a través de la comunicación humana. Si bien se puede esperar un nivel sustancial de ruido al usar estos métodos de análisis de texto para cuantificar las emociones, el uso de datos a gran escala de las redes sociales y otros recursos digitales permite el análisis de las emociones individuales y colectivas a través de patrones temporales y estructurales [16, 19 21, 33, 34].

Cuantificamos la valencia y la excitación expresada en cada actualización de estado a través de métodos no supervisados ​​que calculan las puntuaciones medias sobre términos derivados en un texto [35]. Para verificar que nuestros resultados no son un artefacto de un léxico particular, empleamos dos léxicos generados con diferentes esquemas de anotación: el léxico de las Normas Afectivas (WKB: Warriner – Kuperman – Brysbaert) [36], que incluye 13,915 lemmas que cubren los términos más frecuentes de un corpus de subtítulos, y el léxico NRC (National Research Council Canada) Valence, Arousal, and Dominance (NRC-VAD) [37], que incluye más de 20,000 términos seleccionados de varias fuentes. Nos referimos a estos métodos de análisis de texto para cuantificar la valencia y la excitación como el método WKB y el método NRC-VAD respectivamente. En el texto principal presentamos los resultados utilizando el método WKB e informamos los resultados utilizando el método NRC-VAD como alternativa en los materiales complementarios.

Si bien se han desarrollado otros métodos además de WKB y NRC-VAD para medir el sentimiento o el afecto del texto de las redes sociales, el léxico de estos dos métodos es el más completo, cubre los rangos más amplios de términos emocionales, y su principio fundamental ha sido validado en referencia estudios [38, 39]. La flexibilidad de estos métodos no supervisados ​​para cuantificar la expresión afectiva permite la generalización de nuestros análisis más allá de Facebook. Esto no sería posible si aplicamos métodos supervisados ​​entrenados solo para Facebook como un dominio particular [40]. Otros métodos no supervisados ​​han alcanzado altos niveles de precisión para las tareas de anotación de sentimientos en términos de clases de sentimientos (positivo, negativo, neutral) [38]. Entre los mejores se encuentra VADER [41], una herramienta que devuelve un puntaje numérico de sentimiento que ha sido entrenado y validado contra datos categóricos. Si bien esta herramienta se ha demostrado útil para caracterizar la valencia promedio del conjunto en Twitter [16], no podemos usarla para rastrear los valores de valencia a nivel individual debido a la distribución trimodal de las puntuaciones VADER (ver Fig. 9 en Materiales suplementarios).

Conjunto de datos de actualizaciones de estado de Facebook

Analizamos un conjunto de datos de actualizaciones de estado de Facebook generadas por el proyecto MyPersonality [42]. Este conjunto de datos contiene más de 22 millones de actualizaciones de estado que fueron provistas voluntariamente para la investigación académica por 153,727 usuarios de Facebook entre 2009 y 2011. A través del consorcio MyPersonality, accedimos a un conjunto de datos anónimo de actualizaciones de estado sin ninguna información de identificación personal. Este conjunto de datos y subconjuntos han sido utilizados en investigaciones previas sobre el reconocimiento computacional de la personalidad [43], la preferencia en la música [44] y el sentimiento de afiliación religiosa [45]. Filtramos las observaciones del conjunto de datos sin procesar de acuerdo con la siguiente directriz: Primero, descartamos pares de actualizaciones de estado posteriores que no pueden asignarse al menos un término de nuestro léxico de sentimientos cada una. Además, eliminamos los usuarios de baja actividad que actualizaron su estado menos de 20 veces durante todo el período de observación. Después del preprocesamiento de datos, 114,967 usuarios nos dejan 16,9 millones de actualizaciones de estado.

Los usuarios incluidos en este conjunto de datos se autoseleccionan al decidir usar la aplicación de Facebook MyPersonality. Esto podría implicar que sus características demográficas y personalidades difieren de la población general [46], en línea con las limitaciones generales para el uso de datos de redes sociales en las ciencias sociales [47]. Sin embargo, vale la pena señalar que esta muestra de usuarios es más diversa que la típica muestra participante de investigación psicológica, a menudo compuesta por estudiantes de alto estatus socioeconómico [48]. Las actualizaciones de estado de Facebook del conjunto de datos se asemejan a registros tipo diario en los que las personas escriben sobre momentos de su vida. Esto se puede observar en la nube de palabras del panel izquierdo de la Fig. 1, que muestra las palabras típicas que se encuentran en un diario (día, bueno, tener, ser, amar, querer, hora). El conjunto de datos no incluye respuestas o comentarios en conversaciones más amplias. Solo contiene actualizaciones de estado que los usuarios escribieron por iniciativa propia. Los usuarios optaron por compartir sus líneas de tiempo completo de actualizaciones de estado para la investigación. Si bien estas actualizaciones de estado siguen siendo actos de actuación frente al entorno social del usuario, componen la comunicación espontánea en un medio utilizado para hablar sobre la vida de uno. A diferencia de otros medios como Reddit, las actualizaciones de estado de Facebook carecen de un tema o contexto fijo en particular más allá de lo que el usuario individual elige hablar. Con un promedio de 143 actualizaciones de estado por usuario, este conjunto de datos compone un registro longitudinal y completo del texto de las redes sociales.



Histograma bidimensional de líneas de base de usuario y nube de palabras. El panel izquierdo muestra el histograma 2D de las líneas de base de valencia y excitación (valores medios) del usuario. Las líneas discontinuas rojas resaltan el punto medio de las escalas de valencia y excitación 1–9. Las líneas de base individuales se concentran por debajo del punto medio de la escala de excitación y por encima del punto medio de la escala de valencia. El panel derecho muestra la nube de palabras en el léxico WKB con un tamaño correspondiente a su frecuencia y un color correspondiente a su valor de valencia, de negativo en rojo a positivo en azul. Se muestran palabras con más de 5000 ocurrencias en el conjunto de datos

Todos los datos fueron donados voluntariamente por los usuarios de MyPersonality. Por lo tanto, las cuentas de bot y spam en este estudio no son un problema como en otras redes sociales como Twitter. Sin embargo, Twitter tiene el beneficio de un acceso generalizado para los investigadores y de volúmenes de datos muy altos, que permitieron análisis previos de la dinámica emocional [16]. La desventaja de esta facilidad de acceso es el problema del organismo modelo de Twitter [49], que requiere estudios en otras redes sociales para generalizar el comportamiento humano [50].

Modelo estadístico

Ahora derivamos un modelo estadístico basado en los principios expuestos en la sección Modelado de la dinámica afectiva anterior y que puede ajustarse con el resultado del análisis de texto del conjunto de datos de actualizaciones de estado de Facebook. Como paso previo al análisis estadístico, calculamos las líneas de base individuales de valencia y excitación como la media sobre las actualizaciones de estado analizadas de cada individuo. Luego restamos esta línea base de la secuencia de expresiones emocionales de un usuario. De este modo, simplificamos el modelo de modo que la relajación ocurra hacia cero, eliminando las diferencias persistentes interindividuales de las líneas de base afectivas. Para cada par secuencial de actualizaciones de estado del usuario i entre el tiempo t y t + Δt , ajustamos las siguientes ecuaciones del valor de valencia Vi, t + Δt y excitación Ai, t + Δt

expresado en la segunda actualización de estado:
:

(4)

donde  and cuantifica el efecto de regulación de la expresión en línea,  y cuantifican la velocidad de relajación, y y son residuos de regresión que se supone están normalmente distribuidos y no correlacionados. Ajustamos el modelo anterior con la función nls del paquete de estadísticas para el lenguaje estadístico R [51]. Ajustamos el modelo con pesos para cada muestra proporcional al logaritmo de Δt + 1

para enfocarse en la escala de tiempo rápida de valencia y excitación. Una alternativa a esta decisión es utilizar un método empírico para encontrar un límite de tiempo [16]. Sin embargo, para incluir todos los datos en nuestro análisis, elegimos un esquema de regresión ponderado en lugar de encontrar una escala de tiempo de corte. Calculamos intervalos de confianza del 95% y valores p con la función coeftest del paquete lmtest para R y ejecutamos una serie de diagnósticos de regresión para validar los supuestos de nuestro modelo estadístico.

Tenga en cuenta que, a diferencia de investigaciones anteriores [16], ajustamos la expresión emocional al nivel de actualización del estado individual en lugar del valor medio agrupado frente al tiempo. Esto tiene la ventaja de que nuestras estimaciones se pueden utilizar para calibrar modelos de emociones individuales y proporcionar estimaciones precisas de los parámetros de la dinámica emocional.

Resultados

El histograma 2d de las líneas de base individuales de valencia y excitación se muestra en el panel izquierdo de la Fig. 1. Las líneas de base de la excitación generalmente se encuentran por debajo de su punto medio, con un valor medio de 4,13. Con muy pocas excepciones, las líneas de base de valencia se concentran alrededor de un valor por encima del punto medio, con una media de 5.88. Estos dos valores están muy cerca de las observaciones empíricas en los autoinformes [10]. Las líneas de base de valencia positivas también son consistentes con el principio de Pollyanna [52], que se ha observado previamente en otros tipos de expresiones en línea [53, 54] y texto general [36, 55]. Se pueden encontrar más figuras descriptivas en los materiales complementarios, incluidos ejemplos de trayectorias individuales de valencia y excitación expresadas.
Memoria afectiva

Las emociones expresadas se relajan hacia la línea de base, pero esto no sucede instantáneamente. La Figura 2 muestra los cambios medios en la valencia y la excitación expresadas en función de la valencia y la excitación de las actualizaciones de estado anteriores en tres escalas de tiempo. La primera actualización de estado pertenece a un contenedor de una cuadrícula afectiva de 9 × 9 y el valor medio de su posterior actualización de estado se dirigen hacia la línea de base. Las actualizaciones de estado escritas en plazos cortos (con un Δt máximo de 5 minutos) no alcanzan completamente el valor de referencia. En escalas de tiempo más largas (Δt hasta 2 años), el valor esperado de valencia y activación de la segunda actualización de estado está claramente en la línea de base, como se muestra en el panel derecho de la Fig. 2. Estos patrones ilustran la existencia de una fuerza atractiva tanto y una memoria afectiva en la que las emociones expresadas en dos estados consecutivos están relacionadas siempre que el tiempo intermedio sea corto.


Figura 2


Cambios en la valencia y excitación expresadas en diferentes escalas de tiempo. Las flechas comienzan en el punto medio de los valores de valencia y excitación en una cuadrícula de  9 × 9 cuadrícula y terminar en el valor medio de la valencia y la activación de la próxima actualización de estado (ver [10] para una gráfica similar usando autoinformes). La valencia y la excitación regresan rápidamente a un punto con una valencia superior a 5 y una excitación alrededor de 4. La expresión emocional se relaja rápidamente pero no instantáneamente, ya que los cambios en escalas temporales breves se dirigen hacia la posición de referencia pero no convergen completamente. La transparencia de la flecha corresponde al número de observaciones en el contenedor.

A continuación, presentamos los patrones generales de la dinámica de las emociones de hasta 300 segundos, pero nuestro análisis estadístico incluye todos los intervalos de tiempo entre las publicaciones posteriores del mismo usuario. Presentamos figuras con patrones de hasta 300 minutos en los materiales complementarios.

Evaluamos cuantitativamente la existencia de memoria afectiva a través de la función de autocorrelación de valencia y excitación en actualizaciones de estado consecutivas del mismo individuo. La Figura 3 muestra el coeficiente de correlación de Pearson en función del tiempo entre las actualizaciones de estado para la excitación y la valencia, con intervalos de confianza de arranque del 95% calculados en más de 10,000 muestras. Para escalas de tiempo cortas, los coeficientes de correlación son significativos, alcanzando valores superiores a 0.4. El valor disminuye durante intervalos de tiempo más largos, alcanzando por primera vez valores no significativos después de 141 segundos para la valencia y después de 129 segundos para la excitación. Esto muestra que hay una memoria afectiva robusta en escalas de tiempo cortas. Sin embargo, cuando consideramos las actualizaciones de estado separadas por unos pocos minutos, la correlación entre la valencia expresada y la excitación es indistinguible de cero. Estos resultados son los mismos utilizando un método de análisis de texto alternativo, como se muestra en la Fig. 1 de los materiales complementarios.

Figura 3

Autocorrelación de valencia y excitación en actualizaciones de estado. Coeficientes de correlación de actualizaciones de estado posteriores por el mismo usuario (corrigiendo las líneas de base individuales) después de que Δt segundos pasaron entre ellas. Las áreas sombreadas tienen intervalos de confianza de arranque del 95%. Existe una fuerte correlación entre dos actualizaciones de estado posteriores en una escala de tiempo muy rápida. Si el tiempo entre las actualizaciones de estado aumenta, ambos coeficientes de correlación disminuyen y rápidamente se vuelven no significativos


Afecta los ajustes del modelo dinámico

Cuando se parte de un valor dado de valencia y excitación, el valor esperado de las emociones expresadas en las próximas actualizaciones de estado se muestra en la Fig. 4 en función del tiempo entre actualizaciones de estado. El proceso es reversible a la media: cuando se parte de un valor negativo (tenga en cuenta que hemos restado las líneas de base individuales), el valor esperado se aproxima a cero desde abajo. Cuando se parte de un valor positivo, este enfoque ocurre desde arriba. El valor esperado se vuelve indistinguible de cero en escalas de tiempo más largas, como se muestra en la Figura 3 de los materiales complementarios.

Figura 4

La valencia y la excitación se relajan hacia una línea de base afectiva. Valores medios de valencia y excitación (después de corregir las líneas de base individuales) en las actualizaciones de estado después de una anterior generada Δt segundos antes. Las líneas se agregan por las emociones expresadas en el primer mensaje para ilustrar las tendencias de relajación. Las medias se calculan sobre una ventana móvil de tamaño 15 (segundos) sobre todas las actualizaciones de estado de todos los usuarios y se trazan hasta un Δt máximo de 300 segundos. La relajación ocurre homogéneamente por encima y por debajo de la línea de base tanto para la valencia como para la excitación.
Imagen a tamaño completo

Validamos las observaciones anteriores ajustando el modelo estadístico introducido en la sección. 3.3. Los coeficientes estimados de los ajustes de valencia y excitación se muestran en la Tabla 1. El coeficiente de relajación para la excitación (, ) es más fuerte que para la valencia (, ). Esta observación es consistente con resultados previos de experimentos [12] y autoinformes in vivo [10]. Los usuarios que escriben actualizaciones de estado con alto contenido de excitación tienen menos probabilidades de tener una gran excitación comparable en la próxima actualización de estado si pasan más de unos minutos entre ellos. Tenga en cuenta que estas medidas reescaladas deben interpretarse como desviaciones de la línea de base afectiva de cada usuario. El efecto de retroalimentación de la expresión es capturado por las estimaciones de y , tomando valores de 0.38 y 0.45 respectivamente. Esto indica que una gran fracción del estado emocional inicial está regulada por la expresión, con aproximadamente el 40% de valencia y excitación restantes. Nuestras hipótesis iniciales de γ y k entre cero y uno, tanto para la valencia como para la excitación, están respaldadas por estos resultados, lo que indica la presencia de una relajación emocional estable hacia las líneas de base individuales y un efecto regulador de la expresión afectiva.


Tabla 1. Estimaciones de parámetros del modelo de regresión para valencia y excitación. Se proporcionan valores P e intervalos de confianza del 95% para las estimaciones de parámetros




Se puede observar una ilustración de la relajación rápida hacia la línea de base que captura el modelo en la Fig. 5. Los valores iniciales de alta valencia o excitación se regulan instantáneamente por un factor proporcional y luego se acercan exponencialmente a cero desde arriba. Lo inverso también es observable para los valores de excitación y valencia por debajo de cero, que primero regulan hacia cero y luego se acercan exponencialmente desde abajo (también observable en la Fig. 4).

Figura 5


Perfiles dinámicos de emoción en los modelos equipados. Próximo valor estimado de valencia y excitación después de Δt segundos en ambos modelos ajustados. La excitación se relaja más rápido que la valencia.

Las estimaciones consistentes con heteroscedasticidad y autocorrelación para los modelos arrojan estimaciones de coeficientes muy cercanas a las reportadas en la Tabla 1 y siguen siendo significativas. Estos resultados son muy similares cuando se usa el método de análisis de sentimiento alternativo, como se informa en la Tabla complementaria 1. Esto indica que nuestros resultados principales no son un artefacto de algunos errores o sesgos particulares de la herramienta de análisis de texto.

Ambos modelos superan a otros enfoques para modelar dinámicas emocionales. La suma residual de los cuadrados de nuestros ataques de valencia y excitación son más bajos que los de los modelos sin relajación (γ = 0), sin efecto de expresión (k = 0) y que modelos de una relajación lineal en el tiempo y de un polinomio cúbico de tiempo. En ambos ajustes, los residuos de regresión son aproximadamente normales (el estadístico de Shapiro-Wilk de los residuos para los modelos de valencia y excitación están por encima de 0.95), sin correlación con los valores ajustados (valencia ρ = −0.0017, excitación ρ = −0.0014) y con variables independientes (ρ como máximo 0.016 para valencia y como máximo 0.013 para excitación). Los residuos no muestran correlación entre las actualizaciones de estado posteriores de los mismos individuos (ρ = 0.015 para valencia y ρ = 0.013

para la excitación). Esto evidencia la validez de la formulación de dinámicas emocionales como una combinación de un efecto de expresión y una relajación proporcional hacia una línea de base individual, como se presenta en la Sección 2.

Los patrones de memoria de nuestro modelo, si bien son consistentes con investigaciones anteriores, también podrían explicarse por procesos de sincronización colectiva y cultural que influyen en la expresión emocional. Por ejemplo, los saludos estacionales como "feliz año nuevo" o "feliz Navidad" podrían introducir artefactos en nuestra medición como manifestaciones del estado de ánimo colectivo [34]. Tenemos en cuenta estos efectos en nuestros análisis, repetimos los ajustes del modelo que incluyen líneas de base semanales interindividuales adicionales para valencia y excitación. Los resultados son muy similares con estas correcciones estacionales, como se presenta más detalladamente en la sección "corrección estacional" en los Materiales suplementarios.

Conclusiones

Nuestro análisis de la dinámica temporal de la expresión afectiva en Facebook valida nuestro modelo de dinámica afectiva. Confirmamos la existencia de líneas de base afectivas individuales, que se concentran alrededor de una valencia ligeramente positiva y un punto de activación moderado. Además, utilizando un modelo de regresión no lineal, validamos la suposición de que la valencia y la excitación se relajan exponencialmente hacia la línea de base individual. Esto puede verse como un recuerdo a corto plazo de la expresión emocional: la valencia y la excitación de dos actualizaciones de estado consecutivas del mismo individuo están altamente correlacionadas hasta unos pocos minutos, pero no se correlacionan durante períodos de tiempo más largos. Encontramos que existe un considerable efecto de regulación tanto para la valencia como para la excitación, lo que significa que las expresiones afectivas reducen instantáneamente la magnitud de los estados afectivos en un factor proporcional.

Nuestros resultados son consistentes con análisis observacionales previos del etiquetado de emociones en Twitter [16]. En comparación con nuestro trabajo, el análisis de [16] se centró en la relajación de las emociones después de un informe de etiquetado explícito, un fenómeno que opera a una escala de tiempo más larga que nuestro análisis de relajación espontánea de valencia y excitación. Esto ilustra que varios aspectos y escalas temporales de la vida afectiva pueden analizarse a través de los datos de las redes sociales, capturando tanto las tendencias de relajación del afecto central como del estado de ánimo y otros fenómenos más persistentes.

Si bien nuestro análisis ha revelado propiedades fundamentales de la dinámica de las emociones, es importante resaltar sus limitaciones. Nuestro modelo no es una herramienta predictiva que pueda proporcionar estimaciones precisas de los sentimientos en el futuro, especialmente cuando se consideran escalas de tiempo largas. Sin embargo, el conjunto de datos a gran escala que analizamos nos permitió hacer inferencias robustas que apuntan a la dinámica de las emociones en general. Los estudios futuros pueden incluir datos externos adicionales (por ejemplo, interacción social, hora del día, atributos demográficos) para generar herramientas predictivas más allá de nuestro trabajo. Además, la actividad de las redes sociales tiene una naturaleza performativa y los datos se generan con sesgos de autoselección que pueden afectar los resultados del análisis de texto. No obstante, nuestros análisis nos permiten superar algunas limitaciones de los métodos tradicionales, rastreando las emociones durante largos períodos de tiempo en una gran muestra de usuarios más diversos que la muestra típica de un estudio de psicología. Además, nuestros resultados concuerdan con los resultados anteriores y son consistentes en los dos métodos de análisis de sentimientos que aplicamos. Todos los métodos en psicología tienen limitaciones, solo comparando sus resultados en varios escenarios podemos converger a una comprensión unificada del comportamiento humano.

La evidencia reunida por nuestro análisis contribuye a una línea de investigación emergente de modelado computacional de las emociones [9, 11]. Los modelos computacionales, en particular los modelos basados ​​en agentes, formalizan la dinámica de las propiedades individuales y la interacción y comunicación entre los individuos para explicar el comportamiento colectivo y complejo. Para que estos modelos vayan más allá de los argumentos teóricos, es necesario probar empíricamente sus supuestos y calibrar sus valores de parámetros con datos empíricos. Nuestro trabajo ha validado una serie de supuestos de estos modelos [12] y hemos calculado valores precisos para los parámetros de la dinámica emocional individual como se manifiesta a través de las redes sociales.

Tales modelos cuantitativos de dinámica afectiva también pueden contribuir a la comprensión y el tratamiento de los trastornos afectivos. Si bien las dinámicas psicológicas complejas medidas con cuestionarios aportan información limitada para evaluar el bienestar [56], un escenario más rico en datos (como la investigación en redes sociales) podría proporcionar suficiente precisión para revelar el papel de las dinámicas afectivas complejas. Además de la psicopatología, los modelos dinámicos de emoción empíricamente calibrados también se pueden aplicar para simular reacciones emocionales en tecnologías informáticas afectivas [57]. Por ejemplo, las expresiones faciales de humanos virtuales se pueden simular con nuestro modelo [58], y los sistemas de diálogo pueden proporcionar dinámicas emocionales plausibles con los parámetros apropiados [59].

Además, nuestros hallazgos tienen algunas implicaciones para la metodología de la psicología afectiva. En particular, nuestro modelo puede ayudar a los investigadores a (i) estimar el impacto afectivo real de un estímulo dado, en función de su relajación dinámica, (ii) determinar la duración necesaria de los intervalos de medición y los descansos entre estímulos, para evitar la transferencia efectos de las emociones, y (iii) cuidado y control para el efecto de retroalimentación de regulación de la expresión afectiva, que también puede ocurrir después de las autoevaluaciones.

Los parámetros de nuestros modelos son muy similares a los encontrados en los experimentos de interacción en línea [12]. A pesar de utilizar un diseño muy diferente (observación versus experimento), metodología (análisis de texto versus autoevaluación) y composición de la muestra (muestra de estudiantes versus usuarios de Facebook), obtenemos estimaciones muy similares para las líneas de base afectivas y los parámetros de relajación. Esto constituye una fuerte validación de nuestro modelo de dinámica afectiva, mucho más que una simple replicación de estudios previos. Más allá de eso, nuestros métodos tienen ventajas adicionales en comparación con los métodos tradicionales: incluyen muestras de participantes más grandes y representativas, el comportamiento se puede medir por períodos de tiempo más largos y el costo de la recopilación y reutilización de datos es sustancialmente menor. Esto muestra cómo se puede avanzar en la investigación psicológica a través de la ciencia de datos, especialmente a través del análisis de conjuntos de datos a gran escala de rastros de comportamiento en línea.


Referencias