jueves, 6 de febrero de 2020

Dinámica de la expresión afectiva en redes sociales

La dinámica individual de la expresión afectiva en las redes sociales


Max Pellert, Simon Schweighofer y David García

EPJ Data Science volumen 9, Número de artículo: 1 (2020)

Citar como:
Pellert, M., Schweighofer, S. & Garcia, D. The individual dynamics of affective expression on social media. EPJ Data Sci. 9, 1 (2020). https://doi.org/10.1140/epjds/s13688-019-0219-3

Resumen
Comprender la dinámica temporal del afecto es crucial para comprender las emociones humanas en general. En este estudio, probamos empíricamente un modelo computacional de dinámica afectiva analizando un conjunto de datos a gran escala de actualizaciones de estado de Facebook utilizando técnicas de análisis de texto. Nuestros análisis respaldan los supuestos centrales de nuestro modelo: después de la estimulación, los estados afectivos, cuantificados como valencia y excitación, regresan exponencialmente a una línea de base específica de cada individuo. En promedio, esta línea base tiene un valor de valencia ligeramente positivo y un punto de activación moderado por debajo del punto medio. Además, la expresión afectiva, en este caso publicar una actualización de estado en Facebook, empuja inmediatamente la excitación y la valencia hacia la línea de base en un valor proporcional. Estos resultados son sólidos para la elección de la técnica de análisis de texto e ilustran la rápida escala de tiempo de la dinámica afectiva a través del texto de las redes sociales. Estos resultados son de gran relevancia para la computación afectiva, la detección y el modelado de emociones colectivas, el refinamiento de la metodología de investigación psicológica y la detección de dinámicas de afectos individuales anormales y potencialmente patológicos.

“Cuando estés enojado, cuenta diez antes de hablar; si estás muy enojado, cuenta hasta cien.

Thomas Jefferson



Introducción

Las emociones tienen una profunda influencia en la cognición y el comportamiento humano en muchos dominios [1]: sesgan la memoria, la percepción y la toma de decisiones [2] y proporcionan retroalimentación sobre el pasado y orientación para el comportamiento actual [3]. Algunos de los trastornos mentales más frecuentes, como la depresión y el trastorno de ansiedad, se caracterizan por estados emocionales anormales [4–6]. Además, las emociones tienen una función social. Experimentar emociones induce una tendencia a compartirlas con otros, haciéndolas experimentar también estas emociones [7], dando lugar a emociones colectivas con un impacto a menudo profundo en la sociedad en general [8, 9].

Si bien la influencia de las emociones en la cognición y el comportamiento está bien establecida, la mayoría de los estudios dejan de lado un aspecto crucial: la dinámica temporal de los estados emocionales. Se supone comúnmente que las emociones se relajan con el tiempo si no se reestimulan [10-12]. ¿Pero a qué ritmo se relajan los estados emocionales? Saber esto nos dirá cuánto tiempo después de un evento inductor de emociones se puede esperar que dure el impacto cognitivo y conductual de las emociones. Por ejemplo, ¿es suficiente seguir los consejos de Jefferson y contar hasta diez o cien para evitar los efectos negativos de la ira? Una segunda pregunta se refiere a la línea de base a la que regresan las emociones después de un evento inductor de emociones: ¿volvemos a un estado de emociones completamente neutrales o hay líneas de base individuales desplazadas del punto medio? Además, la expresión de las emociones puede tener un efecto en la dinámica afectiva: si ignoramos el consejo de Jefferson y expresamos nuestras opiniones mientras todavía estamos enojados, ¿este acto expresivo relajará nuestro estado emocional y, de ser así, en qué medida?

En este estudio, queremos abordar estas preguntas (i) formulando un modelo matemático de dinámica afectiva y (ii) probando este modelo analizando los rastros digitales de la expresión afectiva espontánea, en forma de un conjunto de datos a gran escala de Facebook actualizaciones de estado.

Este enfoque de probar hipótesis psicológicas con datos en línea todavía es nuevo, pero ya ha demostrado su valía [13]. Por ejemplo, se ha demostrado que la experiencia de estados emocionales excitados conduce al intercambio de información en las redes sociales [14] y, a su vez, que la expresión emocional en línea puede impulsar el contagio emocional [15], puede regular las emociones a través del etiquetado [16], y puede afectar la felicidad a través de la comparación social [17] y la popularidad a través de la regulación social de las emociones [18]. Otros estudios han demostrado cómo el estado de ánimo oscila durante las estaciones [19] y cómo la contaminación del aire está relacionada con el bienestar expresado [20]. Según los datos en línea, también es posible detectar emociones colectivas fuertes, tal como aparecieron en Francia después de los ataques terroristas de París en noviembre de 2015, y mostrar cómo pueden contribuir al aumento de la solidaridad y la resiliencia social [21].

Analizar los datos en línea nos ayuda a evitar algunas de las limitaciones de los métodos más tradicionales para cuantificar los estados emocionales. Si bien los autoinformes de estados emocionales momentáneos pueden mostrar su dinámica cuando se recopilan a través de dispositivos de mano [10], este método requiere que los participantes evalúen sus emociones varias veces al día, interrumpiendo su rutina diaria y afectando su atención. La alta demanda de los participantes del estudio limita el tamaño de las muestras y la aplicabilidad de este método. Otra investigación ha utilizado experimentos controlados para provocar reacciones emocionales y rastrear su evolución a lo largo del tiempo [12]. Si bien esto tiene la ventaja de resaltar la dinámica de las emociones en contraste con las fuentes externas de ruido, sufre una serie de limitaciones a la validez externa. La exposición artificial a estímulos en experimentos puede diferir mucho de las propiedades de la exposición natural en situaciones del mundo real [22]. La investigación de laboratorio también puede sufrir otras limitaciones, como los efectos experimentales que distorsionan la dinámica de las emociones [23].
Las grandes cantidades de datos producidos por los usuarios de las redes sociales ofrecen una forma de complementar la investigación previa sobre la dinámica de las emociones. Pero el uso de datos de redes sociales en la ciencia afectiva también tiene limitaciones. El resultado de los métodos de análisis de sentimientos comunes en las publicaciones en las redes sociales durante largos períodos de tiempo tiene una baja correlación con el resultado de cuestionarios sobre estados de ánimo persistentes [24]. Sin embargo, a escalas de tiempo más rápidas, el análisis de sentimientos del texto de las redes sociales se correlaciona con autoinformes individuales de estados afectivos momentáneos [12]. Por lo tanto, el análisis de los datos en línea puede, a pesar de sus limitaciones, complementar métodos psicológicos más tradicionales de manera importante.

La cuantificación de las dinámicas emocionales tiene potenciales aplicaciones de investigación adicionales que motivan nuestro trabajo. A través de un enfoque social-interaccionista [25], una mejor comprensión de la dinámica afectiva individual también puede ayudarnos a explicar la aparición de emociones colectivas. Se presume que las emociones colectivas se sostienen por períodos más largos que las reacciones emocionales puramente individuales [9]. Por lo tanto, tener una mejor estimación de la escala de tiempo promedio de las emociones individuales puede ayudarnos a identificar empíricamente las emociones colectivas. Y, por último, el conocimiento sobre la dinámica afectiva típica en la población general también puede ayudarnos a detectar dinámicas anormales, que se han relacionado con trastornos mentales como la depresión [6, 26].

Modelando dinámicas afectivas

La dinámica individual del afecto captura los cambios en los estados emocionales a lo largo del tiempo independientemente de la interacción social u otros estímulos externos. En 2010, dos equipos de investigación formularon de forma independiente modelos de dinámica individual de afecto: el marco Cyberemotions [11] y el modelo DynAffect [10]. Ambos grupos se centraron en el núcleo afectan las dimensiones de la valencia (agradable frente a desagradable) y la excitación (excitado frente a la calma) [27]. Además, ambos grupos asumieron que el afecto (tanto la valencia como la excitación) se relajan exponencialmente hacia una línea de base. El marco de Cyberemotions tiene como objetivo modelar la aparición de emociones colectivas en las comunidades en línea, dejando que cada modelo en el marco defina detalles sobre la interacción en línea [11]. Para este fin, este marco también incluye los antecedentes y efectos de la expresión emocional en la dinámica afectiva. En particular, el marco de Cyberemotions supone que expresar emociones tendría un efecto de retroalimentación reguladora sobre el estado emocional, una afirmación respaldada por la investigación psicológica [28].

Algunos supuestos del marco de Cyberemotions han sido probados empíricamente en experimentos que involucran leer y escribir publicaciones emocionales en línea [12]. El efecto se cuantificó mediante autoevaluaciones y detección de sentimientos en los mensajes de los participantes. El modelo DynAffect se probó en dos experimentos utilizando el muestreo de experiencia repetida de una cohorte de estudiantes en circunstancias de la vida cotidiana [10]. Si bien la evidencia valida en gran medida la dinámica de Dynaffect, los estudios produjeron resultados desconcertantes con respecto a la fuerza de la relajación exponencial del afecto: las estimaciones de los parámetros de relajación afectiva fueron mucho mayores en el primer experimento que en el segundo. Esto fue inesperado, porque la única diferencia importante entre los dos experimentos fue que la tasa de muestreo de la experiencia, es decir, con qué frecuencia los participantes tenían que calificar su valencia y excitación actuales, era más frecuente en el primer experimento. Sin embargo, si vemos estas calificaciones como una forma de expresión afectiva, el efecto de retroalimentación de regulación postulado por el modelo Cyberemotions puede explicar por qué las expresiones más frecuentes conducen a una relajación afectiva aparentemente más rápida.

Por lo tanto, para nuestro estudio actual, combinamos el supuesto de relajación exponencial de ambos modelos con el postulado de DynAffect de líneas de base afectivas individuales [10] y el efecto de regulación de la expresión afectiva del modelo Cyberemotions [11, 12].

Formalizamos estos supuestos siguiendo el formalismo del marco de Cyberemotions [11, 12]. Cuantificamos el estado emocional de un individuo en el tiempo t a través de su valencia y excitación . La dinámica de valencia y excitación solo difiere en sus valores de parámetros, no en su forma matemática, y por lo tanto denotamos como valencia o excitación en las ecuaciones generales.

Nuestro modelo de emociones individuales consta de dos partes. Primero, el efecto de la expresión, mediante el cual la acción de publicar una actualización de estado induce una regulación descendente instantánea de la emoción por un factor constante k:


(1)

En la ecuación anterior, individualmente comencé a escribir una actualización de estado en el momento anterior, expresando un estado emocionale , cuantificado como valencia o excitación. El estado emocional del individuo cuando publica la actualización de estado es . Para simplificar, suponemos que la escala de tiempo de la escritura es más rápida que la escala de tiempo entre la publicación de actualizaciones de estado, y por lo tanto modelamos el efecto de la escritura en xi como un cambio instantáneo. La línea de base de x para el individuo es μi, que denota el estado fundamental en el que las emociones del individuo tenderían a ser estables a lo largo del tiempo en ausencia de estímulos. Esta línea de base individual se puede medir a través del promedio de varios estados emocionales (valencia y excitación) medidos para el mismo individuo durante largos períodos de tiempo. Utilizamos este enfoque como explicamos más adelante en la Secta. 3.3. Después de la expresión de la emoción, el estado del individuo cambia instantáneamente a un valor ajustado por la distancia a la línea de base multiplicado por un factor constante k. Esta ecuación modela una regulación estable hacia la línea base cuando , que se ha observado previamente en experimentos [12]. En nuestros análisis empíricos, probamos las hipótesis de que k es mayor que cero y menor que 1, es decir, que existe un efecto de expresión que atenúa las emociones hacia una línea de base individual fija.

El segundo componente de la dinámica emocional en nuestro modelo es la relajación interna de los estados emocionales. Siguiendo el marco de modelado [11] y las observaciones empíricas [10], modelamos la relajación interna de las emociones como un proceso de reversión de la media hacia la línea de base:


(2)

En la ecuación anterior, el cambio en el estado emocional por unidad de tiempo es proporcional a la diferencia de ese estado emocional a la línea de base individual μi
. El término de ruido ξ (t) captura las fuerzas externas que cambian las emociones y que no estamos modelando en este caso. El coeficiente γ cuantifica esa relajación proporcional hacia la línea de base. Cuando 0 <γ <1, el valor de se aproxima a la línea de base con el tiempo. Este tipo de relajación exponencial se ha observado en investigaciones empíricas anteriores [10, 12], que sirve como punto de partida de nuestro modelo de dinámica individual. En este caso, cuando el valor de está por debajo de la línea de base, el valor de aumenta con el tiempo, acercándose a la línea de base desde abajo. Nuestro análisis empírico tiene como objetivo probar las hipótesis de que γ está por debajo de 1 y por encima de cero, estimando el mejor valor de γ.

La ecuación (2) es un ejemplo de un proceso de Ornstein-Uhlenbeck [29]. Podemos formular el valor esperado de después de un tiempo Δt fijo:
:

(3)

Combinamos esta solución con el efecto de expresión de la ecuación (1) para formular el modelo estadístico explicado en la sección. 3.3.

Datos y métodos.

Análisis de texto de expresión afectiva

Estudiamos las emociones como afecto central [30], es decir, estados psicológicos de corta duración de alta relevancia para el individuo que no necesitan tener un objetivo particular. Los estados en el núcleo del afecto se miden en términos de valencia y excitación. La valencia cuantifica el grado de placer asociado con una emoción y excita la activación inducida por esa emoción. Por ejemplo, la palabra "alegría" manifiesta una valencia positiva, un estado de alta excitación, mientras que la palabra "tristeza" se usa para expresar una valencia negativa, un estado de baja excitación. Se pueden anotar más palabras en este espacio de valencia y excitación, un método popularizado por el léxico ANEW [31] que se basa en el método diferencial semántico [32]. Tenga en cuenta que este enfoque supone que el afecto se puede medir a partir de su expresión a través de la comunicación humana. Si bien se puede esperar un nivel sustancial de ruido al usar estos métodos de análisis de texto para cuantificar las emociones, el uso de datos a gran escala de las redes sociales y otros recursos digitales permite el análisis de las emociones individuales y colectivas a través de patrones temporales y estructurales [16, 19 21, 33, 34].

Cuantificamos la valencia y la excitación expresada en cada actualización de estado a través de métodos no supervisados ​​que calculan las puntuaciones medias sobre términos derivados en un texto [35]. Para verificar que nuestros resultados no son un artefacto de un léxico particular, empleamos dos léxicos generados con diferentes esquemas de anotación: el léxico de las Normas Afectivas (WKB: Warriner – Kuperman – Brysbaert) [36], que incluye 13,915 lemmas que cubren los términos más frecuentes de un corpus de subtítulos, y el léxico NRC (National Research Council Canada) Valence, Arousal, and Dominance (NRC-VAD) [37], que incluye más de 20,000 términos seleccionados de varias fuentes. Nos referimos a estos métodos de análisis de texto para cuantificar la valencia y la excitación como el método WKB y el método NRC-VAD respectivamente. En el texto principal presentamos los resultados utilizando el método WKB e informamos los resultados utilizando el método NRC-VAD como alternativa en los materiales complementarios.

Si bien se han desarrollado otros métodos además de WKB y NRC-VAD para medir el sentimiento o el afecto del texto de las redes sociales, el léxico de estos dos métodos es el más completo, cubre los rangos más amplios de términos emocionales, y su principio fundamental ha sido validado en referencia estudios [38, 39]. La flexibilidad de estos métodos no supervisados ​​para cuantificar la expresión afectiva permite la generalización de nuestros análisis más allá de Facebook. Esto no sería posible si aplicamos métodos supervisados ​​entrenados solo para Facebook como un dominio particular [40]. Otros métodos no supervisados ​​han alcanzado altos niveles de precisión para las tareas de anotación de sentimientos en términos de clases de sentimientos (positivo, negativo, neutral) [38]. Entre los mejores se encuentra VADER [41], una herramienta que devuelve un puntaje numérico de sentimiento que ha sido entrenado y validado contra datos categóricos. Si bien esta herramienta se ha demostrado útil para caracterizar la valencia promedio del conjunto en Twitter [16], no podemos usarla para rastrear los valores de valencia a nivel individual debido a la distribución trimodal de las puntuaciones VADER (ver Fig. 9 en Materiales suplementarios).

Conjunto de datos de actualizaciones de estado de Facebook

Analizamos un conjunto de datos de actualizaciones de estado de Facebook generadas por el proyecto MyPersonality [42]. Este conjunto de datos contiene más de 22 millones de actualizaciones de estado que fueron provistas voluntariamente para la investigación académica por 153,727 usuarios de Facebook entre 2009 y 2011. A través del consorcio MyPersonality, accedimos a un conjunto de datos anónimo de actualizaciones de estado sin ninguna información de identificación personal. Este conjunto de datos y subconjuntos han sido utilizados en investigaciones previas sobre el reconocimiento computacional de la personalidad [43], la preferencia en la música [44] y el sentimiento de afiliación religiosa [45]. Filtramos las observaciones del conjunto de datos sin procesar de acuerdo con la siguiente directriz: Primero, descartamos pares de actualizaciones de estado posteriores que no pueden asignarse al menos un término de nuestro léxico de sentimientos cada una. Además, eliminamos los usuarios de baja actividad que actualizaron su estado menos de 20 veces durante todo el período de observación. Después del preprocesamiento de datos, 114,967 usuarios nos dejan 16,9 millones de actualizaciones de estado.

Los usuarios incluidos en este conjunto de datos se autoseleccionan al decidir usar la aplicación de Facebook MyPersonality. Esto podría implicar que sus características demográficas y personalidades difieren de la población general [46], en línea con las limitaciones generales para el uso de datos de redes sociales en las ciencias sociales [47]. Sin embargo, vale la pena señalar que esta muestra de usuarios es más diversa que la típica muestra participante de investigación psicológica, a menudo compuesta por estudiantes de alto estatus socioeconómico [48]. Las actualizaciones de estado de Facebook del conjunto de datos se asemejan a registros tipo diario en los que las personas escriben sobre momentos de su vida. Esto se puede observar en la nube de palabras del panel izquierdo de la Fig. 1, que muestra las palabras típicas que se encuentran en un diario (día, bueno, tener, ser, amar, querer, hora). El conjunto de datos no incluye respuestas o comentarios en conversaciones más amplias. Solo contiene actualizaciones de estado que los usuarios escribieron por iniciativa propia. Los usuarios optaron por compartir sus líneas de tiempo completo de actualizaciones de estado para la investigación. Si bien estas actualizaciones de estado siguen siendo actos de actuación frente al entorno social del usuario, componen la comunicación espontánea en un medio utilizado para hablar sobre la vida de uno. A diferencia de otros medios como Reddit, las actualizaciones de estado de Facebook carecen de un tema o contexto fijo en particular más allá de lo que el usuario individual elige hablar. Con un promedio de 143 actualizaciones de estado por usuario, este conjunto de datos compone un registro longitudinal y completo del texto de las redes sociales.



Histograma bidimensional de líneas de base de usuario y nube de palabras. El panel izquierdo muestra el histograma 2D de las líneas de base de valencia y excitación (valores medios) del usuario. Las líneas discontinuas rojas resaltan el punto medio de las escalas de valencia y excitación 1–9. Las líneas de base individuales se concentran por debajo del punto medio de la escala de excitación y por encima del punto medio de la escala de valencia. El panel derecho muestra la nube de palabras en el léxico WKB con un tamaño correspondiente a su frecuencia y un color correspondiente a su valor de valencia, de negativo en rojo a positivo en azul. Se muestran palabras con más de 5000 ocurrencias en el conjunto de datos

Todos los datos fueron donados voluntariamente por los usuarios de MyPersonality. Por lo tanto, las cuentas de bot y spam en este estudio no son un problema como en otras redes sociales como Twitter. Sin embargo, Twitter tiene el beneficio de un acceso generalizado para los investigadores y de volúmenes de datos muy altos, que permitieron análisis previos de la dinámica emocional [16]. La desventaja de esta facilidad de acceso es el problema del organismo modelo de Twitter [49], que requiere estudios en otras redes sociales para generalizar el comportamiento humano [50].

Modelo estadístico

Ahora derivamos un modelo estadístico basado en los principios expuestos en la sección Modelado de la dinámica afectiva anterior y que puede ajustarse con el resultado del análisis de texto del conjunto de datos de actualizaciones de estado de Facebook. Como paso previo al análisis estadístico, calculamos las líneas de base individuales de valencia y excitación como la media sobre las actualizaciones de estado analizadas de cada individuo. Luego restamos esta línea base de la secuencia de expresiones emocionales de un usuario. De este modo, simplificamos el modelo de modo que la relajación ocurra hacia cero, eliminando las diferencias persistentes interindividuales de las líneas de base afectivas. Para cada par secuencial de actualizaciones de estado del usuario i entre el tiempo t y t + Δt , ajustamos las siguientes ecuaciones del valor de valencia Vi, t + Δt y excitación Ai, t + Δt

expresado en la segunda actualización de estado:
:

(4)

donde  and cuantifica el efecto de regulación de la expresión en línea,  y cuantifican la velocidad de relajación, y y son residuos de regresión que se supone están normalmente distribuidos y no correlacionados. Ajustamos el modelo anterior con la función nls del paquete de estadísticas para el lenguaje estadístico R [51]. Ajustamos el modelo con pesos para cada muestra proporcional al logaritmo de Δt + 1

para enfocarse en la escala de tiempo rápida de valencia y excitación. Una alternativa a esta decisión es utilizar un método empírico para encontrar un límite de tiempo [16]. Sin embargo, para incluir todos los datos en nuestro análisis, elegimos un esquema de regresión ponderado en lugar de encontrar una escala de tiempo de corte. Calculamos intervalos de confianza del 95% y valores p con la función coeftest del paquete lmtest para R y ejecutamos una serie de diagnósticos de regresión para validar los supuestos de nuestro modelo estadístico.

Tenga en cuenta que, a diferencia de investigaciones anteriores [16], ajustamos la expresión emocional al nivel de actualización del estado individual en lugar del valor medio agrupado frente al tiempo. Esto tiene la ventaja de que nuestras estimaciones se pueden utilizar para calibrar modelos de emociones individuales y proporcionar estimaciones precisas de los parámetros de la dinámica emocional.

Resultados

El histograma 2d de las líneas de base individuales de valencia y excitación se muestra en el panel izquierdo de la Fig. 1. Las líneas de base de la excitación generalmente se encuentran por debajo de su punto medio, con un valor medio de 4,13. Con muy pocas excepciones, las líneas de base de valencia se concentran alrededor de un valor por encima del punto medio, con una media de 5.88. Estos dos valores están muy cerca de las observaciones empíricas en los autoinformes [10]. Las líneas de base de valencia positivas también son consistentes con el principio de Pollyanna [52], que se ha observado previamente en otros tipos de expresiones en línea [53, 54] y texto general [36, 55]. Se pueden encontrar más figuras descriptivas en los materiales complementarios, incluidos ejemplos de trayectorias individuales de valencia y excitación expresadas.
Memoria afectiva

Las emociones expresadas se relajan hacia la línea de base, pero esto no sucede instantáneamente. La Figura 2 muestra los cambios medios en la valencia y la excitación expresadas en función de la valencia y la excitación de las actualizaciones de estado anteriores en tres escalas de tiempo. La primera actualización de estado pertenece a un contenedor de una cuadrícula afectiva de 9 × 9 y el valor medio de su posterior actualización de estado se dirigen hacia la línea de base. Las actualizaciones de estado escritas en plazos cortos (con un Δt máximo de 5 minutos) no alcanzan completamente el valor de referencia. En escalas de tiempo más largas (Δt hasta 2 años), el valor esperado de valencia y activación de la segunda actualización de estado está claramente en la línea de base, como se muestra en el panel derecho de la Fig. 2. Estos patrones ilustran la existencia de una fuerza atractiva tanto y una memoria afectiva en la que las emociones expresadas en dos estados consecutivos están relacionadas siempre que el tiempo intermedio sea corto.


Figura 2


Cambios en la valencia y excitación expresadas en diferentes escalas de tiempo. Las flechas comienzan en el punto medio de los valores de valencia y excitación en una cuadrícula de  9 × 9 cuadrícula y terminar en el valor medio de la valencia y la activación de la próxima actualización de estado (ver [10] para una gráfica similar usando autoinformes). La valencia y la excitación regresan rápidamente a un punto con una valencia superior a 5 y una excitación alrededor de 4. La expresión emocional se relaja rápidamente pero no instantáneamente, ya que los cambios en escalas temporales breves se dirigen hacia la posición de referencia pero no convergen completamente. La transparencia de la flecha corresponde al número de observaciones en el contenedor.

A continuación, presentamos los patrones generales de la dinámica de las emociones de hasta 300 segundos, pero nuestro análisis estadístico incluye todos los intervalos de tiempo entre las publicaciones posteriores del mismo usuario. Presentamos figuras con patrones de hasta 300 minutos en los materiales complementarios.

Evaluamos cuantitativamente la existencia de memoria afectiva a través de la función de autocorrelación de valencia y excitación en actualizaciones de estado consecutivas del mismo individuo. La Figura 3 muestra el coeficiente de correlación de Pearson en función del tiempo entre las actualizaciones de estado para la excitación y la valencia, con intervalos de confianza de arranque del 95% calculados en más de 10,000 muestras. Para escalas de tiempo cortas, los coeficientes de correlación son significativos, alcanzando valores superiores a 0.4. El valor disminuye durante intervalos de tiempo más largos, alcanzando por primera vez valores no significativos después de 141 segundos para la valencia y después de 129 segundos para la excitación. Esto muestra que hay una memoria afectiva robusta en escalas de tiempo cortas. Sin embargo, cuando consideramos las actualizaciones de estado separadas por unos pocos minutos, la correlación entre la valencia expresada y la excitación es indistinguible de cero. Estos resultados son los mismos utilizando un método de análisis de texto alternativo, como se muestra en la Fig. 1 de los materiales complementarios.

Figura 3

Autocorrelación de valencia y excitación en actualizaciones de estado. Coeficientes de correlación de actualizaciones de estado posteriores por el mismo usuario (corrigiendo las líneas de base individuales) después de que Δt segundos pasaron entre ellas. Las áreas sombreadas tienen intervalos de confianza de arranque del 95%. Existe una fuerte correlación entre dos actualizaciones de estado posteriores en una escala de tiempo muy rápida. Si el tiempo entre las actualizaciones de estado aumenta, ambos coeficientes de correlación disminuyen y rápidamente se vuelven no significativos


Afecta los ajustes del modelo dinámico

Cuando se parte de un valor dado de valencia y excitación, el valor esperado de las emociones expresadas en las próximas actualizaciones de estado se muestra en la Fig. 4 en función del tiempo entre actualizaciones de estado. El proceso es reversible a la media: cuando se parte de un valor negativo (tenga en cuenta que hemos restado las líneas de base individuales), el valor esperado se aproxima a cero desde abajo. Cuando se parte de un valor positivo, este enfoque ocurre desde arriba. El valor esperado se vuelve indistinguible de cero en escalas de tiempo más largas, como se muestra en la Figura 3 de los materiales complementarios.

Figura 4

La valencia y la excitación se relajan hacia una línea de base afectiva. Valores medios de valencia y excitación (después de corregir las líneas de base individuales) en las actualizaciones de estado después de una anterior generada Δt segundos antes. Las líneas se agregan por las emociones expresadas en el primer mensaje para ilustrar las tendencias de relajación. Las medias se calculan sobre una ventana móvil de tamaño 15 (segundos) sobre todas las actualizaciones de estado de todos los usuarios y se trazan hasta un Δt máximo de 300 segundos. La relajación ocurre homogéneamente por encima y por debajo de la línea de base tanto para la valencia como para la excitación.
Imagen a tamaño completo

Validamos las observaciones anteriores ajustando el modelo estadístico introducido en la sección. 3.3. Los coeficientes estimados de los ajustes de valencia y excitación se muestran en la Tabla 1. El coeficiente de relajación para la excitación (, ) es más fuerte que para la valencia (, ). Esta observación es consistente con resultados previos de experimentos [12] y autoinformes in vivo [10]. Los usuarios que escriben actualizaciones de estado con alto contenido de excitación tienen menos probabilidades de tener una gran excitación comparable en la próxima actualización de estado si pasan más de unos minutos entre ellos. Tenga en cuenta que estas medidas reescaladas deben interpretarse como desviaciones de la línea de base afectiva de cada usuario. El efecto de retroalimentación de la expresión es capturado por las estimaciones de y , tomando valores de 0.38 y 0.45 respectivamente. Esto indica que una gran fracción del estado emocional inicial está regulada por la expresión, con aproximadamente el 40% de valencia y excitación restantes. Nuestras hipótesis iniciales de γ y k entre cero y uno, tanto para la valencia como para la excitación, están respaldadas por estos resultados, lo que indica la presencia de una relajación emocional estable hacia las líneas de base individuales y un efecto regulador de la expresión afectiva.


Tabla 1. Estimaciones de parámetros del modelo de regresión para valencia y excitación. Se proporcionan valores P e intervalos de confianza del 95% para las estimaciones de parámetros




Se puede observar una ilustración de la relajación rápida hacia la línea de base que captura el modelo en la Fig. 5. Los valores iniciales de alta valencia o excitación se regulan instantáneamente por un factor proporcional y luego se acercan exponencialmente a cero desde arriba. Lo inverso también es observable para los valores de excitación y valencia por debajo de cero, que primero regulan hacia cero y luego se acercan exponencialmente desde abajo (también observable en la Fig. 4).

Figura 5


Perfiles dinámicos de emoción en los modelos equipados. Próximo valor estimado de valencia y excitación después de Δt segundos en ambos modelos ajustados. La excitación se relaja más rápido que la valencia.

Las estimaciones consistentes con heteroscedasticidad y autocorrelación para los modelos arrojan estimaciones de coeficientes muy cercanas a las reportadas en la Tabla 1 y siguen siendo significativas. Estos resultados son muy similares cuando se usa el método de análisis de sentimiento alternativo, como se informa en la Tabla complementaria 1. Esto indica que nuestros resultados principales no son un artefacto de algunos errores o sesgos particulares de la herramienta de análisis de texto.

Ambos modelos superan a otros enfoques para modelar dinámicas emocionales. La suma residual de los cuadrados de nuestros ataques de valencia y excitación son más bajos que los de los modelos sin relajación (γ = 0), sin efecto de expresión (k = 0) y que modelos de una relajación lineal en el tiempo y de un polinomio cúbico de tiempo. En ambos ajustes, los residuos de regresión son aproximadamente normales (el estadístico de Shapiro-Wilk de los residuos para los modelos de valencia y excitación están por encima de 0.95), sin correlación con los valores ajustados (valencia ρ = −0.0017, excitación ρ = −0.0014) y con variables independientes (ρ como máximo 0.016 para valencia y como máximo 0.013 para excitación). Los residuos no muestran correlación entre las actualizaciones de estado posteriores de los mismos individuos (ρ = 0.015 para valencia y ρ = 0.013

para la excitación). Esto evidencia la validez de la formulación de dinámicas emocionales como una combinación de un efecto de expresión y una relajación proporcional hacia una línea de base individual, como se presenta en la Sección 2.

Los patrones de memoria de nuestro modelo, si bien son consistentes con investigaciones anteriores, también podrían explicarse por procesos de sincronización colectiva y cultural que influyen en la expresión emocional. Por ejemplo, los saludos estacionales como "feliz año nuevo" o "feliz Navidad" podrían introducir artefactos en nuestra medición como manifestaciones del estado de ánimo colectivo [34]. Tenemos en cuenta estos efectos en nuestros análisis, repetimos los ajustes del modelo que incluyen líneas de base semanales interindividuales adicionales para valencia y excitación. Los resultados son muy similares con estas correcciones estacionales, como se presenta más detalladamente en la sección "corrección estacional" en los Materiales suplementarios.

Conclusiones

Nuestro análisis de la dinámica temporal de la expresión afectiva en Facebook valida nuestro modelo de dinámica afectiva. Confirmamos la existencia de líneas de base afectivas individuales, que se concentran alrededor de una valencia ligeramente positiva y un punto de activación moderado. Además, utilizando un modelo de regresión no lineal, validamos la suposición de que la valencia y la excitación se relajan exponencialmente hacia la línea de base individual. Esto puede verse como un recuerdo a corto plazo de la expresión emocional: la valencia y la excitación de dos actualizaciones de estado consecutivas del mismo individuo están altamente correlacionadas hasta unos pocos minutos, pero no se correlacionan durante períodos de tiempo más largos. Encontramos que existe un considerable efecto de regulación tanto para la valencia como para la excitación, lo que significa que las expresiones afectivas reducen instantáneamente la magnitud de los estados afectivos en un factor proporcional.

Nuestros resultados son consistentes con análisis observacionales previos del etiquetado de emociones en Twitter [16]. En comparación con nuestro trabajo, el análisis de [16] se centró en la relajación de las emociones después de un informe de etiquetado explícito, un fenómeno que opera a una escala de tiempo más larga que nuestro análisis de relajación espontánea de valencia y excitación. Esto ilustra que varios aspectos y escalas temporales de la vida afectiva pueden analizarse a través de los datos de las redes sociales, capturando tanto las tendencias de relajación del afecto central como del estado de ánimo y otros fenómenos más persistentes.

Si bien nuestro análisis ha revelado propiedades fundamentales de la dinámica de las emociones, es importante resaltar sus limitaciones. Nuestro modelo no es una herramienta predictiva que pueda proporcionar estimaciones precisas de los sentimientos en el futuro, especialmente cuando se consideran escalas de tiempo largas. Sin embargo, el conjunto de datos a gran escala que analizamos nos permitió hacer inferencias robustas que apuntan a la dinámica de las emociones en general. Los estudios futuros pueden incluir datos externos adicionales (por ejemplo, interacción social, hora del día, atributos demográficos) para generar herramientas predictivas más allá de nuestro trabajo. Además, la actividad de las redes sociales tiene una naturaleza performativa y los datos se generan con sesgos de autoselección que pueden afectar los resultados del análisis de texto. No obstante, nuestros análisis nos permiten superar algunas limitaciones de los métodos tradicionales, rastreando las emociones durante largos períodos de tiempo en una gran muestra de usuarios más diversos que la muestra típica de un estudio de psicología. Además, nuestros resultados concuerdan con los resultados anteriores y son consistentes en los dos métodos de análisis de sentimientos que aplicamos. Todos los métodos en psicología tienen limitaciones, solo comparando sus resultados en varios escenarios podemos converger a una comprensión unificada del comportamiento humano.

La evidencia reunida por nuestro análisis contribuye a una línea de investigación emergente de modelado computacional de las emociones [9, 11]. Los modelos computacionales, en particular los modelos basados ​​en agentes, formalizan la dinámica de las propiedades individuales y la interacción y comunicación entre los individuos para explicar el comportamiento colectivo y complejo. Para que estos modelos vayan más allá de los argumentos teóricos, es necesario probar empíricamente sus supuestos y calibrar sus valores de parámetros con datos empíricos. Nuestro trabajo ha validado una serie de supuestos de estos modelos [12] y hemos calculado valores precisos para los parámetros de la dinámica emocional individual como se manifiesta a través de las redes sociales.

Tales modelos cuantitativos de dinámica afectiva también pueden contribuir a la comprensión y el tratamiento de los trastornos afectivos. Si bien las dinámicas psicológicas complejas medidas con cuestionarios aportan información limitada para evaluar el bienestar [56], un escenario más rico en datos (como la investigación en redes sociales) podría proporcionar suficiente precisión para revelar el papel de las dinámicas afectivas complejas. Además de la psicopatología, los modelos dinámicos de emoción empíricamente calibrados también se pueden aplicar para simular reacciones emocionales en tecnologías informáticas afectivas [57]. Por ejemplo, las expresiones faciales de humanos virtuales se pueden simular con nuestro modelo [58], y los sistemas de diálogo pueden proporcionar dinámicas emocionales plausibles con los parámetros apropiados [59].

Además, nuestros hallazgos tienen algunas implicaciones para la metodología de la psicología afectiva. En particular, nuestro modelo puede ayudar a los investigadores a (i) estimar el impacto afectivo real de un estímulo dado, en función de su relajación dinámica, (ii) determinar la duración necesaria de los intervalos de medición y los descansos entre estímulos, para evitar la transferencia efectos de las emociones, y (iii) cuidado y control para el efecto de retroalimentación de regulación de la expresión afectiva, que también puede ocurrir después de las autoevaluaciones.

Los parámetros de nuestros modelos son muy similares a los encontrados en los experimentos de interacción en línea [12]. A pesar de utilizar un diseño muy diferente (observación versus experimento), metodología (análisis de texto versus autoevaluación) y composición de la muestra (muestra de estudiantes versus usuarios de Facebook), obtenemos estimaciones muy similares para las líneas de base afectivas y los parámetros de relajación. Esto constituye una fuerte validación de nuestro modelo de dinámica afectiva, mucho más que una simple replicación de estudios previos. Más allá de eso, nuestros métodos tienen ventajas adicionales en comparación con los métodos tradicionales: incluyen muestras de participantes más grandes y representativas, el comportamiento se puede medir por períodos de tiempo más largos y el costo de la recopilación y reutilización de datos es sustancialmente menor. Esto muestra cómo se puede avanzar en la investigación psicológica a través de la ciencia de datos, especialmente a través del análisis de conjuntos de datos a gran escala de rastros de comportamiento en línea.


Referencias

lunes, 3 de febrero de 2020

Redes de co-citas y política en el libro 1984 de Orwell

Rastreando las redes de 1984




Varios amigos y colegas me preguntaron si publicaría mi charla de MLA 2016 en redes en 1984 de George Orwell, y estoy feliz de hacerlo. Es una especie de post-script orientado a las humanidades digitales para mi primer libro recientemente completado, y es un intento de describir cómo la teoría de la red de actores, en lugar de un paradigma crítico de Foucault, terminó informando el método para ese proyecto de libro. El panel, "Redes literarias y científicas", organizado por John Savarese, también ofreció una buena oportunidad para intentar adaptar las redes de citas generadas computacionalmente que he adaptado muy ligeramente de Neal Caren y Kieran Healy a través de Jonathan Goodwin. (Los detalles técnicos sobre esa adaptación siguen al final. Este es también, para el registro, un documento que trunqué sustancialmente en la entrega).

Biopolítica y redes de actores

En mi próximo libro, “Human Programming: Brainwashing, Automatons, and American Unfreedom,” ("Programación humana: lavado de cerebro, autómatas y falta de libertad estadounidense"), estaba mirando la red literaria, científica y política de discursos asociados con el control mental y la falta de libertad. ¿Cómo el cambio científico, comencé preguntando, afecta cómo pensamos acerca de lo que son la libertad y la falta de libertad en el siglo XX? ¿Qué papeles han jugado la literatura y la ciencia en la producción de las imágenes de "falta de libertad" que hemos asociado con el totalitarismo, el fundamentalismo y otros enemigos de la democracia? Rápidamente descubrí que la imagen de lo que Erich Fromm llamaba el "autómata humano", el sujeto totalitario como humano reducido a una máquina, flotaba entre discursos literarios y científicos de una manera que me pareció sorprendentemente omnidireccional.

Parece que vale la pena enfatizar esa omnidireccionalidad, como muchos de 20th-C. La investigación en literatura y ciencia con la que estoy familiarizado enfatiza cómo el texto literario procesa internamente paradigmas y enfoques científicos. A menudo, el texto y el autor juntos hacen una crítica de una práctica o mentalidad científica (esta o aquella comprensión del entorno, de la mente, del cuerpo discapacitado, del gen, etc.) o el texto se involucra en una ciencia ficción. extrapolación de esta o aquella trayectoria de ciencia ficción, que el crítico rellena, para ampliar su dimensión crítica.

Al leer los debates recientes sobre métodos de lectura y crítica (incluidos Los límites de la crítica de Rita Felski y varios trabajos de Bruno Latour) me he estado preguntando hasta qué punto la crítica en una vena foucaultiana ha sido una presencia dominante en el subcampo de literatura y ciencia en el siglo veinte. Particularmente cuando enfatizamos la ciencia como disciplina, en el sentido de gobernar, normalizar, o del conocimiento científico como biopoder, nos ponemos en peligro de reproducir una división de dos culturas, en la que encontramos a la ciencia como algo deshumanizante e instrumental, y crítico o el propio texto literario como resistiendo esa fuerza a través de gestos de desenmascaramiento. (Tal división entre lo humano y lo inhumano, figurada en la postura del crítico fuera de un régimen biopolítico que de otro modo sería total, a menudo es prestada de segunda o tercera mano, encontré en mi investigación, desde la retórica de la era de la Guerra Fría sobre la democracia humana y el totalitarismo autómata .)

Si bien no creo que la crítica se haya "agotado", y aunque creo que todavía hay ejemplos útiles y necesarios de tal crítica en este subcampo y en otros, también me he encontrado en busca de alternativas y nuevas modos de hablar sobre el impacto político y científico de los textos literarios, aparte de su poder para criticar diversas formas de biopoder científicamente habilitado. El último enfoque parecía particularmente inadecuado para mi propio objeto de estudio, que trataré de describir a través del ejemplo de 1984.

La teoría de la red de actores de Bruno Latour, para mí como para muchos otros, ha sido útil para señalar nuevas direcciones. Un buen estudio sociológico, escribe, es uno que "traza una red", y ha sido interesante pensar en lo que eso podría significar para los estudios literarios y para estudiar literatura y ciencia en el siglo XX. Felski sugiere de manera interesante, basándose en el trabajo de Latour sobre actores no humanos, que entendemos las obras literarias como tales "actantes": mediadores dentro de nuestras redes de intercambio de ideas, imágenes y estilos de pensamiento.

Al tratar de sentir este enfoque, aprendemos algo sobre las redes y sobre la agencia de los textos literarios, es decir, si y cómo pasar de un paradigma foucaultiano, o mejor, polo o fin de un espectro de prácticas, a un El polo de Latourian (una teoría biopolítica de una teoría de la red de actores de las culturas de la ciencia) realmente marca la diferencia en lo que hacemos y cómo. (Y de nuevo, creo que hay trabajos fabulosos que ya hacen esto: Contagious: Cultures, Carriers, and the Outbreak Narrative de Priscilla Wald (Duke, 2008) es un excelente ejemplo de un trabajo de rastreo de redes que ha servido como modelo metodológico para yo.) Esa es la gran pregunta que motiva esta charla; mi respuesta provisional es que cambia sutilmente cómo hablamos sobre el impacto político de los textos literarios.

Redes de 1984

El 1984 de Orwell tiene dos fuentes científicas bien conocidas: una en el experimento "Little Albert" de B.F. Skinner que Orwell adapta y adorna fuertemente en la escena climática de tortura de la novela que involucra ratas. El segundo es, como lo han señalado los biógrafos de Orwell, lingüístico, en el entusiasmo de Orwell por un lenguaje similar al esperanto y en su adopción, a través del concepto de "NewSpeak", de la hipótesis de Sapir-Whorf en donde el lenguaje da forma y limita la visión o ideología del hablante. . Con respecto a ambos, Orwell escribe con un espíritu opositor contra la tecnocracia de mediados del siglo XX, de una manera que creo que ha sido influyente. Pero mucho más interesante para mí es la red de literatura y ciencia que llega a la estela de la novela. Sabía algo de la "huella" de las ideas e imágenes de 1984 antes de entrar en mi proyecto más amplio, pero seguía apareciendo y su adaptabilidad parecía no tener fin. Es el plano completo para textos que incluyen THX 1138 de George Lucas, Diamond Dogs de David Bowie y el anuncio más famoso y más absurdo de Apple, del Superbowl de 1984.


Anuncio de "1984" de Apple para Macintosh

Más sustancialmente, la novela de Orwell también participó en la cultura política de Estados Unidos. Merece la mención de George Kennan, el arquitecto principal de la Guerra Fría, quien dijo en 1953: "Cuando trato de imaginarme el totalitarismo como un fenómeno general, lo que me viene a la mente de manera más destacada no es ni la imagen soviética ni la imagen nazi como Los he conocido en carne y hueso, sino más bien las imágenes ficticias y simbólicas creadas por personas como Orwell o Kafka o Koestler o los primeros satíricos soviéticos ". 1984 fue una inspiración para Edward Hunter, el hombre de la CIA que acuñó el término" lavado de cerebro " para describir la reforma del pensamiento chino y la psicología de los prisioneros de guerra de Corea. ("Lavado de cerebro" también, como lo trazo en mi libro, ha flotado entre discursos científicos y narraciones populares y legales desde entonces). Y el lenguaje introducido en 1984, en palabras como "Gran Hermano" y "Crimen de pensamiento", ha sido infinitamente adaptado en retórica a la izquierda y derecha políticas con sorprendente consistencia. Los académicos de extrema derecha David Horowitz y David Spencer fueron coautores de un libro titulado Islamophobia: Thought Crime of a Totalitarian Future (David Horowitz Freedom Center, 2011) que imagina, como hacen muchos expertos de derecha, que la corrección política es en sí misma un totalitario. o imposición tecnocrática de limitaciones en el lenguaje y el pensamiento.


Retórica de la novela de Orwell adaptada por la extrema derecha estadounidense.

Cuando se piensa en este tipo de huella para una obra, es un momento en el que la lectura atenta para encontrar (lo que presumo que es) su "significado real" y su "política real" dentro de sus profundidades, para mostrar el trabajo autónomo y completo de El arte tiene su propia voz crítica: parece ser precisamente la estrategia equivocada. 1984 está más vivo como una colección de imágenes poderosas y estrategias retóricas que deambulan libremente por el mundo, a través de una red de archivos adjuntos a menudo flojos para los lectores. (Así es como la noción del texto como "actante" tiene sentido para mí).

Para mi sorpresa, mientras continuaba con esta investigación descubrí que 1984 también es un texto que se abrió paso en el discurso científico y académico, y ofreció estrategias científicas para comunicar ideas y hacer que sus consecuencias políticas sean vívidas. En mi investigación sobre las ideas de libertad y no libertad, Orwell y 1984 siguieron apareciendo, a veces como shorthands o por puntos de analogía, pero aún así, de manera bastante consistente, e incluso entonces, el trabajo en sí parecía sorprendentemente presente en los trabajos sobre totalitarismo y control del pensamiento. que estaba leyendo, no solo en sociología y ciencias políticas, sino también en psiquiatría y psicología: La reforma del pensamiento de Robert Jay Lifton y Thought Reform and the Psychology of Totalism, la violación de la mente de Joost Meerloo, el testimonio de expertos en cultos y las discusiones populares sobre fundamentalismo, también, tenía referencias a Orwell y 1984.

Si bien mi libro no pasa mucho tiempo con Orwell, comencé a preguntarme cómo se podría estudiar esta huella o red de Orwell en las ciencias de manera más sistemática, que es lo que pensaré para el resto del artículo de hoy.

Como anécdota, 1984 no parece ser un texto que se lea o enseñe terriblemente a nivel universitario, a pesar de haber sido un libro muy popular. Permanece (de nuevo anecdóticamente) en los planes de estudio de inglés de la escuela secundaria en los EE. UU., Y fue un libro del Club del Libro del Mes en su lanzamiento. Tengo la sensación de que el libro es casi demasiado sencillo, o demasiado simple en su mensaje antitotalitario, como para justificar una gran explicación por parte de los críticos literarios, una serie de ensayos y volúmenes interesantes y un Cambridge Companion a pesar de ello. (Los casos en los que un libro claramente influyente no se estudia mucho, creo que puede ser esclarecedor, sobre qué tipos de diferenciación o distinción circunscriben en silencio nuestras elecciones de lo que funciona estudiar y lo que vale la pena estudiar sobre ellos).

A pesar de tener este sentido, nada podría haberme preparado para ver una lista de los artículos más citados con "Orwell" en su título o resumen, de la base de datos de citas estándar de la industria de Web of Science. Aunque no es del todo exhaustivo en sus listas de revistas de humanidades, todavía fue una sorpresa que los 5 artículos más citados sobre Orwell no fueran de estudios literarios en absoluto: eran de The British Journal of Sociology (321 citas), Stanford Law Review (71), Language (32), American Scientist (12) y Computers and the Humanities (11). El Cambridge Companion to George Orwell fue el número 6, y Web of Science encontró 9 citas de él. Le siguieron otros artículos de estudios literarios, estudios de gestión, geografía, psicoanálisis, ciencias políticas y políticas públicas entre los 20 primeros.

Luego decidí buscar solo artículos en Web of Science que citan 1984, y luego los ordené por la frecuencia con la que fueron citados. Mi resultado principal allí, al que volveré, fue de The Journal of Management Studies, erróneamente faltante en la tabla anterior, pero citado 388 veces (incluyendo ser citado por uno de los mejores resultados en la otra tabla). Es de Hugh Willmott, titulado "La fuerza es la ignorancia, la esclavitud es la libertad: gestionar la cultura en las organizaciones modernas". Volveremos a ello.

Quería obtener una imagen más sistemática y completa, basada en los datos encontrados en Web of Science, de cómo era la huella de Orwell. Terminé decidiendo adaptar una estrategia digital indirecta para hacerlo. Las redes de citas son un método que he tomado prestado aquí de Dan Wang, Neal Caren, Kieran Healy y Jonathan Goodwin. (También me han inspirado las estrategias relacionadas en el trabajo de Andrew Goldstone, Ted Underwood, Hoyt Long, Richard So y Ed Finn). Han estado utilizando estas visualizaciones para dar instantáneas empíricas de diferentes revistas y campos, según lo que pensadores u obras se citan juntas con mayor frecuencia y en qué grupos. Así es como se ve, y puede hacer clic para ver la versión dinámica y arrastrable:


Una red de cocitación para obras que citan 1984

Decidí adaptar su modelo de alguna manera para mirar todos los textos que citan 1984. Debido a que está usando la cita de otros de una amplia variedad de otras obras, concebiblemente de cualquier período de tiempo, esta imagen enfáticamente no muestra un estudio de influencia. En cambio, lo que obtenemos es una especie de cuadro lúdico de lo que estoy llamando (porque lo hago a mediados de siglo en EE. UU.) "Compañeros de viaje" de Orwell: vemos aquí regiones con otros pensadores cuyo trabajo se utiliza junto con el de Orwell en diferentes campos y en diferentes temas Puede permitirnos explorar los diferentes tipos de usos académicos de 1984, desde la lingüística hasta la filosofía, la ciencia política y la sociología, la psicología y otros pequeños grupos, como la antropología, que amenazan con flotar fuera de la pantalla aquí. Esto resultó ser menos directamente informativo de lo que esperaba, porque los trabajos más citados y más centrales aquí tienden a ser de gran importancia interdisciplinaria. Entonces vemos menos separación por disciplina de lo que esperaba. No obstante, sigue siendo una herramienta o enfoque potencialmente útil para otras ficciones literarias, para observar las diferentes cohortes de pensadores con los que los académicos los ponen en conversación. (Esto podría complementar el interesante trabajo de Ed Finn en una línea similar sobre las formas en que los autores se citan juntos en las reseñas de libros). Los estudios de otros autores con esto podrían variar desde lo potencialmente fascinante (¿Toni Morrison?) Hasta lo más ciertamente deprimente (Ayn Rand).

Si bien la red de co-citas puede servir en el futuro (y para otros textos) como una especie de dispositivo de descubrimiento, en realidad fue solo el artículo más citado lo que más me fascinó, "La fuerza es la ignorancia, la esclavitud es la libertad: gestión de la cultura" de Willmott en organizaciones modernas. El artículo describe críticamente lo que llama "culturismo corporativo": el poder blando de promover la "cultura", desde la jerga del logro hasta el valor del retiro corporativo, en RRHH y teoría de la gestión. El artículo cita a Foucault, Marx, Weber, David Harvey, el filósofo Alisdair Macintyre y muchos otros, además de figuras de su propia disciplina de la escuela de negocios. Pero lo más interesante para mí obviamente es el papel central de 1984: las citas frecuentes de Orwell ofrecen una forma de estructurar el argumento durante toda la primera mitad del artículo. Sostengo que la función principal de Orwell es como una especie de puente retórico: Orwell se despliega hacia lo que imagino que es un lector de revisión por pares en una disciplina que bien podría haber sido resistente a Marx o Foucault. La acusación de Willmott de que sus pares de la teoría de la gestión están utilizando doble discurso, en mi hipótesis, alentaría a los lectores que podrían ser resistentes a las estrategias de lectura sintomáticas a participar en ellos. La táctica de acusar a estos culturistas corporativos de ser como el Partido es asombrosamente exitosa, especialmente dada la frecuencia con que se ha citado el artículo. ¿Y hay algo en lo que los estadounidenses puedan estar de acuerdo más que nuestro deseo de no ser el Partido de Orwell y el deseo de no gustar a quien se les parezca? El consenso que he visto en mi investigación ha sido sorprendente.

Y así, aunque termina siendo sutil, para mí el impacto político de 1984 reside en la forma en que ha moldeado, y continúa formando debates populares y, a veces, científicos sobre el poder. (Y, como observó Katie Fitzpatrick en una conversación después del panel, la literatura es la fuente de una cantidad sorprendente de nuestro vocabulario para hablar sobre estructuras sociales, desde el dickensiano hasta el kafkaesco y el orwelliano).

Detalles digitales:

Primero encontré grafos de cocitas como una herramienta de descubrimiento en esta publicación de Jonathan Goodwin en su blog personal. Vincula a varios ejemplos de su uso y las diferentes adaptaciones que Goodwin hizo, y al código original de Caren para generar el diagrama de diseño de fuerza d3.js. Puede encontrar un ejemplo completamente elaborado del trabajo de Goodwin en una sola revista en el sitio de Signs @ 40 para la revista Signs.

Caren, Healy y Goodwin hicieron una búsqueda en la Web of Science a través de revistas completas; en cambio, mis búsquedas fueron "Orwell" en las entradas bibliográficas de los artículos. Aunque inicialmente pensé que podría modificar sustancialmente el código, solo hice un cambio en el código de Caren, que consistía en extraer solo los nombres de las entradas seleccionadas, en lugar del nombre y el año, y luego bajar los umbrales para que las entradas solo tuvieran que ser citados juntos dos veces para aparecer juntos. (Esto fue necesario porque tenía un conjunto de datos más difuso con menos citas compartidas). Terminé simplemente usando sed (la línea de comando "buscar y reemplazar") para eliminar todas las entradas creadas por Orwell (cuya presencia haría que el grafo sea adecuado) , si no es informativo, tipo panóptico) directamente dentro del archivo de texto, que luego lee el script de Python. Web of Science extrae una gran cantidad de datos, por lo que sería posible colorear entradas por disciplina compartida en lugar de por algoritmo de detección de la comunidad, para dimensionar los nodos de acuerdo con varios criterios. Una vez más, pretendía que este grafo de cocitación fuera más una prueba de concepto lúdica que mostrar algo concluyente, y estaría emocionado de ver a otros llevar este tipo de trabajo en nuevas direcciones.

domingo, 2 de febrero de 2020

Sobre las redes sociales de Sócrates

Seis grados de Sócrates: las redes sociales de los antiguos griegos

AIA Central Arizona Society




Título: Seis grados de Sócrates: las redes sociales de los antiguos griegos
Ponente: Diane Harris Cline, Universidad George Washington
Cuándo y dónde: jueves 27 de febrero de 2020, 6pm, campus de ASU Tempe, edificio ART, sala 246



En esta conferencia ricamente ilustrada, utilizamos el Análisis de redes sociales (ARS) para examinar las redes sociales del siglo V a. C. en Atenas, incluidos Pericles, Sócrates, los alfareros y pintores de Atenas, los trabajadores que construyeron el Partenón y más. El ARS es una herramienta analítica relativamente nueva que se puede aplicar cuando uno quiere ver las relaciones en una red, desde lugares hasta cosas y personas, y que utiliza datos de arqueología, epigrafía o textos antiguos. Los resultados se pueden mostrar dramáticamente en imágenes que arrojan nueva luz sobre nuestra comprensión: aprendemos, por ejemplo, que los antiguos griegos tenían redes sociales estrechas que ayudaron a difundir rápidamente nuevas ideas y que contribuyeron a la creatividad e innovación para las que ahora están justificadamente famoso.



Diane Harris Cline es profesora asociada de historia y clásicos de la Universidad George Washington, donde recibió varios premios de enseñanza. Tiene sus títulos de la Universidad de Princeton (Ph.D.) y la Universidad de Stanford, y ha sido dos veces becaria Fulbright. Sus áreas de especialización son la historia de la antigua Grecia, las redes sociales y la epigrafía: “Estudio la innovación y la creatividad en la Atenas clásica a través de las redes sociales. Mi investigación implica la aplicación de la metodología de Análisis de redes sociales a la historia social de la antigua Grecia ". En 2016, el Dr. Cline publicó The Greeks: An Illustrated History de National Geographic, y los artículos recientes incluyen" La red social de Sócrates "(Boletín de investigación de CHS 7, 2019).


Para un versión imprimible del flyer, Haga clic aquí

lunes, 27 de enero de 2020

20 años de redes de coautorías y bibliográficas sobre ciencia de redes

Veinte años de ciencia de redes: un análisis de red bibliográfico y de coautoría

Roland Molontay, Marcell Nagy
arXiv.org > physics > arXiv:2001.09006
PDF



Hace dos décadas, tres artículos pioneros dirigieron la atención a redes complejas e iniciaron una nueva era de investigación, estableciendo un campo interdisciplinario llamado ciencia de redes. Es decir, estos documentos fundamentales altamente citados fueron escritos por Watts & Strogatz, Barabási & Albert y Girvan & Newman en redes de mundo pequeño, en redes sin escala y en la estructura comunitaria de redes complejas, respectivamente. En los últimos 20 años, debido a la naturaleza multidisciplinaria del campo, ha surgido una comunidad científica de redes diversa pero no dividida. En este artículo, investigamos cómo esta comunidad ha evolucionado con el tiempo con respecto a la velocidad, la diversidad y la naturaleza interdisciplinaria como se ve a través de la creciente red de coautoría de científicos de la red (aquí la noción se refiere a un académico con al menos un artículo que cita al menos uno de los tres documentos de hitos mencionados anteriormente). Después de proporcionar un análisis bibliográfico de 31,763 documentos científicos de redes, construimos la red de coautoría de 56,646 científicos de redes y analizamos su topología y dinámica. Explicamos los patrones de colaboración de los últimos 20 años de ciencia de redes al investigar numerosas propiedades estructurales de la red de coautoría y al usar técnicas mejoradas de visualización de datos. También identificamos los autores más centrales, las comunidades más grandes, investigamos los cambios espacio-temporales y comparamos las propiedades de la red con los indicadores cienciométricos.


lunes, 13 de enero de 2020

11 consejos de cómo lidiar con grandes conjuntos de datos

Once consejos para trabajar con grandes conjuntos de datos

Los grandes datos son difíciles de manejar. Estos consejos y trucos pueden allanar el camino.
Anna Nowogrodzki



Ilustración de The Project Twins
Versión PDF
Nature


Los grandes datos están en todas partes en la investigación, y los conjuntos de datos son cada vez más grandes y más difíciles de trabajar. Desafortunadamente, dice Tracy Teal, es un tipo de trabajo que con demasiada frecuencia queda fuera de la capacitación científica.

"Es una mentalidad", dice Teal, "tratando los datos como un ciudadano de primera clase". Ella debe saber: Teal fue hasta el mes pasado el director ejecutivo de The Carpentries, una organización en Oakland, California, que enseña habilidades de codificación y datos a investigadores a nivel mundial. Ella dice que existe una tendencia en la comunidad de investigación a descartar el tiempo y el esfuerzo necesarios para administrar y compartir datos, y no considerarlos como una parte real de la ciencia. Pero, sugiere, "podemos cambiar nuestra mentalidad para valorar ese trabajo como parte del proceso de investigación", en lugar de tratarlo como una ocurrencia tardía.

Aquí hay 11 consejos para aprovechar al máximo sus grandes conjuntos de datos.

Aprecia tus datos


"Mantenga sus datos en bruto sin procesar: no los manipule sin tener una copia", dice Teal. Recomienda almacenar sus datos en algún lugar que cree copias de seguridad automáticas y que otros miembros del laboratorio puedan acceder, respetando las normas de su institución sobre consentimiento y privacidad de datos.

Debido a que no necesitará acceder a estos datos con frecuencia, dice Teal, "puede usar las opciones de almacenamiento donde puede costar más dinero acceder a los datos, pero los costos de almacenamiento son bajos", por ejemplo, el servicio Glacier de Amazon. Incluso podría almacenar los datos en bruto en discos duros duplicados guardados en diferentes ubicaciones. Los costos de almacenamiento para archivos de datos grandes pueden acumularse, por lo que debe presupuestar en consecuencia.

Visualiza la información

A medida que los conjuntos de datos se hacen más grandes, surgen nuevas arrugas, dice Titus Brown, un bioinformático de la Universidad de California, Davis. "En cada etapa, te encontrarás con un nuevo y emocionante comportamiento desordenado". Su consejo: "Haz muchos gráficos y busca valores atípicos". En abril pasado, uno de los estudiantes de Brown analizó los transcriptomes: el conjunto completo de Moléculas de ARN producidas por una célula u organismo: a partir de 678 microorganismos marinos como el plancton (LK Johnson et al. GigaScience 8, giy158; 2019). Cuando Brown y su alumno registraron los valores promedio de la duración de la transcripción, la cobertura y el contenido genético, notaron que algunos valores eran cero, lo que indica dónde había fallado el flujo de trabajo computacional y había que volver a ejecutarlo.

Muestra tu flujo de trabajo

Cuando el físico de partículas Peter Elmer ayuda a su hijo de 11 años con su tarea de matemáticas, tiene que recordarle que documente sus pasos. "Él solo quiere escribir la respuesta", dice Elmer, quien es director ejecutivo del Instituto de Investigación e Innovación en Software para Física de Alta Energía en la Universidad de Princeton en Nueva Jersey. Los investigadores que trabajan con grandes conjuntos de datos pueden beneficiarse del mismo consejo que Elmer le dio a su hijo: "Mostrar su trabajo es tan importante como llegar al final".

Esto significa registrar todo su flujo de trabajo de datos, qué versión de los datos que utilizó, los pasos de limpieza y control de calidad y cualquier código de procesamiento que ejecutó. Dicha información es invaluable para documentar y reproducir sus métodos. Eric Lyons, biólogo computacional de la Universidad de Arizona en Tucson, utiliza la herramienta de captura de video asciinema para registrar lo que escribe en la línea de comando, pero las soluciones de baja tecnología también pueden funcionar. Un grupo de sus colegas, recuerda, tomó fotos de la pantalla de su computadora y las publicó en el grupo del laboratorio en Slack, una plataforma de mensajería instantánea.

Usar control de versiones

Los sistemas de control de versiones permiten a los investigadores comprender con precisión cómo ha cambiado un archivo con el tiempo y quién realizó los cambios. Pero algunos sistemas limitan el tamaño de los archivos que puede usar. Harvard Dataverse (que está abierto a todos los investigadores) y Zenodo se pueden usar para el control de versiones de archivos grandes, dice Alyssa Goodman, astrofísica y especialista en visualización de datos en la Universidad de Harvard en Cambridge, Massachusetts. Otra opción es Dat, una red gratuita de igual a igual para compartir y versionar archivos de cualquier tamaño. El sistema mantiene un registro a prueba de manipulaciones que registra todas las operaciones que realiza en su archivo, dice Andrew Osheroff, desarrollador principal de software en Dat en Copenhague. Y los usuarios pueden ordenar al sistema que archive una copia de cada versión de un archivo, dice la gerente de producto de Dat, Karissa McKelvey, con sede en Oakland, California. Dat es actualmente una utilidad de línea de comandos, pero "hemos estado actualizando activamente", dice McKelvey; El equipo espera lanzar un front end más fácil de usar a finales de este año.

Grabar metadatos

"Sus datos no son útiles a menos que las personas, y" el futuro ", sepan cuáles son", dice Teal. Ese es el trabajo de los metadatos, que describen cómo se recopilaron, formatearon y organizaron las observaciones. Considere qué metadatos registrar antes de comenzar a recopilar, Lyons aconseja, y almacene esa información junto con los datos, ya sea en la herramienta de software utilizada para recopilar las observaciones o en un archivo README u otro archivo dedicado. El Proyecto Open Connectome, dirigido por Joshua Vogelstein, un neuroestadístico de la Universidad Johns Hopkins en Baltimore, Maryland, registra sus metadatos en un formato de texto plano estructurado llamado JSON. Cualquiera que sea su estrategia, trate de pensar a largo plazo, dice Lyons: algún día querrá integrar sus datos con los de otros laboratorios. Si eres proactivo con tus metadatos, esa integración será más fácil en el futuro.

Automatizar, automatizar, automatizar

Los grandes conjuntos de datos son demasiado grandes para peinarlos manualmente, por lo que la automatización es clave, dice Shoaib Mufti, director senior de datos y tecnología del Instituto Allen para la Ciencia del Cerebro en Seattle, Washington. El equipo de neuroinformática del instituto, por ejemplo, utiliza una plantilla para los datos de las células cerebrales y la genética que acepta información solo en el formato y tipo correctos, dice Mufti. Cuando llega el momento de integrar esos datos en una base de datos o colección más grande, los pasos de garantía de calidad de datos se automatizan usando Apache Spark y Apache Hbase, dos herramientas de código abierto, para validar y reparar datos en tiempo real. "Nuestro conjunto completo de herramientas de software para validar e ingerir datos se ejecuta en la nube, lo que nos permite escalar fácilmente", dice. El Proyecto Open Connectome también proporciona garantía de calidad automatizada, dice Vogelstein: esto genera visualizaciones de estadísticas resumidas que los usuarios pueden inspeccionar antes de continuar con sus análisis.

Haga que el tiempo de computación cuente

Grandes conjuntos de datos requieren informática de alto rendimiento (HPC), y muchos institutos de investigación ahora tienen sus propias instalaciones de HPC. La Fundación Nacional de Ciencias de EE. UU. mantiene la red nacional HPC XSEDE, que incluye la red de computación basada en la nube Jetstream y los centros HPC en todo el país. Los investigadores pueden solicitar asignaciones de recursos en xsede.org y crear cuentas de prueba en go.nature.com/36ufhgh. Otras opciones incluyen la red ACI-REF con sede en EE. UU., NCI Australia, la Asociación para la Computación Avanzada en Europa y las redes ELIXIR, así como proveedores comerciales como Amazon, Google y Microsoft.

Pero cuando se trata de computación, el tiempo es dinero. Para aprovechar al máximo su tiempo de computación en los clústeres GenomeDK y Computerome en Dinamarca, Guojie Zhang, investigador de genómica de la Universidad de Copenhague, dice que su grupo generalmente realiza pruebas a pequeña escala antes de migrar sus análisis a la red HPC. Zhang es miembro del Proyecto de Genomas de Vertebrados, que busca ensamblar los genomas de unas 70,000 especies de vertebrados. "Necesitamos millones o incluso miles de millones de horas informáticas", dice.

Captura tu entorno

Para replicar un análisis más tarde, no necesitará la misma versión de la herramienta que utilizó, dice Benjamin Haibe-Kains, farmacogenómico computacional en el Centro de Cáncer Princess Margaret en Toronto, Canadá. También necesitará el mismo sistema operativo y las mismas bibliotecas de software que requiere la herramienta. Por esta razón, recomienda trabajar en un entorno informático autónomo, un contenedor Docker, que se puede ensamblar en cualquier lugar. Haibe-Kains y su equipo utilizan la plataforma en línea Code Ocean (que se basa en Docker) para capturar y compartir sus entornos virtuales; Otras opciones incluyen Binder, Gigantum y Nextjournal. "Diez años a partir de ahora, aún podría ejecutar esa tubería exactamente de la misma manera si lo necesita", dice Haibe-Kains.

No descargue los datos.

Descargar y almacenar grandes conjuntos de datos no es práctico. Los investigadores deben ejecutar análisis de forma remota, cerca de donde se almacenan los datos, dice Brown. Muchos proyectos de big data usan Jupyter Notebook, que crea documentos que combinan código de software, texto y figuras. Los investigadores pueden "girar" dichos documentos en o cerca de los servidores de datos para realizar análisis remotos, explorar los datos y más, dice Brown. Brown dice que Jupyter Notebook no es particularmente accesible para los investigadores que podrían sentirse incómodos usando una línea de comando, pero hay plataformas más fáciles de usar que pueden cerrar la brecha, incluidas Terra y Seven Bridges Genomics.

Empezar temprano

La gestión de datos es crucial incluso para los investigadores jóvenes, así que comience su entrenamiento temprano. "Las personas sienten que nunca tienen tiempo para invertir", dice Elmer, pero "a la larga se ahorra tiempo". Comience con los conceptos básicos de la línea de comandos, más un lenguaje de programación como Python o R, lo que sea más importante para su campo, dice. Lyons está de acuerdo: "Paso uno: familiarizarse con los datos de la línea de comandos". En noviembre, algunos de sus colaboradores que no dominaban el uso de la línea de comandos tuvieron problemas con los datos genómicos porque los nombres de los cromosomas no coincidían en todos sus archivos, Dice Lyons. "Tener algunas habilidades básicas de línea de comandos y programación me permite corregir rápidamente los nombres de los cromosomas".

Consigue ayuda


La ayuda está disponible, en línea y fuera de ella. Comience con el foro en línea Stack Overflow. Consulte a los bibliotecarios de su institución sobre las habilidades que necesita y los recursos que tiene disponibles, aconseja Teal. Y no descarte la capacitación en el sitio, Lyons dice: "The Carpentries es un excelente lugar para comenzar".