viernes, 2 de septiembre de 2016

Redes de personajes literarios

El análisis de las redes sociales de la literatura del siglo 19 al 20
Derek Greene's Home


El proyecto de investigación Nation, Genre and Gender ("Nación, Género y Género") en la UCD está creando un corpus digital grande de novelas irlandeses e ingleses a partir del período 1800-1922. Nuestro objetivo es comparar el género, el género y la nacionalidad del autor o el ajuste en la conformación de las estructuras sociales en la ficción, sobre la base de las ideas de los investigadores como Franco Moretti que han abogado el enfoque de "lectura distante" para el estudio de la literatura desde una perspectiva a nivel macro. Como parte de esto, estamos viendo cómo las técnicas de Análisis de Redes Sociales (ARS), a menudo se aplican a las redes en línea como Twitter y Facebook, se puede aplicar para proporcionar una nueva perspectiva sobre los textos literarios. Una serie de trabajos recientes interesante ha mirado en el análisis de la ficción de esta manera, a partir de la mapeo de las tragedias de Shakespeare a visualizar el universo de los cómics de Marvel. En nuestro caso, estamos interesados ​​en la exploración de las estructuras sociales en la literatura del siglo 19 y 20. A continuación voy a describir cómo vamos desde el texto original de una novela como Oliver Twist de Charles Dickens a una visualización de la red social definitiva

Corpus de anotación

El primer paso del proceso de análisis consiste en la anotación de las novelas, en los estudiosos de la literatura del Instituto de Humanidades de UCD identifican las referencias de caracteres en el texto de cada novela, como recuperada en el Proyecto Gutenberg. El proceso de anotación en sí consiste en un número de pasos. En primer lugar, un diccionario carácter se construye, que incluye una única entrada para cada carácter único en la novela, con su nombre definitivo y una lista completa de todos sus alias. Por ejemplo, el personaje de Bill Sikes en Oliver Twist se conoce por varios alias, incluyendo "Mr. Sikes "," William Sikes ", y" el asesino ". También se van registrando personajes con atributos tales como el género, la clase, la ocupación y la religión. Esta tarea se lleva a cabo no sólo para los personajes principales, sino también para los personajes secundarios que componen la sociedad en general de la novela. Una vez que el diccionario se ha recopilado, todas las instancias de los alias de un personaje en la novela de texto se reemplazan con su nombre definitivo.

Construcción de la red

Una vez que una novela se ha anotado, creamos redes de caracteres detallados para conocer mejor la sociedad de la novela. Un nodo se crea para cada carácter en el diccionario de personaje de la novela. Luego tokenise cada capítulo en el texto anotado previamente de la novela, y el recuento de todos los co-ocurrencias de pares de nombres definitivos de caracteres. Tenga en cuenta que utilizar todas las co-ocurrencias en lugar de considerar sólo la conversación directa entre un par de caracteres, ya que esto nos permite capturar una amplia variedad de tipos de interacciones y asociaciones entre los personajes. entonces se crea una red de carácter ponderado para el capítulo, donde existe una arista entre un par de caracteres, si ellos co-produjeron al menos una vez durante el capítulo. El peso en el borde corresponde al número de co-ocurrencias entre el par. Un ejemplo de una pequeña red de caracteres para el Capítulo 6 de Oliver Twist se muestra a continuación. Un borde más grueso indica que eso es dos personajes co-produjeron con mayor frecuencia en ese capítulo.



Una vez que hayamos procesado cada capítulo, se construye una red de carácter general para toda la novela mediante la combinación de las redes de todos los capítulos. En esta red global, el peso en un borde corresponde al número total de co-ocurrencias entre el par a través de todos los capítulos.

Visualización de la red

Realmente visualizar las redes de caracteres resultante, usamos la herramienta de código abierto Gephi, aplicando una fuerza dirigida diseño. Un número de diferentes redes de ejemplo se muestran a continuación para cuatro conocidas novelas de Charles Dickens, Bram Stoker, de Arthur Conan Doyle, y James Joyce, respectivamente. En cada caso, mostramos los 20 mejores personajes más destacados, según la clasificación de su grado ponderada (es decir, la suma de los pesos de las aristas conectadas a ellos). El tamaño y el color de cada nodo también es proporcional al grado ponderado.



Análisis mas extenso

En representación de obras literarias en forma de red nos permite explorar los textos de autores como Joyce y Dickens de una manera que es independiente del lenguaje y nos dan una visualización "ojo de pájaro" que es accesible para los no expertos. También nos permite beneficiarnos de las investigaciones existentes, en áreas tales como la detección de la comunidad y el análisis de redes ego, lo que podría proporcionar nuevas herramientas en la práctica de la lectura distante. Mediante la adición de información de atributos, como el género y la clase, a los nodos y aristas, también podemos hacer comparaciones interesantes entre las novelas de diferentes autores y géneros. Nuestro objetivo es utilizar estas redes de caracteres para explorar y poner a prueba una serie de hipótesis literarias existentes, y también hacer estas novelas más accesible a los estudiantes e investigadores.

No hay comentarios:

Publicar un comentario