Mostrando entradas con la etiqueta Humanidades. Mostrar todas las entradas
Mostrando entradas con la etiqueta Humanidades. Mostrar todas las entradas

martes, 22 de mayo de 2018

Introducción: Visualización en Gephi


Usando Gephi para visualización de datos


Autor: Maristella Feustle | Digital Humanities


Muchos de nosotros hemos estado haciendo visualizaciones básicas de datos cuantitativos desde la escuela primaria, convirtiendo la información numérica en cuadros y gráficos. En algún lugar a lo largo de la línea, la mayoría de nosotros también hemos encontrado diagramas de Venn para visualizar relaciones conceptuales y atributos que se tienen en común entre las entidades. Pero cuando pensamos en la visualización, las visualizaciones cuantitativas como las producidas por Excel son más accesibles.

Por supuesto, no todos los datos son cuantitativos. No todos los puntos de datos son números, y no todas las relaciones entre ellos son numéricas, y sin embargo, intuimos que el contexto puede ser tan complejo como importante. Ahí es donde entra Gephi. Si puedes articular una relación, puedes mapearla.

Gephi depende de la relación "triple" que también subyace a RDF, el modelo de metadatos del Marco de Descripción de Recursos, de claro interés para la biblioteca y la ciencia de la información. En el triple, Algo tiene una conexión con otra cosa. O bien, la Persona 1 está de alguna manera conectada a la Persona 2. El atributo 1 está conectado de alguna manera con el Atributo 2.

Los atributos son nodos, y la conexión, sea lo que sea, es un borde. Dos nodos más un borde son tres cosas, o un triple. Las conexiones pueden ser recíprocas, o solo una dirección.

Los ejemplos potenciales son virtualmente ilimitados: digamos, por ejemplo, que Jeremiah era una rana toro. Es decir, Jeremiah tiene el atributo de ser una rana toro. Jeremías y la rana toro (para acuñar un término) son nodos. Tener el atributo es una ventaja. Jeremiah también fue un buen amigo mío. Es decir, Jeremiah era miembro del grupo de buenos amigos míos.

Esas son solo algunas conexiones. ¿Qué pasa cuando tus conexiones tienen conexiones? Necesitamos una forma más sofisticada de hacer un seguimiento de ellos.

Esta demostración utiliza datos de listas de óperas y artistas intérpretes o ejecutantes en el apéndice de La Scala West de Ronald Davis: La Scala West: The Dallas Opera under Kelly and Rescigno, siguiendo aproximadamente los primeros diez años de producciones de la Ópera de Dallas.

Utilizando un valor separado por coma (archivo CSV), hemos articulado las personas y los roles que desempeñaron respectivamente como las dos columnas requeridas para que Gephi importe como una tabla de borde: Origen y Destino.

Aquí, vale la pena señalar que Gephi puede ser muy exigente con la forma en que se forman sus datos. Para evitar la creación de conexiones y nodos espurios, es importante asegurarse de que sus datos estén libres de espacios y caracteres adicionales que podrían, por ejemplo, hacer que Gephi decida que María [espacio] Callas y María [espacio espacial] Callas son dos personas diferentes Cuando tienes cientos o miles de nodos y conexiones, las distinciones innecesarias como esas realmente pueden arrojar tu visualización. Para la preparación de datos, OpenRefine es un compañero muy útil para Gephi.

Incluso con un conjunto de datos bien construido, la salida de visualización inicial de Gephi parece lanzar espaguetis y albóndigas en la pared, solo que más angulares:



La diferencia importante que debemos mencionar aquí es que Gephi hace los cálculos por usted, pero no toma decisiones por usted. Por lo tanto, depende de usted la elección de cómo aplicar los colores para diferenciar los tipos de nodos y aristas, o los grados de conectividad, y qué algoritmos representan mejor el significado que desea que su visualización muestre, qué etiquetar, etc. Estas características están fuertemente empaquetadas en la interfaz de usuario de Gephi, y experimentar con ellas es parte de la diversión del programa. Otras opciones residen en los complementos que vienen incluidos con el programa.

En este caso, el resultado final nos permitió mostrar en una sola imagen las complejidades de las conexiones entre los artistas intérpretes o ejecutantes en la Ópera de Dallas, así como los artistas principales, artistas frecuentes y producciones frecuentes en los primeros años de la Ópera de Dallas - en en resumen, un mapa de las relaciones entre los artistas intérpretes o ejecutantes, las obras y entre sí.




Para comenzar con Gephi, visite los enlaces a continuación:

https://gephi.org/tutorials/gephi-tutorial-quick_start.pdf (Refiere a una vieja versión, pero todavía útil)
http://www.martingrandjean.ch/gephi-introduction/
https://seinecle.github.io/gephi-tutorials/

jueves, 4 de enero de 2018

Preguntas y respuestas sobre Humanidades digitales, incluyendo ARS

Lo último de Humanidades digitales. Preguntas y respuestas

The Chronicle of Higher Education



Lanzada en septiembre de 2010, Digital Humanities Questions & Answers es una empresa conjunta de la Asociación para Computadoras y Humanidades (ACH) y Prof Hacker. (Véase el anuncio de lanzamiento de Julie Meloni).

Preguntas y respuestas sobre Humanidades digitales (@DHAnswers en Twitter) está diseñado para ser un recurso gratuito en el que cualquier persona interesada en las humanidades digitales pueda plantear una pregunta a la comunidad de personas que trabajan en el campo.

Desde la última vez que nos registramos en el sitio, se han lanzado muchos hilos interesantes y se han proporcionado varias "mejores respuestas". A continuación, proporcioné enlaces a algunos de los hilos con mejores respuestas:
  • Análisis de redes de texto usando Gephi: "Tengo muchos textos ... para analizar, y las herramientas de Gephi parecen ser las mejores para alcanzar el resultado que quiero. Entonces, ¿cómo puedo importar texto a Gephi? "
  • Open Corpora para la tarea de historia digital: "Estoy preparando tareas para la clase de historia digital del próximo semestre, y quiero construir una lectura distante simple para mis alumnos, probablemente usando Voyant Tools ... ¿Puede alguien señalarme una buena colección de corpus históricos que los estudiantes pueden experimentar? "
  • ¿Qué herramienta de reconocimiento de entidades nombradas? : "Tengo una base de datos con más de un millón de tweets (sobre WW1). Lo que me gustaría hacer ahora es reconocer fechas y rastros de tiempo. ¿Alguien tiene una idea de cómo hacer esto?"
  • ¿Qué novelas asignar para el seminario de crítica algorítmica / lectura a distancia ?: "Estoy diseñando el seminario de postgrado que enseñaré en el Departamento de Inglés este otoño (2015) sobre el tema de" Crítica algorítmica ", un título que tomé de el subtítulo del libro de Stephen Ramsay de 2011, Reading Machines. Es una introducción al análisis de texto computacional para estudiantes de literatura, desde la frecuencia de las palabras hasta el modelado de temas ".
  • ¿Cómo extraer los datos etiquetados y el texto del archivo TEI ?: "He estado usando CATMA (http://www.catma.de/) para marcar un texto con algunas etiquetas analíticas que he creado. Luego exporté el archivo en TEI, y ahora estoy tratando de extraer los datos que he marcado para medir las frecuencias de las etiquetas, pero me resulta bastante difícil ".

Además de las preguntas anteriores con "mejores respuestas", revise las discusiones que tienen lugar en respuesta a estas preguntas:
  • Buenos escáneres 3D para usar junto con una impresora 3D? : "Tengo la oportunidad de obtener un escáner 3D junto con una impresora 3D para un futuro laboratorio DH, y aunque aquí hay muchas publicaciones útiles sobre impresoras 3D, no parece haber mucho acerca de los escáneres 3D. Si alguien tiene alguna recomendación o sugerencia, me gustaría escucharla.
  • ¿Cómo aprendiste a codificar ?: "Soy un estudiante de doctorado en inglés, y estoy interesado en (pero es muy nuevo) DH. Comenzaré a trabajar con TEI pronto a través de un proyecto de archivo digital en el que estoy trabajando, así que ahí está. ¿Qué otras avenidas debo explorar en mi búsqueda para aprender a programar por el bien de la investigación DH? "
  • ¿Qué utilizan las personas para gestionar grandes colecciones de imágenes ?: "A menudo me encuentro con eruditos que luchan por administrar grandes colecciones de imágenes, no es raro encontrar personas que administren colecciones de imágenes históricas con iPhoto, y me preguntan si hay bases de datos que tengan sentido. para colecciones visuales ".
  • ¿Cuál es el mejor paquete de software para el análisis de redes sociales? : "Estoy desarrollando un conjunto de datos que traza las relaciones entre los rabinos en la antigüedad. Ahora estoy guardando estos datos en forma tabular (rabbi x / term of relationship / rabbi y). ¿Alguien podría recomendar un paquete de software, preferiblemente de código abierto y no demasiado difícil de usar, que pueda ayudarme a visualizar y analizar esta información?

Si es un recién llegado al sitio y necesita un manual, consulte "¿Cómo puedo encontrar respuestas, obtener respuestas a mis preguntas y ayudar a DHanswers a crecer?

Si usted es simplemente "curioso de DH" o si alguien está trabajando en el campo con una pregunta o experiencia para prestar, ¡debe probar DHAnswers!

[Foto de Flickr con licencia CC de Martin Cathrae]

jueves, 10 de marzo de 2016

El mundo pequeño de Humanidades Digitales



[Análisis de redes] Humanidades Digitales en Twitter, un mundo pequeño?


Martin Grandjean

Twitter ayuda a difundir la información y el conocimiento. Esto es especialmente cierto en la comunidad de las humanidades digitales en este medio de comunicación social tiene un lugar importante. Quién está siguiendo, que en esta red? Este post contiene un análisis de las relaciones entre los investigadores 1400 DH, ingenieros y entusiastas, lo que demuestra que esta pequeña comunidad es muy denso, un mundo tan pequeño en el que nadie está muy lejos de la agrupación vecina.


¿Quién sigue a quién? La red

En este gráfico se compone de 1.434 nodos conectados por 137,061 aristas dirigidas, cada una simbolizando un usuario "después de" otra en Twitter:


CC-BY-SA Pantalla completa aquí| Versión con todos los nombres aquí

Siguiendo y siendo seguido

Vamos a echar un vistazo más específico en la relación siguiendo / seguidores:



posiciones notables están ocupadas por los mismos usuarios que en el análisis anterior (2014). La cuenta más seguido, @DHnow, es seguido por 997 humanistas digitales y sigue 525 de ellos. La mayoría de estos usuarios son notables en la parte inferior derecha de la trama, ya que son seguidos por otros miembros de la más lista de lo que lo siguen a sí mismos. Los diferentes usos de Twitter son numerosos: entre estrellas del pop / influenciadores / snobs / guru / ... que apenas sigue a nadie y usuarios de redes / exploradores de tecnología / ... que siguen a un gran número de cuentas.


Tablas


 

Composición de la lista y el sesgo

Esta lista de Twitter contiene 1400 cuentas identificadas de forma manual como miembros de la "comunidad DH". Los datos analizados aquí se ha compilado el 2 de julio de 2015.

Esta lista sigue creciendo, no dude en seguirlo (directamente en Twitter), enviar sus propias listas para completarlo (dejando un comentario a continuación), o para analizar el contenido mismo de los tweets publicados por los miembros de la lista.

dicha lista nunca será completa, en parte porque las humanidades digitales son un campo en el que los actores no siempre reconocen a sí mismos como una parte, y en parte porque todos los eruditos DH no escribe en su biografía de Twitter que está practicando DH. Dicho esto, esta lista también se desarrolló teniendo en cuenta los usuarios que tuiteó activamente durante varios DH Conferencias en 2014 y 2015, así como muchas listas de los comités de las asociaciones nacionales e internacionales. Esta operación puede mejorar la apariencia "pequeño mundo", sino que también revela cómo la comunidad está estructurada por un pequeño número de personas influyentes centralizados.

Todavía tenemos que discutir el impacto Europea-centrismo del autor de la lista de la que habla francés y alemán racimos muy visibles. ¿Son estas "regiones" de la comunidad en realidad más elevada aglomeración, o es simplemente porque estas poblaciones se han buscado de forma más completa?