jueves, 10 de noviembre de 2016

Usando redes para escribir el resumen de literatura de la tesis doctoral

Barriendo Google Scholar para escribir su capítulo de literatura de doctorado
My Student Voices



Diagrama de red de autores clave en mi doctorado. Los enlaces representan citas y coautorías. Los colores son comunidades como lo indica la "modularidad". La clave indica algunas conjeturas aproximadas en lo que los autores de una comunidad tienen en común - en algunos casos hay un ajuste excelente (diseño participativo), en otros mucho menos (lila).

En un post anterior escribí sobre el diseño de un mejor sistema para la publicación académica. Un problema con el ecosistema de publicación comercial es que inhibe a quienes deseen desarrollar nuevas herramientas para navegar por el cada vez mayor cuerpo de investigación. (Por supuesto, también existe la clara injusticia de pedir a los contribuyentes que financien investigaciones que posteriormente no pueden leer).
Esta publicación trata de un prototipo de "red" para encontrar documentos usando datos de Google Scholar, con lo que se podría señalar lo que se podría hacer con datos más abiertos. Pude usar un programa supervisado buscando en Google Scholar para extraer mis datos, pero una versión escalable de esta herramienta requeriría datos abiertos.
También es rascar mi propia picazón: estoy en la etapa de mi doctorado donde necesito juntar todo. Necesito un capítulo de literatura que establezca el contexto teórico para mis cuatro estudios de caso, explicando lo que ya se ha escrito sobre mi tema y aclarando mis términos clave. En mi caso eso significa lo que se ha dicho sobre el tema del diseño participativo, la formulación de políticas, la acción colectiva y el análisis de redes sociales. (Mi título de trabajo es: ¿Cómo pueden los medios de comunicación social informar a la política del gobierno local?)
Hay cuatro áreas que conozco que juegan un papel en mi investigación:
  • Las ideas sociológicas sobre redes (Roland Burt y Mark Granovetter)
  • El trabajo de Elinor Ostrom sobre los bienes comunes
  • Diseño participativo
  • Ética / Política de Steven Lukes, Amartya Sen y John Rawls
¿Existen ya documentos que citen autores de todas estas áreas? ¿Puedo confirmar mi sospecha de que la literatura de diseño participativo casi nunca cita la ciencia política relevante, por ejemplo, la investigación de Steven Lukes sobre el poder o (otra de las ideas favoritas) de James Fishkin sobre la democracia deliberativa? Es hora de hacer algo de codificación ...

Construcción de un prototipo

Uso de Meteor (un paquete de JavaScript) Construí una aplicación web para recopilar datos de Google Scholar. Lo llamé Bibnet (código en github). El proceso comienza con un conjunto de términos de búsqueda que conozco los papeles de retorno que ya cito de Google Académico (lista de 55 términos de búsqueda aquí).
Con la lista de términos de búsqueda, Bibnet realiza dos pasos:

  1. Bibnet registra cada artículo o libro que es devuelto por Google Académico (hasta 10 resultados por término) para cada uno de los términos de búsqueda. Esta información genera una lista de publicaciones en una base de datos. En la misma base de datos, también registra quién escribió cada publicación como una lista de autores.
  2. Usando la "búsqueda dentro de las citas" de Google Scholar, verifica si alguno de los autores registrados en la base de datos ha citado alguna de las publicaciones.

Este proceso genera archivos que se pueden exportar a la herramienta de visualización Gephi.
De las 55 cadenas de búsqueda originales grabé 1120 autores, 1223 publicaciones y 1382 citas. (Lista legible de las citas)

Resultados

Para generar la imagen de abajo, exporté una lista de todos los autores y mostré enlaces entre ellos si habían coautorizado una publicación o si se habían citado. El tamaño de los nodos indica el número de enlaces entrantes, el grosor del borde indica el número de conexiones (citas y coauthoring) entre dos nodos.

La misma imagen que el encabezado, pero con los autores claves rodeados en rojo



Para que el gráfico sea legible, sólo muestro los nodos con más enlaces. Como se describe en el primer epígrafe, los colores representan algoritmicamente descubiertos 'comunidades' utilizando la función de Gefi- s de modularidad - grupos de autores que citan y coautorizan mucho. Estas comunidades son probablemente bastante dependiente del conjunto inicial de búsquedas, sin embargo, algunos de ellos tienen sentido intuitivo. La 'comunidad de diseño participativo', por ejemplo, está muy bien definida. La comunidad rosada son todos los autores que he estado viendo en el tema de la democracia deliberativa.
Por otra parte, S Lukes habría tenido más sentido para mí en la comunidad verde con RA Dahl, a quien su trabajo hace extensa referencia. De hecho, como indica la clave, no puedo decir lo que la comunidad de lilas indica con ningún grado de confianza - su existencia puede ser el resultado de mi muestreo selectivo de la red académica en general. La centralidad del grupo lila indica que son comúnmente referenciados por todos los otros grupos, y Arrow y Rawls son dos de los investigadores con mayor referencia en la red. Puede ser esta propiedad, más que una especialidad de sujeto, que los nodos de lila tienen en común.
Hay una serie de casos límite anómalos como este.


¿Cómo ayuda a escribir un capítulo de literatura?

Me siento más cómodo con el paisaje de mi investigación con la red como una visión general, y la intención de añadir nuevas referencias a medida que surgen. Algunas lecciones clave se destacaron:

  • Y Guo, un investigador que nunca he encontrado (y probablemente no habría hecho a través de mi enfoque normal) está haciendo una investigación similar a la mía y haciendo referencia a la misma mezcla ecléctica de fuentes.
  • Mi creencia anterior de que la comunidad de diseño participativo no hace referencia a Lukes ha resultado ser errónea. Mi opinión anterior se basaba en lo que yo pensaba que era una búsqueda sustancial, por lo que este fue un hallazgo sorprendente. Es difícil encontrar enlaces de citas usando un proceso manual cuando cualquier investigador de diseño participativo podría haber citado a Lukes.
  • La comunidad de diseño participativo es difícil de entender. Este enfoque me ha ayudado a concentrarme en Hillgren como un autor muy relevante, un autor que no conocía antes.
  • Estoy sorprendido (y complacido) de ver que Fishkin, que siempre parecía aislado para mí, está realmente bien integrado entre los autores que estoy haciendo referencia.
  • Estoy interesado en The making of the social world del filósofo John Searle como parte de mi investigación. Aunque el libro estaba en las búsquedas iniciales, y el trabajo de Searle es famoso y ampliamente referenciado, no apareció como un nodo bien conectado en mi red. Tal vez su investigación no es tan relevante como yo pensaba, o tal vez es una conexión que debe hacerse.
  • Bjorgvinsson es el nodo más grande de la red, lo que significa que tienen la mayoría de los enlaces entrantes. Sin embargo, su investigación no es de particular relevancia para la mía. 'Eyeballing' sugiere que Bjorgvinsson tiene muchas conexiones dentro del diseño participativo, pero poco alcance más amplio. Esta estructura de conectividad todavía nos dice algo sobre la comunidad, incluso si, como en este caso, puede que no sea algo que deba seguir.

Creo que un análisis más profundo podría revelar documentos menos citados que citan combinaciones interesantes de mis autores clave.
Este enfoque parece especialmente relevante para mi trabajo porque me estoy posicionando en relación con varias disciplinas. También parece importante en las humanidades más amplias, donde la búsqueda por palabra clave puede fallar al devolver resultados relevantes de otra disciplina con un vocabulario diferente.
Por último, debo reconocer en primer lugar que la red de citas no es la única manera de descubrir documentos, y también que Google Scholar es una fuente incompleta de datos en sí.

¿No es esto sólo un tipo avanzado de la dilación?

No le digas a mis supervisores.

No hay comentarios:

Publicar un comentario en la entrada