Visualizando datos de citas disponibles de forma gratuita utilizando VOSviewer
Nees Jan van Eck, Ludo WaltmanCWTS
Hoy lanzamos la versión 1.6.6 de nuestro software VOSviewer para construir y visualizar redes bibliométricas. La nueva característica más importante en esta versión es el soporte para trabajar con datos Crossref. Recientemente, la Initiative for Open Citations (I4OC) logró convencer a un gran número de editoriales científicas para que las listas de referencias de publicaciones en sus revistas estuvieran disponibles gratuitamente a través de Crossref. Gracias a I4OC, Crossref se ha convertido en una valiosa fuente de datos para los usuarios de VOSviewer. En esta publicación de blog, discutimos cómo los usuarios de la nueva versión 1.6.6 de VOSviewer pueden beneficiarse de los datos de Crossref.
Uso de datos Crossref en VOSviewer
Hay dos formas en que VOSviewer admite el uso de datos Crossref:
- Un usuario de VOSviewer puede proporcionar un conjunto de DOI a VOSviewer. Usando la interfaz de programación de aplicaciones (API) de Crossref, VOSviewer descargará datos para las publicaciones correspondientes.
- Un usuario de VOSviewer puede trabajar directamente con la API de Crossref para descargar datos y luego puede proporcionar los datos descargados como entrada a VOSviewer.
El primer enfoque es el más fácil, ya que no requiere que los usuarios trabajen directamente con la API de Crossref. Cuando los usuarios ya tienen DOI de las publicaciones que les gustaría analizar (por ejemplo, publicaciones incluidas en el sistema de información de investigación de su universidad), recomendamos utilizar el primer enfoque. El segundo enfoque es un poco más complejo, pero tiene la ventaja de ofrecer mucha más flexibilidad. Ahora exploraremos el segundo enfoque con más detalle.
Descargando datos usando la API Crossref
Para demostrar el uso de la API Crossref, recopilamos datos sobre publicaciones en dos revistas cienométricas, Journal of Informetrics y Scientometrics, en el período 2007-2016. En cada llamada API, se pueden obtener datos para un máximo de 1000 publicaciones. Por lo tanto, necesitamos hacer múltiples llamadas a la API. Elegimos hacer llamadas por separado para cada una de las dos revistas.El número de publicaciones en el Journal of Informetrics en el período 2007-2016 es inferior a 1000. Por lo tanto, los datos para el Journal of Informetrics se pueden obtener en una sola llamada API. Para realizar esta llamada API, ingresamos la siguiente URL en un navegador web:
http://api.crossref.org/works?filter=issn:1751-1577,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000
La URL especifica una solicitud para la API Crossref. La solicitud API incluye el número ISSN de Journal of Informetrics (es decir, 1751-1577), así como la fecha de inicio y la fecha de finalización del período de tiempo que nos interesa. El parámetro rows en la solicitud API indica que nos gustaría para recibir datos de hasta 1000 publicaciones. Al ingresar la URL anterior en un navegador web, hacemos una llamada a la API de Crossref solicitando datos sobre todas las publicaciones en Journal of Informetrics en el período 2007-2016. Después de esperar un tiempo, el navegador web presentará el resultado de la llamada API. Guardamos este resultado en un archivo llamado JOI.json. Este es el llamado archivo JSON.
Seguimos el mismo enfoque para Scientometrics. Sin embargo, Scientometrics es una revista más grande y, por lo tanto, debemos realizar tres llamadas a la API, cada una de las cuales da como resultado datos para un máximo de 1000 publicaciones. Utilizamos las siguientes URL:
http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000
http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000&offset=1000
http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000&offset=2000
Las tres llamadas API son idénticas, excepto que en la segunda y la tercera llamada usamos el parámetro offset para especificar que queremos obtener datos para un segundo y un tercer lote de publicaciones. Guardamos los resultados de las llamadas API en tres archivos JSON.
Ahora hemos dado una demostración simple del uso de la API Crossref. La API Crossref ofrece muchas más opciones. Para más información, nos referimos a la documentación de la API.
Creando visualizaciones bibliométricas basadas en datos Crossref
Primero utilizamos los datos de Crossref descargados para visualizar una red de coautoría de investigadores en el campo de la cienciometría. En el asistente Crear mapa en VOSviewer, elegimos la opción Crear un mapa basado en datos bibliográficos. En el segundo paso del asistente, vamos a la pestaña Crossref JSON, donde seleccionamos los cuatro archivos JSON descargados. Después de elegir realizar un análisis de coautoría, simplemente usamos las elecciones predeterminadas en los pasos restantes del asistente. La visualización de la red de coautoría resultante se presenta a continuación.A continuación, usamos nuestros datos Crossref para visualizar una red de publicaciones de acoplamiento bibliográfico en el campo de la cienciometría. Dos publicaciones tienen un enlace de acoplamiento bibliográfico si tienen una o más referencias en común. Nuevamente elegimos la opción Create a map based on bibliographic data en el asistente Create Map . Después de seleccionar nuestros cuatro archivos JSON, elegimos realizar un análisis de acoplamiento bibliográfico a nivel de documento. Utilizamos las opciones predeterminadas en los pasos restantes del asistente, lo que significa que nuestra red de acoplamiento bibliográfico incluye las 500 publicaciones con el mayor número de enlaces de acoplamiento bibliográfico. La visualización de la red se muestra a continuación.
El examen de la red de acoplamiento bibliográfico puede revelar algo inesperado. Las 500 publicaciones incluidas en la red de acoplamiento bibliográfico han aparecido todas en Scientometrics. La red no incluye publicaciones de Journal of Informetrics. Esto demuestra una importante limitación de los datos Crossref. Gracias a I4OC, muchos editores hoy en día hacen que las listas de referencias de publicaciones en sus revistas estén disponibles a través de Crossref. Sin embargo, algunos editores no (¿todavía?) Participan en I4OC. Este es también el caso de Elsevier, el editor de Journal of Informetrics. Debido a que las listas de referencias de publicaciones en Journal of Informetrics no están disponibles a través de Crossref, las publicaciones de esta revista no se pueden incluir en un análisis de acoplamiento bibliográfico basado en datos de Crossref.
Ejemplo a gran escala
Ahora hemos proporcionado ejemplos relativamente pequeños del uso de datos Crossref en VOSviewer. También es posible utilizar datos Crossref a una escala mucho mayor en VOSviewer, pero esto requiere un esfuerzo significativo en el preprocesamiento de los datos. Para ilustrar el uso a gran escala de datos Crossref, utilizamos los datos para visualizar una red de citas de 5000 revistas de todos los campos de la ciencia.Usando la API Crossref, descargamos datos para todas las publicaciones en el período 1980-2016. La cantidad de datos era muy grande y, por lo tanto, era necesario preprocesar los datos para poder proporcionarlos como entrada a VOSviewer. Los datos se almacenaron en una base de datos relacional. Usando esta base de datos, identificamos todas las revistas (así como las actas de congresos y las series de libros) que tienen al menos 100 publicaciones para las cuales hay una lista de referencias disponible. Luego construimos la red de enlaces de citas entre las revistas identificadas. La dirección de un enlace de citas fue ignorada, por lo que no se hizo distinción entre una cita del diario A y el diario B y una cita del diario B del diario A. La red de citas del diario se guardó en un archivo de red VOSviewer y se utilizó este archivo como entrada para VOSviewer. En VOSviewer, se seleccionaron las 5000 revistas con el mayor número de enlaces de citas con otras revistas y se visualizó la red de citas de estas 5000 revistas. La visualización resultante se presenta a continuación. Se puede abrir una visualización interactiva en VOSviewer haciendo clic aquí.
La visualización muestra una estructura de la ciencia que es bien conocida a partir de visualizaciones bibliométricas a gran escala anteriores, que se basaron en datos de Web of Science o Scopus. Las revistas de matemática, informática e ingeniería se pueden encontrar en el centro del área inferior de la visualización. Las revistas de ciencias físicas se ubican en el área derecha de la visualización, mientras que las revistas de ciencias biológicas y de vida se encuentran en el área superior. Finalmente, las revistas de ciencias sociales se ubican en el área inferior izquierda de la visualización. Algunas revistas importantes faltan en la visualización. Estas revistas tienen un editor que no participa en I4OC y que no hace que las listas de referencias de publicaciones estén disponibles a través de Crossref.