sábado, 11 de noviembre de 2017

Los lazos fuertes prolongan la vida

Después de estudiar las vidas de 724 hombres durante 79 años, Harvard revela el secreto más grande para el éxito y la felicidad

¿Quiere mejorar su éxito en la vida y el negocio? Los resultados de este estudio de 79 años le mostrarán cómo hacerlo.

Por Dana Severson | Inc
Cofundador, StartupsAnonymous.com@danerobert




CRÉDITO: Getty Images


¿Te has preguntado qué se necesita para vivir la buena vida? ¿Te has preguntado alguna vez cuál es el secreto del éxito y la felicidad? Los investigadores de Harvard parecen tener una respuesta en un estudio de 79 años de antigüedad.

Después de examinar minuciosamente una montaña de datos, obtenidos de entrevistas en persona, cuestionarios, registros médicos, etc., los investigadores concluyeron que las relaciones cercanas hacen felices a las personas. Y que los lazos sociales protegen a las personas de los desafíos de la vida a la vez que mejoran la salud mental y física.

Esto es sorprendente en una cultura que reconoce el trabajo duro como el boleto a la buena vida.

En un tipo raro de investigación en curso, el Estudio de Desarrollo de Adultos de Harvard ha logrado rastrear las vidas de 724 hombres durante 79 años. Los hombres fueron divididos en dos clases. El primer grupo tenía estudiantes de segundo año en Harvard College, mientras que el segundo era un grupo de niños de los barrios más pobres de Boston. Fueron investigados desde el momento en que eran adolescentes hasta la vejez para determinar qué es lo que realmente mantiene a la gente sana y feliz.

Año tras año (desde 1938), los investigadores preguntaron sobre su trabajo, sus vidas, su salud, sin saber cómo iban a funcionar sus historias. Resulta que florecer en la vida es una función de los lazos cercanos con la familia, los amigos y la comunidad. No tiene nada que ver con la fama, la riqueza, la clase social, el CI, los genes, etc.

El cuarto director del estudio, Robert Waldinger, un psiquiatra del Hospital General de Massachusetts y profesor de psiquiatría en la Facultad de Medicina de Harvard, dijo que el estudio reveló que nuestras relaciones impactan poderosamente en nuestra salud.

Waldinger hizo esta observación en una popular charla TED, que puedes ver aquí:



También dijo que el estudio descubrió estas tres lecciones sobre las relaciones:

1. Las conexiones sociales son buenas para nosotros; la soledad realmente mata.

Mientras llama tóxico a la soledad, Waldinger dijo que las conexiones sociales hacen a la gente más feliz y físicamente más saludable. Los hizo vivir más tiempo también.

Por otro lado, también dijo:

"Las personas que están más aisladas de lo que quieren ser de otros encuentran que son menos felices, su salud disminuye antes en la mediana edad, su funcionamiento cerebral disminuye antes y viven vidas más cortas que las personas que no están solas. Y la triste realidad es que en cualquier momento dado, más de uno de cada cinco estadounidenses informará que está solo ".
A medida que las empresas se distribuyen más, lo que permite que los empleados trabajen de forma remota, parece importante garantizar que el equipo permanezca conectado. Las herramientas de colaboración, como Slack (y todos sus competidores) o Cisco Spark, pueden ser esenciales para minimizar el aislamiento.

2. La calidad de nuestras relaciones cercanas importa.

En lugar de enfocarse en la cantidad, es vital enfocarse en la calidad de nuestras amistades.

Vivir en medio del conflicto afecta nuestra salud. Los matrimonios de alto conflicto, por ejemplo, afectan negativamente nuestra salud, tal vez más que el divorcio. Y vivir en medio de relaciones cálidas e incondicionales es protector.

Waldinger dijo que podían decir cuál de sus hombres se convertiría en un octogenario saludable y feliz y quién no los seguiría hasta llegar a los 80, así como también mirarlos en la mediana edad:

"Cuando reunimos todo lo que sabíamos sobre ellos a la edad de 50 años, no eran sus niveles de colesterol en la edad adulta los que predecían cómo iban a envejecer, sino cuán satisfechos estaban en sus relaciones. Las personas que estaban más satisfechas en sus relaciones a los 50 años fueron los más saludables a los 80 años ".
La tensión en el lugar de trabajo entre compañeros de equipo, gerentes y subordinados puede causar un nivel de estrés poco saludable entre los empleados. Es importante crear un entorno que fomente el diálogo abierto y las bromas divertidas, lo que permite que surjan amistades.

3. Las buenas relaciones protegen nuestros cerebros, no solo nuestros cuerpos.

El estudio encontró que estar ligado a una relación en los 80 es protector. Esas personas tenían recuerdos más nítidos, mientras que las personas que tenían relaciones en las que no podían contar realmente con la otra persona experimentaron una disminución gradual de la memoria.

Los argumentos, dijo Waldinger, no afectaron los recuerdos. No importaban mientras las parejas octogenarias supieran que podían contar con el otro cuando las cosas se ponían difíciles. "La buena vida", concluyó Waldinger, "está construida con buenas relaciones".

Lo mismo puede decirse con respecto a la relación entre un gerente y su empleado. Si bien no es necesaria una amistad fuera de la oficina, los empleados más felices se sienten seguros, sabiendo que su superior siempre les da la espalda y viceversa.

jueves, 9 de noviembre de 2017

Redes de asociaciones entre atributos psicológicos

Análisis de red de asociaciones entre atributos psicológicos


Center for Network Science
Investigación y análisis por Srebrenka Letina, Visualización de datos por Tamer Khraisha

La visualización interactiva de Tamer Khraisha está disponible en el blog de Tamer.




La personalidad es un sistema complejo, que a menudo es descrito por psicólogos usando diferentes constructos como rasgos, motivaciones, emociones, actitudes, creencias, habilidades, etc. Sin embargo, el sistema de personalidad no es solo la acumulación de esos constructos, tiene organización y proceso, muestra patrones, y se coloca en otros sistemas: cuerpo físico y entorno social.

En este proyecto, nuestro objetivo fue explorar la naturaleza de las asociaciones entre diferentes atributos de personalidad utilizando un enfoque de red. A diferencia del enfoque tradicional utilizado en psicología, es decir, el modelo de variables latentes, según el cual los rasgos se agrupan debido al origen compartido, en el enfoque de red los rasgos se agrupan debido a la influencia que tienen entre sí. La mayoría de los estudios realizados hasta ahora han examinado las redes de facetas dentro de ciertos conceptos psicológicos (por ejemplo, actitudes, síntomas psicopatológicos de un trastorno particular, inteligencia).

Utilizamos los datos recopilados en My Personality Project (Kosinski & Stillwell, 2007-2012) sobre los puntajes individuales en muchos cuestionarios psicológicos diferentes para construir la red de 25 rasgos. El tamaño total de la muestra fue de más de un millón de personas, de más de 200 países diferentes.

Los atributos psicológicos en nuestra red pertenecen a diferentes tipos de construcciones psicológicas:

  1. Amplios rasgos de personalidad: Cinco grandes rasgos - Amabilidad, Estabilidad emocional (Neuroticismo invertido), Conciencia, Extroversión y Apertura, Satisfacción con la vida;
  2. Rasgos de personalidad estrechos: empatía, imparcialidad, auto-revelación, autocontrol, conocimiento de síntomas físicos y sensaciones, depresión (invertida) y conciencia corporal: cuerpo privado, cuerpo público y competencia corporal;
  3. Intereses: Recreación Intelectual, Militarismo (revertido), Violento-Ocultamiento (revertido), y Actividades Saludables; y
  4. Valores: seis de diez valores de Shwartz: Logro, Poder, Hedonismo, Autodirección, Tradición y Universalismo. Para obtener más detalles sobre las construcciones y medidas utilizadas, consulte la visualización interactiva.

Nuestro interés de investigación consistió principalmente en estudiar las asociaciones entre diferentes constructos psicológicos y, por lo tanto, esperábamos bajos coeficientes de correlación, dado que la mayoría de esos constructos se construyen para ser más o menos independientes. El tamaño de la muestra en el que se estima la menor correlación por parejas fue 1879, mientras que el tamaño medio de la muestra fue 4319. La red de correlación constaba de 255 enlaces, es decir, 255 correlaciones significativas después de la transformación apropiada de distribuciones sesgadas y pruebas de permutación basadas en N = 10 000. El procedimiento que usamos para construir la red final se llama (G) técnica de Lazo (paquete R qgraph de Epskamp et al., 2012), descrito en detalle en Friedman et al. (2008), Epskamp & Fried (2017), Epskamp et al. (en prensa). Esta técnica dio como resultado una red más escasa, al establecer algunos de los parámetros (ponderaciones de enlace) a cero, al tiempo que restringía la magnitud de otros parámetros. El parámetro de ajuste lambda se estableció en 0.25 y el tamaño de muestra se estableció para reflejar la muestra más pareja por pares, lo que da como resultado una red de 229 enlaces. Para obtener más información acerca de los pesos de los enlaces, consulte la visualización interactiva. El grado promedio en esta red fue de 18. 32, y la transitividad fue de 0.79, con un pequeño índice mundial de 1.181.

Además, llevamos a cabo un análisis de centralidad de los nodos en la red, que dio como resultado información útil sobre el efecto sistémico que un atributo puede tener en los otros nodos. La figura 1 muestra los resultados, con tres medidas de centralidad estandarizadas (grado, cercanía y entrecruzamiento). La estabilidad emocional (Neuroticismo invertido) parece ser el rasgo más central en esta red, lo que implica que el cambio en este atributo (debido al estrés o la terapia, por ejemplo) daría lugar a los mayores cambios en la red. Al mismo tiempo, puede sugerir por qué este atributo podría ser difícil de cambiar, ya que es el más conectado con otras partes del sistema de personalidad. La depresión (invertida) y la Conciencia parecen estar entre la mayoría de los nodos periféricos, lo que implica que el cambio en esos atributos no daría lugar a cambios sustanciales en los otros rasgos. Sin embargo, se deben tener en cuenta tres cuestiones al interpretar estos hallazgos. En primer lugar, es el uso de datos transversales, basados ​​en asociaciones interpersonales, para llegar a algunas conclusiones sobre lo que puede suceder dentro de una persona (asociaciones intrapersonales). Esto significa que debemos ser cautos al hacer afirmaciones fuertes, y debemos tratarlo más como una forma de generar nuevas hipótesis que podrían ser probadas con datos longitudinales.

Figura 1. Análisis de centralidad de 25 nodos en red de (g)lazo

En segundo lugar, debe tenerse en cuenta que no controlamos por el hecho de que se esperaba que algunos de los nodos estuvieran más conectados con otros dentro de su grupo (por ejemplo, valores). Por último, en este momento estamos mostrando la red en base a todos los datos disponibles, sin controlar las posibles diferencias en los patrones de conexión que podrían deberse al género, edad, etc. En conclusión, en la red de diferentes tipos de rasgos no altamente relacionados, La estabilidad emocional es el rasgo más central. Creemos que este enfoque se puede utilizar de forma fructífera en combinación con otros tipos de datos, y proporciona riqueza y flexibilidad para explicar la compleja estructura de la personalidad (ver Mottus & Allerhand, 2017).

REFERENCIAS:

Epskamp, S., Cramer, A.O.J., Waldorp, L.J., Schmittmann, V.D., Borsboom, D. (2012). qgraph: Network visualizations of relationships in psychometric data. Journal of Statistical Software, 48, 1-18.

Epskamp, S., Maris, G.J.K.,  Waldorp, L.J., Borsboom, D. (2016). Network psychometrics. In Irwing, P., Hughes, D., and Booth, T. (2016). Handbook of Psychometrics. New York: Wiley.

Epskamp, S., Borsboom, D., Fried, E.I. (2017). Estimating psychological networks and their accuracy: a tutorial paper. Behavior Research Methods. https://doi.org/10.3758/s13428-017-0862-1

Epskamp, S., Fried, E. (in press) A Tutorial on Regularized Partial Correlation Networks. Submitted for publication to journal Psychological Methods.

Friedman, J., Hastie, T., Tibshirani, R. (2008). Sparse inverse covariance estimation with the graphical lasso. Biostatistics, 9, 432-441.

Mõttus, R., & Allerhand, M. (2017). Why do traits come together? The underlying trait and network approaches. In V. Zeigler-Hill & T. K. Shackelford (Eds), SAGE handbook of personality and individual differences: Volume 1. The science of personality and individual differences. London: SAGE.

domingo, 5 de noviembre de 2017

Visualizando las redes de colaboración científicas mundiales


Cómo una pequeña compañía de diseño de datos visualizó las colaboraciones científicas del mundo


Sage Wesenberg | Story Bench


Los científicos cubanos tienden a asociarse con los alemanes, pero también lo hacen los investigadores franceses. Los kenianos trabajan con sudafricanos. Pero, como era de esperar, las estrellas globales de la colaboración científica son los Estados Unidos y China. Un mapa interactivo recientemente publicado por Nature reveló esta red de colaboraciones para visualizar las alianzas científicas de todo el mundo.

Compuesto por una constelación de puntos coloridos superpuestos sobre un mapa mundial de líneas interconectadas, Nature publicó el interactivo en noviembre de 2015. El proyecto “Connected World: Patterns of International Collaboration,” analizó la colaboración internacional en el año anterior a octubre de 2015. entre más de 150 países organizados en regiones como América del Sur, África y Asia Occidental. Cada país recibió un puntaje que denota el alcance de su producción científica en colaboración y este puntaje se refleja en el tamaño del punto de cada país. Diferentes flechas muestran el balance de contribuciones científicas entre países. Lo visual se puede entender mejor al observarlo a través de áreas temáticas filtradas, como la región o los colaboradores, lo que proporciona una mejor idea de quién está colaborando con quién y dónde se concentran los recursos de investigación.



En lugar de diseñarlo internamente, Nature asignó el proyecto a Small Multiples, una empresa australiana fundada en 2011 por Andrea Lau y Jack Zhao, especialistas en visualización de datos versados ​​en informática de diseño, bioinformática, diseño de interacción y artes electrónicas.

Comprender los objetivos de la revista

La naturaleza primero informó a Small Multiples sobre los datos de colaboración y el objetivo de la revista para la historia que querían que la visual dijera. Para Small Multiples, el primer paso fue completar un análisis. Para esto, dice Lau, tenían que mirar otros proyectos con datos u objetivos similares de colaboración científica para tener una idea de cómo podían visualizar estos tipos específicos de datos. Después de ver un trabajo similar, Small Multiples hizo una lluvia de ideas sobre varios conceptos diferentes para el visual antes de presentar algunos a la naturaleza para obtener comentarios.

En este punto, se eligió un concepto: un grafo dirigido por fuerza para mostrar los altos niveles de colaboración entre países que se encuentran muy próximos entre sí. Se creó un prototipo utilizando D3, una biblioteca de visualización de JavaScript, para crear el interactivo. [Aprenda a construir su propio gráfico D3 dirigido a la fuerza aquí.] Sin embargo, una vez que se aplicaron datos reales al modelo, terminó siendo demasiado complejo y requirió alguna revisión. El segundo prototipo es lo que se convirtió en la visualización final. Agrupa las diferentes regiones del mundo en el eje x y coloca el número de colaboradores de cada país en el eje y. Esto, Lau dice, pone los resultados de una manera más ordenada y funciona mejor que el concepto dirigido por la fuerza.





Después de que Nature aprobó los wireframes para el prototipo final, Small Multiples construyó la visualización en Scalable Vector Graphics (SVG), que formatea los grafos para que sean interactivos y animados. Esta visualización fue devuelto a Nature para ser finalizado a través de la edición y la adición de anotaciones y descripciones. Una vez completo, se publicó en Nature Index y se actualiza cada mes con nuevos datos.

Abordar historias basadas en datos

Small Multiples ha trabajado en muchos elementos visuales similares a esto en los últimos cuatro años. Su objetivo con cada trabajo es poder "abordar una historia basada en datos de principio a fin", dice Lau. Trabajan en varias de las principales publicaciones y transmisoras australianas, como ABC y The Guardian. Para obtener inspiración, Lau dice, Small Multiples analiza libros, blogs, noticias, podcasts, películas, galerías y museos para encontrar ideas en lugares que no sean los tradicionales editores de visualización de datos.

Pero crear una visualización de datos a medida es un desafío. Lau describe algunas de las complicaciones que a menudo encuentran sus equipos: "Una vez que tienes los datos y entiendes el informe, el mayor desafío es encontrar la solución visual. Esto es común en todos los proyectos y lo mejor de ellos; tratando de resolver el problema! "ella dice. Específicamente, Lau recuerda un visual en el que era difícil completar un concepto visual porque los datos seguían cambiando. "¡Creo que llegamos a la versión 20!" Desde un punto de vista técnico, Lau dice que los únicos desafíos una vez que se crea el visualizador es optimizar el visual para dispositivos móviles.


Una de las partes más importantes de cualquier visualización es verificar adecuadamente los datos y descubrir cómo se deben representar mejor. Small Multiples lo hace mediante el uso de ciertos recursos como la Oficina de Estadísticas de Australia y la búsqueda de fuentes completas y confiables, así como el acceso a los datos que se les proporcionan, ya que los requisitos de datos pueden cambiar de un proyecto a otro. A partir de ahí, los datos se pueden representar de muchas maneras. "Las representaciones son un reflejo de los datos en sí y de la historia que se cuenta. ¿Es cuantitativo o cualitativo, serio o podemos divertirnos un poco? ", Dice Lau.

En cuanto a los consejos para estudiantes que persiguen la visualización de datos y el periodismo, Lau recomienda algunas cosas: "Expande tus habilidades en las diferentes facetas de la visualización de datos: narración y comunicación, investigación y análisis de datos, diseño y desarrollo. Y luego profundiza en un área y haz de eso tu núcleo. Esto significa que puede ser un profesional multidisciplinario que puede hacer cosas de forma independiente, y también como especialista cuando trabaja de forma más interdependiente con un equipo ".

Ese es el tipo de consejo sensato que cualquier narrador digital puede apreciar.

jueves, 2 de noviembre de 2017

Nueva versión de VOSviewer opera directamente con Crossref

Visualizando datos de citas disponibles de forma gratuita utilizando VOSviewer

Nees Jan van Eck, Ludo Waltman
CWTS

Hoy lanzamos la versión 1.6.6 de nuestro software VOSviewer para construir y visualizar redes bibliométricas. La nueva característica más importante en esta versión es el soporte para trabajar con datos Crossref. Recientemente, la Initiative for Open Citations (I4OC) logró convencer a un gran número de editoriales científicas para que las listas de referencias de publicaciones en sus revistas estuvieran disponibles gratuitamente a través de Crossref. Gracias a I4OC, Crossref se ha convertido en una valiosa fuente de datos para los usuarios de VOSviewer. En esta publicación de blog, discutimos cómo los usuarios de la nueva versión 1.6.6 de VOSviewer pueden beneficiarse de los datos de Crossref.

Uso de datos Crossref en VOSviewer


Hay dos formas en que VOSviewer admite el uso de datos Crossref:

  1. Un usuario de VOSviewer puede proporcionar un conjunto de DOI a VOSviewer. Usando la interfaz de programación de aplicaciones (API) de Crossref, VOSviewer descargará datos para las publicaciones correspondientes.
  2. Un usuario de VOSviewer puede trabajar directamente con la API de Crossref para descargar datos y luego puede proporcionar los datos descargados como entrada a VOSviewer.

El primer enfoque es el más fácil, ya que no requiere que los usuarios trabajen directamente con la API de Crossref. Cuando los usuarios ya tienen DOI de las publicaciones que les gustaría analizar (por ejemplo, publicaciones incluidas en el sistema de información de investigación de su universidad), recomendamos utilizar el primer enfoque. El segundo enfoque es un poco más complejo, pero tiene la ventaja de ofrecer mucha más flexibilidad. Ahora exploraremos el segundo enfoque con más detalle.

Descargando datos usando la API Crossref

Para demostrar el uso de la API Crossref, recopilamos datos sobre publicaciones en dos revistas cienométricas, Journal of Informetrics y Scientometrics, en el período 2007-2016. En cada llamada API, se pueden obtener datos para un máximo de 1000 publicaciones. Por lo tanto, necesitamos hacer múltiples llamadas a la API. Elegimos hacer llamadas por separado para cada una de las dos revistas.

El número de publicaciones en el Journal of Informetrics en el período 2007-2016 es inferior a 1000. Por lo tanto, los datos para el Journal of Informetrics se pueden obtener en una sola llamada API. Para realizar esta llamada API, ingresamos la siguiente URL en un navegador web:

http://api.crossref.org/works?filter=issn:1751-1577,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000

La URL especifica una solicitud para la API Crossref. La solicitud API incluye el número ISSN de Journal of Informetrics (es decir, 1751-1577), así como la fecha de inicio y la fecha de finalización del período de tiempo que nos interesa. El parámetro rows en la solicitud API indica que nos gustaría para recibir datos de hasta 1000 publicaciones. Al ingresar la URL anterior en un navegador web, hacemos una llamada a la API de Crossref solicitando datos sobre todas las publicaciones en Journal of Informetrics en el período 2007-2016. Después de esperar un tiempo, el navegador web presentará el resultado de la llamada API. Guardamos este resultado en un archivo llamado JOI.json. Este es el llamado archivo JSON.

Seguimos el mismo enfoque para Scientometrics. Sin embargo, Scientometrics es una revista más grande y, por lo tanto, debemos realizar tres llamadas a la API, cada una de las cuales da como resultado datos para un máximo de 1000 publicaciones. Utilizamos las siguientes URL:

http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000

http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000&offset=1000

http://api.crossref.org/works?filter=issn:0138-9130,from-pub-date:2007-01-01,until-pub-date:2016-12-31&rows=1000&offset=2000

Las tres llamadas API son idénticas, excepto que en la segunda y la tercera llamada usamos el parámetro offset para especificar que queremos obtener datos para un segundo y un tercer lote de publicaciones. Guardamos los resultados de las llamadas API en tres archivos JSON.

Ahora hemos dado una demostración simple del uso de la API Crossref. La API Crossref ofrece muchas más opciones. Para más información, nos referimos a la documentación de la API.

Creando visualizaciones bibliométricas basadas en datos Crossref

Primero utilizamos los datos de Crossref descargados para visualizar una red de coautoría de investigadores en el campo de la cienciometría. En el asistente Crear mapa en VOSviewer, elegimos la opción Crear un mapa basado en datos bibliográficos. En el segundo paso del asistente, vamos a la pestaña Crossref JSON, donde seleccionamos los cuatro archivos JSON descargados. Después de elegir realizar un análisis de coautoría, simplemente usamos las elecciones predeterminadas en los pasos restantes del asistente. La visualización de la red de coautoría resultante se presenta a continuación.



A continuación, usamos nuestros datos Crossref para visualizar una red de publicaciones de acoplamiento bibliográfico en el campo de la cienciometría. Dos publicaciones tienen un enlace de acoplamiento bibliográfico si tienen una o más referencias en común. Nuevamente elegimos la opción Create a map based on bibliographic data en el asistente Create Map . Después de seleccionar nuestros cuatro archivos JSON, elegimos realizar un análisis de acoplamiento bibliográfico a nivel de documento. Utilizamos las opciones predeterminadas en los pasos restantes del asistente, lo que significa que nuestra red de acoplamiento bibliográfico incluye las 500 publicaciones con el mayor número de enlaces de acoplamiento bibliográfico. La visualización de la red se muestra a continuación.



El examen de la red de acoplamiento bibliográfico puede revelar algo inesperado. Las 500 publicaciones incluidas en la red de acoplamiento bibliográfico han aparecido todas en Scientometrics. La red no incluye publicaciones de Journal of Informetrics. Esto demuestra una importante limitación de los datos Crossref. Gracias a I4OC, muchos editores hoy en día hacen que las listas de referencias de publicaciones en sus revistas estén disponibles a través de Crossref. Sin embargo, algunos editores no (¿todavía?) Participan en I4OC. Este es también el caso de Elsevier, el editor de Journal of Informetrics. Debido a que las listas de referencias de publicaciones en Journal of Informetrics no están disponibles a través de Crossref, las publicaciones de esta revista no se pueden incluir en un análisis de acoplamiento bibliográfico basado en datos de Crossref.

Ejemplo a gran escala

Ahora hemos proporcionado ejemplos relativamente pequeños del uso de datos Crossref en VOSviewer. También es posible utilizar datos Crossref a una escala mucho mayor en VOSviewer, pero esto requiere un esfuerzo significativo en el preprocesamiento de los datos. Para ilustrar el uso a gran escala de datos Crossref, utilizamos los datos para visualizar una red de citas de 5000 revistas de todos los campos de la ciencia.

Usando la API Crossref, descargamos datos para todas las publicaciones en el período 1980-2016. La cantidad de datos era muy grande y, por lo tanto, era necesario preprocesar los datos para poder proporcionarlos como entrada a VOSviewer. Los datos se almacenaron en una base de datos relacional. Usando esta base de datos, identificamos todas las revistas (así como las actas de congresos y las series de libros) que tienen al menos 100 publicaciones para las cuales hay una lista de referencias disponible. Luego construimos la red de enlaces de citas entre las revistas identificadas. La dirección de un enlace de citas fue ignorada, por lo que no se hizo distinción entre una cita del diario A y el diario B y una cita del diario B del diario A. La red de citas del diario se guardó en un archivo de red VOSviewer y se utilizó este archivo como entrada para VOSviewer. En VOSviewer, se seleccionaron las 5000 revistas con el mayor número de enlaces de citas con otras revistas y se visualizó la red de citas de estas 5000 revistas. La visualización resultante se presenta a continuación. Se puede abrir una visualización interactiva en VOSviewer haciendo clic aquí.



La visualización muestra una estructura de la ciencia que es bien conocida a partir de visualizaciones bibliométricas a gran escala anteriores, que se basaron en datos de Web of Science o Scopus. Las revistas de matemática, informática e ingeniería se pueden encontrar en el centro del área inferior de la visualización. Las revistas de ciencias físicas se ubican en el área derecha de la visualización, mientras que las revistas de ciencias biológicas y de vida se encuentran en el área superior. Finalmente, las revistas de ciencias sociales se ubican en el área inferior izquierda de la visualización. Algunas revistas importantes faltan en la visualización. Estas revistas tienen un editor que no participa en I4OC y que no hace que las listas de referencias de publicaciones estén disponibles a través de Crossref.

Conclusión

Gracias a I4OC, Crossref se ha convertido en una fuente valiosa de datos de citas disponibles gratuitamente. Los datos de citas de Crossref se pueden utilizar para muchos propósitos, incluido el análisis y la visualización de redes de citas de revistas, investigadores y publicaciones individuales. La versión 1.6.6 de VOSviewer proporciona soporte directo para el uso de datos Crossref para visualizar redes de citas. Esperamos que esta nueva funcionalidad de VOSviewer ofrezca una demostración convincente del valor de los datos de citas disponibles gratuitamente. Alentamos a los editores que aún no participan en I4OC a unirse a la iniciativa y a que las listas de referencias de publicaciones en sus revistas estén disponibles de manera gratuita.

lunes, 30 de octubre de 2017

Estrategias de visualización de redes históricas

Análisis de redes históricas: estructuras complejas y organizaciones internacionales

Martin Grandjean |



Grandjean Martin,
Analisi e visualizzazioni delle reti in storia : l’esempio della cooperazione intellettuale della Società delle Nazioni,
Memoria e Ricerca, 25, 2, 2017, 371-393.

"Redes" históricas

Confrontada con la masificación de los datos y la aceptación de cuestiones cada vez más globales, la historia de las organizaciones internacionales se ocupa de objetos cada vez más complejos. Y si el término "red" se usa ampliamente en la investigación histórica, es porque parece ser eficaz describir estas estructuras enredadas, evolutivas y de múltiples niveles. Basado en un análisis de decenas de miles de documentos de archivo de la "Cooperación Intelectual" de la Liga de las Naciones en la década de 1920, este artículo cuestiona el valor del análisis formal de redes y la visualización de datos como una herramienta exploratoria. Desde la red utilizada como metáfora hasta la compleja red de metadatos de archivo, a través de la red dibujada sobre la base de informaciones encontradas en fuentes heterogéneas y la red extraída del contenido de los documentos, este artículo establece una tipología que describe cuatro niveles de red formalización y muestra cómo se pueden articular estos niveles.

Una tipología de usos



  Aquí hay una descripción general muy (demasiado) rápida de las 3 categorías principales.


La red reconstituida



La red "reconstituida" (o "dibujada") es una infografía, información traducida en una imagen que tiene las características visuales de una red. Por lo tanto, no se trata de una visualización de datos, ya que no hay un trabajo sistemático sobre los datos y el resultado no es producto de un cálculo, sino un dibujo que será útil para comprender fácil o rápidamente una situación compleja. El resultado es, por tanto, producto de la interpretación de fuentes múltiples, generalmente secundarias y heterogéneas, de las que el historiador obtiene fragmentos de información complementaria: la compilación de estos bits en una única representación gráfica hará más comprensibles las relaciones entre sus elementos. A menudo, es una imagen deliberadamente simplificadora con fines explicativos. En términos de estructura, es probable que la red reconstituida sea una estructura de árbol, un diagrama de flujo donde los elementos jerarquizados tienen más relaciones verticales que horizontales o una red social muy pequeña.
 Nuestro ejemplo aquí es el organigrama de la Liga de las Naciones en 1930 basado en docenas de informes.

La red de las fuentes




La red "de las fuentes" ya no se trata de recolectar información para reconstituir una red poco a poco, sino de dibujar el gráfico directamente desde el contenido de los documentos, a menudo fuentes seriales o corpora homogénea: listas de miembros de movimientos políticos, registros familiares , mesas de bolsa, directorios de empresas, etc. Este enfoque implica un fuerte acto de modelado: una elección en el tipo de relaciones que queremos analizar. Ya no recopilamos todos los tipos posibles de relaciones entre un grupo de individuos, pero nos enfocamos en una relación bien definida que permitirá un análisis formal.
 Nuestro ejemplo aquí es el mapeo de todos los empleados de la Liga de las Naciones según su (s) departamento (es) entre 1919 y 1939.


La red de metadatos




La última etapa de nuestra tipología se refiere a las redes que ya no se derivan del contenido de las fuentes pero que mapean la circulación de las fuentes mismas. Estar interesado en los metadatos de un documento es considerar que es posible suponer que, sea cual sea su contenido, es el testimonio de una relación entre individuos o instituciones. Las redes de metadatos posibilitan, por ejemplo, reemplazar un intercambio de correspondencia entre dos personas en el contexto de todos los intercambios que mantienen con otros corresponsales. Esta "lectura distante" es un medio de comparar la estructura concreta de su intercambio con la estructura aparente y oficial que rige jerárquica o simbólicamente las relaciones entre estos individuos.
 Nuestro ejemplo aquí es la red de co-indexación de todos los actores de los documentos del Comité Internacional de Cooperación Intelectual de la Sociedad de las Naciones entre 1919 y 1927.



Mejorar el análisis combinado de varios tipos




Los tres niveles de formalización presentados anteriormente se pueden aplicar al mismo objeto histórico y así aportar puntos de vista complementarios. Pero también se pueden agrupar en una sola visualización de niveles múltiples. Al analizar una organización internacional compleja, la circulación de documentos se puede comparar con la afiliación formal de las personas afectadas. Estas personas también pueden organizarse de acuerdo con la "geografía institucional" de la institución que permite ver las relaciones entre los diferentes polos de manera más explícita que en una red de "bola de pelo".

sábado, 28 de octubre de 2017

Análisis bibliográfico de las publicaciones de Northampton Computing

Actualización sobre el análisis bibliográfico de la informática

Computing in Northampton

He tenido curiosidad sobre las herramientas para analizar las conexiones sociales por un tiempo.

En este post, estoy buscando un par de maneras de analizar las relaciones bibliográficas. Comenzando con las nubes de palabras más simples, pero luego con una herramienta interesante que VosViewer discutió previamente. Todos los datos son tomados del Depósito de Investigación de la Universidad de Northampton - Nectar, para miembros del equipo académico de Computación.


Nubes de palabras




La imagen anterior se basa en datos de todas las publicaciones enumeradas para el equipo informático desde 2011. Incluye los autores, el título, la conferencia, etc. pero no abstracto Se necesita bastante edición y realmente todo lo que se muestra es el nombre de los autores para la mayoría de los autores publicados y algunos términos clave. Proporciona una buena instantánea, pero es difícil de interpretar.

Análisis del coautor




Aquí están los mismos datos, pero se procesaron utilizando un software que solo mira a los autores y muestra cuántas veces se ha publicado un par en particular. Se pueden ver algunas interconexiones entre los autores. Ahora hay conexiones entre todos los autores principales (miembros del equipo de computación).



Las publicaciones en coautoría con estudiantes de maestría están generando mayores oportunidades para unir investigaciones.


Análisis de texto

Esta es la misma herramienta que la anterior, pero esta vez mirando el texto dentro del título y los resúmenes. Todas las palabras en el título y resumen de los trabajos; pero usando el recuento binario (por lo que un término solo se cuenta una vez por publicación) y permitiendo solo los términos con un 60% de relevancia más alta hasta; puedes obtener un gráfico como el siguiente. Personalmente, creo que el grafo es hermoso, da la sensación de que están sucediendo muchas cosas.





Un área temática interesante que sale; por ejemplo, redes inalámbricas y comunicación de máquina a máquina; junto con investigación pedagógica, cultural y sensores para animales.


Vamos a aplicar este último enfoque a algunos casos individuales

Estudio de caso 1: Carrera académica de Investigación media




Caso de estudio 2: Carrera académica de mitad de carrera 




En ambos casos de estudio 1 y 2, hay varias agrupaciones. Estudio de caso 1 los sujetos en las agrupaciones son más diversos que en el caso de estudio 2, que tiene una mayor especialización.

Caso de estudio 3: Investigador de carrera temprana

Mayor separación en los grupos (aunque tres grupos están relacionados en términos de tema) que en los dos primeros casos. Esto se debe en parte a la menor cantidad de documentos en comparación con los dos primeros estudios de casos (entre cuatro y ocho veces menos).



Caso de estudio 4: Doctor por Candidato a la Publicación



Hay una mayor interrelación entre los grupos, que en otros estudios de casos. Esto, yo diría, es una característica positiva para alguien que busca un doctorado por publicación; sugiriendo una "historia" coherente a sus publicaciones.


Trazando las citas de los trabajos de un autor

Usando GEPHI (https://gephi.org/), se puede visualizar una herramienta gratuita de visibilización de Open Graph y datos de citación de Google Scholar e interconexiones.




El enfoque adoptado aquí fue tomar un documento individual (los blogs más grandes) y hacer una conexión con todos los documentos que lo citaron (los blogs más pequeños donde los documentos no produjeron el autor). Los grupos pueden comenzar a verse, y pueden investigarse más a fondo.

jueves, 26 de octubre de 2017

Nuevo importador de archivos CSV en Gephi

Gephi 0.9.2: un nuevo importador de CSV


Gephi Blog

¡Se ha lanzado una nueva versión de Gephi! Gracias a la implacable resolución de problemas de Eduardo, la estabilidad general de Gephi se ha mejorado. Eduardo es el autor del Laboratorio de Datos, y en esta ocasión renovó su importador CSV para una experiencia de usuario más flexible y directa.

El nuevo importador CSV / hoja de cálculo


¿Sabía que Gephi puede exportar e importar solo la tabla de nodos o la tabla de bordes? Esta característica es útil en muchas situaciones, por ejemplo para producir gráficos en Excel o para limpiar datos en Open Refine. A continuación, mostraremos las nuevas funciones y, en términos más generales, explicaremos cómo importar una hoja de cálculo como una lista de nodos.

Para importar una hoja de cálculo, debe llegar al Laboratorio de datos y hacer clic en Importar hoja de cálculo. En el siguiente ejemplo, una red ya está cargada: más tarde decidiremos si los nodos importados se fusionarán con los existentes o no.



Gephi ahora puede reconocer el tipo de archivo que carga, y se ha agregado la compatibilidad de los archivos de Excel. Elegir el separador correcto es crucial ya que las columnas separadas incorrectamente comprometerían los datos. En el siguiente ejemplo, Gephi reconoció que el separador es la coma (como en un archivo CSV con el formato correcto).



La codificación del archivo es un problema común, especialmente con idiomas que usan acentos y caracteres especiales. Gephi puede adivinar la codificación y puede editarla manualmente si es necesario. En el siguiente ejemplo, Gephi adivinó correctamente la codificación UTF-8.



Seleccionar una codificación diferente produciría errores. Afortunadamente, la tabla Vista previa le permite verlos y corregir la codificación. En la captura de pantalla siguiente, vea cómo la codificación incorrecta produce caracteres exóticos en los datos.



Cuando valida estas configuraciones, Gephi ahora abre exactamente el mismo panel que cuando abre una nueva red. Personalmente, me encanta esta adición ya que aporta más consistencia a la experiencia del usuario. Le permite a Gephi proporcionar una cantidad de información útil, como la cantidad de nodos detectados o los problemas encontrados durante el proceso de importación.



No se pierda una característica importante aquí: en este panel, decide crear un nuevo espacio de trabajo con los datos importados o fusionar los nuevos nodos con los antiguos. Esta característica muy útil ya estaba presente en la apertura de una nueva red, pero muchos usuarios todavía ignoran que existe. Tenga en cuenta que debe seleccionar la opción Agregar si tiene la intención de fusionar los nodos. En ese caso, cuando un nodo importado tiene el mismo Id que uno ya presente, los nuevos datos del nodo anularán el anterior.



Más información


Eche un vistazo a la lista completa de mejoras allí:
https://github.com/gephi/gephi/releases/tag/v0.9.2


¿Cómo obtengo este lanzamiento?


Si tiene un Gephi reciente, la actualización se le propondrá automáticamente
Si tiene una versión anterior (0.8 o anterior), debe descargarla e instalarla manualmente.
Esta actualización se puede descargar de http://gephi.org