lunes, 3 de febrero de 2020

Redes de co-citas y política en el libro 1984 de Orwell

Rastreando las redes de 1984




Varios amigos y colegas me preguntaron si publicaría mi charla de MLA 2016 en redes en 1984 de George Orwell, y estoy feliz de hacerlo. Es una especie de post-script orientado a las humanidades digitales para mi primer libro recientemente completado, y es un intento de describir cómo la teoría de la red de actores, en lugar de un paradigma crítico de Foucault, terminó informando el método para ese proyecto de libro. El panel, "Redes literarias y científicas", organizado por John Savarese, también ofreció una buena oportunidad para intentar adaptar las redes de citas generadas computacionalmente que he adaptado muy ligeramente de Neal Caren y Kieran Healy a través de Jonathan Goodwin. (Los detalles técnicos sobre esa adaptación siguen al final. Este es también, para el registro, un documento que trunqué sustancialmente en la entrega).

Biopolítica y redes de actores

En mi próximo libro, “Human Programming: Brainwashing, Automatons, and American Unfreedom,” ("Programación humana: lavado de cerebro, autómatas y falta de libertad estadounidense"), estaba mirando la red literaria, científica y política de discursos asociados con el control mental y la falta de libertad. ¿Cómo el cambio científico, comencé preguntando, afecta cómo pensamos acerca de lo que son la libertad y la falta de libertad en el siglo XX? ¿Qué papeles han jugado la literatura y la ciencia en la producción de las imágenes de "falta de libertad" que hemos asociado con el totalitarismo, el fundamentalismo y otros enemigos de la democracia? Rápidamente descubrí que la imagen de lo que Erich Fromm llamaba el "autómata humano", el sujeto totalitario como humano reducido a una máquina, flotaba entre discursos literarios y científicos de una manera que me pareció sorprendentemente omnidireccional.

Parece que vale la pena enfatizar esa omnidireccionalidad, como muchos de 20th-C. La investigación en literatura y ciencia con la que estoy familiarizado enfatiza cómo el texto literario procesa internamente paradigmas y enfoques científicos. A menudo, el texto y el autor juntos hacen una crítica de una práctica o mentalidad científica (esta o aquella comprensión del entorno, de la mente, del cuerpo discapacitado, del gen, etc.) o el texto se involucra en una ciencia ficción. extrapolación de esta o aquella trayectoria de ciencia ficción, que el crítico rellena, para ampliar su dimensión crítica.

Al leer los debates recientes sobre métodos de lectura y crítica (incluidos Los límites de la crítica de Rita Felski y varios trabajos de Bruno Latour) me he estado preguntando hasta qué punto la crítica en una vena foucaultiana ha sido una presencia dominante en el subcampo de literatura y ciencia en el siglo veinte. Particularmente cuando enfatizamos la ciencia como disciplina, en el sentido de gobernar, normalizar, o del conocimiento científico como biopoder, nos ponemos en peligro de reproducir una división de dos culturas, en la que encontramos a la ciencia como algo deshumanizante e instrumental, y crítico o el propio texto literario como resistiendo esa fuerza a través de gestos de desenmascaramiento. (Tal división entre lo humano y lo inhumano, figurada en la postura del crítico fuera de un régimen biopolítico que de otro modo sería total, a menudo es prestada de segunda o tercera mano, encontré en mi investigación, desde la retórica de la era de la Guerra Fría sobre la democracia humana y el totalitarismo autómata .)

Si bien no creo que la crítica se haya "agotado", y aunque creo que todavía hay ejemplos útiles y necesarios de tal crítica en este subcampo y en otros, también me he encontrado en busca de alternativas y nuevas modos de hablar sobre el impacto político y científico de los textos literarios, aparte de su poder para criticar diversas formas de biopoder científicamente habilitado. El último enfoque parecía particularmente inadecuado para mi propio objeto de estudio, que trataré de describir a través del ejemplo de 1984.

La teoría de la red de actores de Bruno Latour, para mí como para muchos otros, ha sido útil para señalar nuevas direcciones. Un buen estudio sociológico, escribe, es uno que "traza una red", y ha sido interesante pensar en lo que eso podría significar para los estudios literarios y para estudiar literatura y ciencia en el siglo XX. Felski sugiere de manera interesante, basándose en el trabajo de Latour sobre actores no humanos, que entendemos las obras literarias como tales "actantes": mediadores dentro de nuestras redes de intercambio de ideas, imágenes y estilos de pensamiento.

Al tratar de sentir este enfoque, aprendemos algo sobre las redes y sobre la agencia de los textos literarios, es decir, si y cómo pasar de un paradigma foucaultiano, o mejor, polo o fin de un espectro de prácticas, a un El polo de Latourian (una teoría biopolítica de una teoría de la red de actores de las culturas de la ciencia) realmente marca la diferencia en lo que hacemos y cómo. (Y de nuevo, creo que hay trabajos fabulosos que ya hacen esto: Contagious: Cultures, Carriers, and the Outbreak Narrative de Priscilla Wald (Duke, 2008) es un excelente ejemplo de un trabajo de rastreo de redes que ha servido como modelo metodológico para yo.) Esa es la gran pregunta que motiva esta charla; mi respuesta provisional es que cambia sutilmente cómo hablamos sobre el impacto político de los textos literarios.

Redes de 1984

El 1984 de Orwell tiene dos fuentes científicas bien conocidas: una en el experimento "Little Albert" de B.F. Skinner que Orwell adapta y adorna fuertemente en la escena climática de tortura de la novela que involucra ratas. El segundo es, como lo han señalado los biógrafos de Orwell, lingüístico, en el entusiasmo de Orwell por un lenguaje similar al esperanto y en su adopción, a través del concepto de "NewSpeak", de la hipótesis de Sapir-Whorf en donde el lenguaje da forma y limita la visión o ideología del hablante. . Con respecto a ambos, Orwell escribe con un espíritu opositor contra la tecnocracia de mediados del siglo XX, de una manera que creo que ha sido influyente. Pero mucho más interesante para mí es la red de literatura y ciencia que llega a la estela de la novela. Sabía algo de la "huella" de las ideas e imágenes de 1984 antes de entrar en mi proyecto más amplio, pero seguía apareciendo y su adaptabilidad parecía no tener fin. Es el plano completo para textos que incluyen THX 1138 de George Lucas, Diamond Dogs de David Bowie y el anuncio más famoso y más absurdo de Apple, del Superbowl de 1984.


Anuncio de "1984" de Apple para Macintosh

Más sustancialmente, la novela de Orwell también participó en la cultura política de Estados Unidos. Merece la mención de George Kennan, el arquitecto principal de la Guerra Fría, quien dijo en 1953: "Cuando trato de imaginarme el totalitarismo como un fenómeno general, lo que me viene a la mente de manera más destacada no es ni la imagen soviética ni la imagen nazi como Los he conocido en carne y hueso, sino más bien las imágenes ficticias y simbólicas creadas por personas como Orwell o Kafka o Koestler o los primeros satíricos soviéticos ". 1984 fue una inspiración para Edward Hunter, el hombre de la CIA que acuñó el término" lavado de cerebro " para describir la reforma del pensamiento chino y la psicología de los prisioneros de guerra de Corea. ("Lavado de cerebro" también, como lo trazo en mi libro, ha flotado entre discursos científicos y narraciones populares y legales desde entonces). Y el lenguaje introducido en 1984, en palabras como "Gran Hermano" y "Crimen de pensamiento", ha sido infinitamente adaptado en retórica a la izquierda y derecha políticas con sorprendente consistencia. Los académicos de extrema derecha David Horowitz y David Spencer fueron coautores de un libro titulado Islamophobia: Thought Crime of a Totalitarian Future (David Horowitz Freedom Center, 2011) que imagina, como hacen muchos expertos de derecha, que la corrección política es en sí misma un totalitario. o imposición tecnocrática de limitaciones en el lenguaje y el pensamiento.


Retórica de la novela de Orwell adaptada por la extrema derecha estadounidense.

Cuando se piensa en este tipo de huella para una obra, es un momento en el que la lectura atenta para encontrar (lo que presumo que es) su "significado real" y su "política real" dentro de sus profundidades, para mostrar el trabajo autónomo y completo de El arte tiene su propia voz crítica: parece ser precisamente la estrategia equivocada. 1984 está más vivo como una colección de imágenes poderosas y estrategias retóricas que deambulan libremente por el mundo, a través de una red de archivos adjuntos a menudo flojos para los lectores. (Así es como la noción del texto como "actante" tiene sentido para mí).

Para mi sorpresa, mientras continuaba con esta investigación descubrí que 1984 también es un texto que se abrió paso en el discurso científico y académico, y ofreció estrategias científicas para comunicar ideas y hacer que sus consecuencias políticas sean vívidas. En mi investigación sobre las ideas de libertad y no libertad, Orwell y 1984 siguieron apareciendo, a veces como shorthands o por puntos de analogía, pero aún así, de manera bastante consistente, e incluso entonces, el trabajo en sí parecía sorprendentemente presente en los trabajos sobre totalitarismo y control del pensamiento. que estaba leyendo, no solo en sociología y ciencias políticas, sino también en psiquiatría y psicología: La reforma del pensamiento de Robert Jay Lifton y Thought Reform and the Psychology of Totalism, la violación de la mente de Joost Meerloo, el testimonio de expertos en cultos y las discusiones populares sobre fundamentalismo, también, tenía referencias a Orwell y 1984.

Si bien mi libro no pasa mucho tiempo con Orwell, comencé a preguntarme cómo se podría estudiar esta huella o red de Orwell en las ciencias de manera más sistemática, que es lo que pensaré para el resto del artículo de hoy.

Como anécdota, 1984 no parece ser un texto que se lea o enseñe terriblemente a nivel universitario, a pesar de haber sido un libro muy popular. Permanece (de nuevo anecdóticamente) en los planes de estudio de inglés de la escuela secundaria en los EE. UU., Y fue un libro del Club del Libro del Mes en su lanzamiento. Tengo la sensación de que el libro es casi demasiado sencillo, o demasiado simple en su mensaje antitotalitario, como para justificar una gran explicación por parte de los críticos literarios, una serie de ensayos y volúmenes interesantes y un Cambridge Companion a pesar de ello. (Los casos en los que un libro claramente influyente no se estudia mucho, creo que puede ser esclarecedor, sobre qué tipos de diferenciación o distinción circunscriben en silencio nuestras elecciones de lo que funciona estudiar y lo que vale la pena estudiar sobre ellos).

A pesar de tener este sentido, nada podría haberme preparado para ver una lista de los artículos más citados con "Orwell" en su título o resumen, de la base de datos de citas estándar de la industria de Web of Science. Aunque no es del todo exhaustivo en sus listas de revistas de humanidades, todavía fue una sorpresa que los 5 artículos más citados sobre Orwell no fueran de estudios literarios en absoluto: eran de The British Journal of Sociology (321 citas), Stanford Law Review (71), Language (32), American Scientist (12) y Computers and the Humanities (11). El Cambridge Companion to George Orwell fue el número 6, y Web of Science encontró 9 citas de él. Le siguieron otros artículos de estudios literarios, estudios de gestión, geografía, psicoanálisis, ciencias políticas y políticas públicas entre los 20 primeros.

Luego decidí buscar solo artículos en Web of Science que citan 1984, y luego los ordené por la frecuencia con la que fueron citados. Mi resultado principal allí, al que volveré, fue de The Journal of Management Studies, erróneamente faltante en la tabla anterior, pero citado 388 veces (incluyendo ser citado por uno de los mejores resultados en la otra tabla). Es de Hugh Willmott, titulado "La fuerza es la ignorancia, la esclavitud es la libertad: gestionar la cultura en las organizaciones modernas". Volveremos a ello.

Quería obtener una imagen más sistemática y completa, basada en los datos encontrados en Web of Science, de cómo era la huella de Orwell. Terminé decidiendo adaptar una estrategia digital indirecta para hacerlo. Las redes de citas son un método que he tomado prestado aquí de Dan Wang, Neal Caren, Kieran Healy y Jonathan Goodwin. (También me han inspirado las estrategias relacionadas en el trabajo de Andrew Goldstone, Ted Underwood, Hoyt Long, Richard So y Ed Finn). Han estado utilizando estas visualizaciones para dar instantáneas empíricas de diferentes revistas y campos, según lo que pensadores u obras se citan juntas con mayor frecuencia y en qué grupos. Así es como se ve, y puede hacer clic para ver la versión dinámica y arrastrable:


Una red de cocitación para obras que citan 1984

Decidí adaptar su modelo de alguna manera para mirar todos los textos que citan 1984. Debido a que está usando la cita de otros de una amplia variedad de otras obras, concebiblemente de cualquier período de tiempo, esta imagen enfáticamente no muestra un estudio de influencia. En cambio, lo que obtenemos es una especie de cuadro lúdico de lo que estoy llamando (porque lo hago a mediados de siglo en EE. UU.) "Compañeros de viaje" de Orwell: vemos aquí regiones con otros pensadores cuyo trabajo se utiliza junto con el de Orwell en diferentes campos y en diferentes temas Puede permitirnos explorar los diferentes tipos de usos académicos de 1984, desde la lingüística hasta la filosofía, la ciencia política y la sociología, la psicología y otros pequeños grupos, como la antropología, que amenazan con flotar fuera de la pantalla aquí. Esto resultó ser menos directamente informativo de lo que esperaba, porque los trabajos más citados y más centrales aquí tienden a ser de gran importancia interdisciplinaria. Entonces vemos menos separación por disciplina de lo que esperaba. No obstante, sigue siendo una herramienta o enfoque potencialmente útil para otras ficciones literarias, para observar las diferentes cohortes de pensadores con los que los académicos los ponen en conversación. (Esto podría complementar el interesante trabajo de Ed Finn en una línea similar sobre las formas en que los autores se citan juntos en las reseñas de libros). Los estudios de otros autores con esto podrían variar desde lo potencialmente fascinante (¿Toni Morrison?) Hasta lo más ciertamente deprimente (Ayn Rand).

Si bien la red de co-citas puede servir en el futuro (y para otros textos) como una especie de dispositivo de descubrimiento, en realidad fue solo el artículo más citado lo que más me fascinó, "La fuerza es la ignorancia, la esclavitud es la libertad: gestión de la cultura" de Willmott en organizaciones modernas. El artículo describe críticamente lo que llama "culturismo corporativo": el poder blando de promover la "cultura", desde la jerga del logro hasta el valor del retiro corporativo, en RRHH y teoría de la gestión. El artículo cita a Foucault, Marx, Weber, David Harvey, el filósofo Alisdair Macintyre y muchos otros, además de figuras de su propia disciplina de la escuela de negocios. Pero lo más interesante para mí obviamente es el papel central de 1984: las citas frecuentes de Orwell ofrecen una forma de estructurar el argumento durante toda la primera mitad del artículo. Sostengo que la función principal de Orwell es como una especie de puente retórico: Orwell se despliega hacia lo que imagino que es un lector de revisión por pares en una disciplina que bien podría haber sido resistente a Marx o Foucault. La acusación de Willmott de que sus pares de la teoría de la gestión están utilizando doble discurso, en mi hipótesis, alentaría a los lectores que podrían ser resistentes a las estrategias de lectura sintomáticas a participar en ellos. La táctica de acusar a estos culturistas corporativos de ser como el Partido es asombrosamente exitosa, especialmente dada la frecuencia con que se ha citado el artículo. ¿Y hay algo en lo que los estadounidenses puedan estar de acuerdo más que nuestro deseo de no ser el Partido de Orwell y el deseo de no gustar a quien se les parezca? El consenso que he visto en mi investigación ha sido sorprendente.

Y así, aunque termina siendo sutil, para mí el impacto político de 1984 reside en la forma en que ha moldeado, y continúa formando debates populares y, a veces, científicos sobre el poder. (Y, como observó Katie Fitzpatrick en una conversación después del panel, la literatura es la fuente de una cantidad sorprendente de nuestro vocabulario para hablar sobre estructuras sociales, desde el dickensiano hasta el kafkaesco y el orwelliano).

Detalles digitales:

Primero encontré grafos de cocitas como una herramienta de descubrimiento en esta publicación de Jonathan Goodwin en su blog personal. Vincula a varios ejemplos de su uso y las diferentes adaptaciones que Goodwin hizo, y al código original de Caren para generar el diagrama de diseño de fuerza d3.js. Puede encontrar un ejemplo completamente elaborado del trabajo de Goodwin en una sola revista en el sitio de Signs @ 40 para la revista Signs.

Caren, Healy y Goodwin hicieron una búsqueda en la Web of Science a través de revistas completas; en cambio, mis búsquedas fueron "Orwell" en las entradas bibliográficas de los artículos. Aunque inicialmente pensé que podría modificar sustancialmente el código, solo hice un cambio en el código de Caren, que consistía en extraer solo los nombres de las entradas seleccionadas, en lugar del nombre y el año, y luego bajar los umbrales para que las entradas solo tuvieran que ser citados juntos dos veces para aparecer juntos. (Esto fue necesario porque tenía un conjunto de datos más difuso con menos citas compartidas). Terminé simplemente usando sed (la línea de comando "buscar y reemplazar") para eliminar todas las entradas creadas por Orwell (cuya presencia haría que el grafo sea adecuado) , si no es informativo, tipo panóptico) directamente dentro del archivo de texto, que luego lee el script de Python. Web of Science extrae una gran cantidad de datos, por lo que sería posible colorear entradas por disciplina compartida en lugar de por algoritmo de detección de la comunidad, para dimensionar los nodos de acuerdo con varios criterios. Una vez más, pretendía que este grafo de cocitación fuera más una prueba de concepto lúdica que mostrar algo concluyente, y estaría emocionado de ver a otros llevar este tipo de trabajo en nuevas direcciones.

domingo, 2 de febrero de 2020

Sobre las redes sociales de Sócrates

Seis grados de Sócrates: las redes sociales de los antiguos griegos

AIA Central Arizona Society




Título: Seis grados de Sócrates: las redes sociales de los antiguos griegos
Ponente: Diane Harris Cline, Universidad George Washington
Cuándo y dónde: jueves 27 de febrero de 2020, 6pm, campus de ASU Tempe, edificio ART, sala 246



En esta conferencia ricamente ilustrada, utilizamos el Análisis de redes sociales (ARS) para examinar las redes sociales del siglo V a. C. en Atenas, incluidos Pericles, Sócrates, los alfareros y pintores de Atenas, los trabajadores que construyeron el Partenón y más. El ARS es una herramienta analítica relativamente nueva que se puede aplicar cuando uno quiere ver las relaciones en una red, desde lugares hasta cosas y personas, y que utiliza datos de arqueología, epigrafía o textos antiguos. Los resultados se pueden mostrar dramáticamente en imágenes que arrojan nueva luz sobre nuestra comprensión: aprendemos, por ejemplo, que los antiguos griegos tenían redes sociales estrechas que ayudaron a difundir rápidamente nuevas ideas y que contribuyeron a la creatividad e innovación para las que ahora están justificadamente famoso.



Diane Harris Cline es profesora asociada de historia y clásicos de la Universidad George Washington, donde recibió varios premios de enseñanza. Tiene sus títulos de la Universidad de Princeton (Ph.D.) y la Universidad de Stanford, y ha sido dos veces becaria Fulbright. Sus áreas de especialización son la historia de la antigua Grecia, las redes sociales y la epigrafía: “Estudio la innovación y la creatividad en la Atenas clásica a través de las redes sociales. Mi investigación implica la aplicación de la metodología de Análisis de redes sociales a la historia social de la antigua Grecia ". En 2016, el Dr. Cline publicó The Greeks: An Illustrated History de National Geographic, y los artículos recientes incluyen" La red social de Sócrates "(Boletín de investigación de CHS 7, 2019).


Para un versión imprimible del flyer, Haga clic aquí

lunes, 27 de enero de 2020

20 años de redes de coautorías y bibliográficas sobre ciencia de redes

Veinte años de ciencia de redes: un análisis de red bibliográfico y de coautoría

Roland Molontay, Marcell Nagy
arXiv.org > physics > arXiv:2001.09006
PDF



Hace dos décadas, tres artículos pioneros dirigieron la atención a redes complejas e iniciaron una nueva era de investigación, estableciendo un campo interdisciplinario llamado ciencia de redes. Es decir, estos documentos fundamentales altamente citados fueron escritos por Watts & Strogatz, Barabási & Albert y Girvan & Newman en redes de mundo pequeño, en redes sin escala y en la estructura comunitaria de redes complejas, respectivamente. En los últimos 20 años, debido a la naturaleza multidisciplinaria del campo, ha surgido una comunidad científica de redes diversa pero no dividida. En este artículo, investigamos cómo esta comunidad ha evolucionado con el tiempo con respecto a la velocidad, la diversidad y la naturaleza interdisciplinaria como se ve a través de la creciente red de coautoría de científicos de la red (aquí la noción se refiere a un académico con al menos un artículo que cita al menos uno de los tres documentos de hitos mencionados anteriormente). Después de proporcionar un análisis bibliográfico de 31,763 documentos científicos de redes, construimos la red de coautoría de 56,646 científicos de redes y analizamos su topología y dinámica. Explicamos los patrones de colaboración de los últimos 20 años de ciencia de redes al investigar numerosas propiedades estructurales de la red de coautoría y al usar técnicas mejoradas de visualización de datos. También identificamos los autores más centrales, las comunidades más grandes, investigamos los cambios espacio-temporales y comparamos las propiedades de la red con los indicadores cienciométricos.


lunes, 13 de enero de 2020

11 consejos de cómo lidiar con grandes conjuntos de datos

Once consejos para trabajar con grandes conjuntos de datos

Los grandes datos son difíciles de manejar. Estos consejos y trucos pueden allanar el camino.
Anna Nowogrodzki



Ilustración de The Project Twins
Versión PDF
Nature


Los grandes datos están en todas partes en la investigación, y los conjuntos de datos son cada vez más grandes y más difíciles de trabajar. Desafortunadamente, dice Tracy Teal, es un tipo de trabajo que con demasiada frecuencia queda fuera de la capacitación científica.

"Es una mentalidad", dice Teal, "tratando los datos como un ciudadano de primera clase". Ella debe saber: Teal fue hasta el mes pasado el director ejecutivo de The Carpentries, una organización en Oakland, California, que enseña habilidades de codificación y datos a investigadores a nivel mundial. Ella dice que existe una tendencia en la comunidad de investigación a descartar el tiempo y el esfuerzo necesarios para administrar y compartir datos, y no considerarlos como una parte real de la ciencia. Pero, sugiere, "podemos cambiar nuestra mentalidad para valorar ese trabajo como parte del proceso de investigación", en lugar de tratarlo como una ocurrencia tardía.

Aquí hay 11 consejos para aprovechar al máximo sus grandes conjuntos de datos.

Aprecia tus datos


"Mantenga sus datos en bruto sin procesar: no los manipule sin tener una copia", dice Teal. Recomienda almacenar sus datos en algún lugar que cree copias de seguridad automáticas y que otros miembros del laboratorio puedan acceder, respetando las normas de su institución sobre consentimiento y privacidad de datos.

Debido a que no necesitará acceder a estos datos con frecuencia, dice Teal, "puede usar las opciones de almacenamiento donde puede costar más dinero acceder a los datos, pero los costos de almacenamiento son bajos", por ejemplo, el servicio Glacier de Amazon. Incluso podría almacenar los datos en bruto en discos duros duplicados guardados en diferentes ubicaciones. Los costos de almacenamiento para archivos de datos grandes pueden acumularse, por lo que debe presupuestar en consecuencia.

Visualiza la información

A medida que los conjuntos de datos se hacen más grandes, surgen nuevas arrugas, dice Titus Brown, un bioinformático de la Universidad de California, Davis. "En cada etapa, te encontrarás con un nuevo y emocionante comportamiento desordenado". Su consejo: "Haz muchos gráficos y busca valores atípicos". En abril pasado, uno de los estudiantes de Brown analizó los transcriptomes: el conjunto completo de Moléculas de ARN producidas por una célula u organismo: a partir de 678 microorganismos marinos como el plancton (LK Johnson et al. GigaScience 8, giy158; 2019). Cuando Brown y su alumno registraron los valores promedio de la duración de la transcripción, la cobertura y el contenido genético, notaron que algunos valores eran cero, lo que indica dónde había fallado el flujo de trabajo computacional y había que volver a ejecutarlo.

Muestra tu flujo de trabajo

Cuando el físico de partículas Peter Elmer ayuda a su hijo de 11 años con su tarea de matemáticas, tiene que recordarle que documente sus pasos. "Él solo quiere escribir la respuesta", dice Elmer, quien es director ejecutivo del Instituto de Investigación e Innovación en Software para Física de Alta Energía en la Universidad de Princeton en Nueva Jersey. Los investigadores que trabajan con grandes conjuntos de datos pueden beneficiarse del mismo consejo que Elmer le dio a su hijo: "Mostrar su trabajo es tan importante como llegar al final".

Esto significa registrar todo su flujo de trabajo de datos, qué versión de los datos que utilizó, los pasos de limpieza y control de calidad y cualquier código de procesamiento que ejecutó. Dicha información es invaluable para documentar y reproducir sus métodos. Eric Lyons, biólogo computacional de la Universidad de Arizona en Tucson, utiliza la herramienta de captura de video asciinema para registrar lo que escribe en la línea de comando, pero las soluciones de baja tecnología también pueden funcionar. Un grupo de sus colegas, recuerda, tomó fotos de la pantalla de su computadora y las publicó en el grupo del laboratorio en Slack, una plataforma de mensajería instantánea.

Usar control de versiones

Los sistemas de control de versiones permiten a los investigadores comprender con precisión cómo ha cambiado un archivo con el tiempo y quién realizó los cambios. Pero algunos sistemas limitan el tamaño de los archivos que puede usar. Harvard Dataverse (que está abierto a todos los investigadores) y Zenodo se pueden usar para el control de versiones de archivos grandes, dice Alyssa Goodman, astrofísica y especialista en visualización de datos en la Universidad de Harvard en Cambridge, Massachusetts. Otra opción es Dat, una red gratuita de igual a igual para compartir y versionar archivos de cualquier tamaño. El sistema mantiene un registro a prueba de manipulaciones que registra todas las operaciones que realiza en su archivo, dice Andrew Osheroff, desarrollador principal de software en Dat en Copenhague. Y los usuarios pueden ordenar al sistema que archive una copia de cada versión de un archivo, dice la gerente de producto de Dat, Karissa McKelvey, con sede en Oakland, California. Dat es actualmente una utilidad de línea de comandos, pero "hemos estado actualizando activamente", dice McKelvey; El equipo espera lanzar un front end más fácil de usar a finales de este año.

Grabar metadatos

"Sus datos no son útiles a menos que las personas, y" el futuro ", sepan cuáles son", dice Teal. Ese es el trabajo de los metadatos, que describen cómo se recopilaron, formatearon y organizaron las observaciones. Considere qué metadatos registrar antes de comenzar a recopilar, Lyons aconseja, y almacene esa información junto con los datos, ya sea en la herramienta de software utilizada para recopilar las observaciones o en un archivo README u otro archivo dedicado. El Proyecto Open Connectome, dirigido por Joshua Vogelstein, un neuroestadístico de la Universidad Johns Hopkins en Baltimore, Maryland, registra sus metadatos en un formato de texto plano estructurado llamado JSON. Cualquiera que sea su estrategia, trate de pensar a largo plazo, dice Lyons: algún día querrá integrar sus datos con los de otros laboratorios. Si eres proactivo con tus metadatos, esa integración será más fácil en el futuro.

Automatizar, automatizar, automatizar

Los grandes conjuntos de datos son demasiado grandes para peinarlos manualmente, por lo que la automatización es clave, dice Shoaib Mufti, director senior de datos y tecnología del Instituto Allen para la Ciencia del Cerebro en Seattle, Washington. El equipo de neuroinformática del instituto, por ejemplo, utiliza una plantilla para los datos de las células cerebrales y la genética que acepta información solo en el formato y tipo correctos, dice Mufti. Cuando llega el momento de integrar esos datos en una base de datos o colección más grande, los pasos de garantía de calidad de datos se automatizan usando Apache Spark y Apache Hbase, dos herramientas de código abierto, para validar y reparar datos en tiempo real. "Nuestro conjunto completo de herramientas de software para validar e ingerir datos se ejecuta en la nube, lo que nos permite escalar fácilmente", dice. El Proyecto Open Connectome también proporciona garantía de calidad automatizada, dice Vogelstein: esto genera visualizaciones de estadísticas resumidas que los usuarios pueden inspeccionar antes de continuar con sus análisis.

Haga que el tiempo de computación cuente

Grandes conjuntos de datos requieren informática de alto rendimiento (HPC), y muchos institutos de investigación ahora tienen sus propias instalaciones de HPC. La Fundación Nacional de Ciencias de EE. UU. mantiene la red nacional HPC XSEDE, que incluye la red de computación basada en la nube Jetstream y los centros HPC en todo el país. Los investigadores pueden solicitar asignaciones de recursos en xsede.org y crear cuentas de prueba en go.nature.com/36ufhgh. Otras opciones incluyen la red ACI-REF con sede en EE. UU., NCI Australia, la Asociación para la Computación Avanzada en Europa y las redes ELIXIR, así como proveedores comerciales como Amazon, Google y Microsoft.

Pero cuando se trata de computación, el tiempo es dinero. Para aprovechar al máximo su tiempo de computación en los clústeres GenomeDK y Computerome en Dinamarca, Guojie Zhang, investigador de genómica de la Universidad de Copenhague, dice que su grupo generalmente realiza pruebas a pequeña escala antes de migrar sus análisis a la red HPC. Zhang es miembro del Proyecto de Genomas de Vertebrados, que busca ensamblar los genomas de unas 70,000 especies de vertebrados. "Necesitamos millones o incluso miles de millones de horas informáticas", dice.

Captura tu entorno

Para replicar un análisis más tarde, no necesitará la misma versión de la herramienta que utilizó, dice Benjamin Haibe-Kains, farmacogenómico computacional en el Centro de Cáncer Princess Margaret en Toronto, Canadá. También necesitará el mismo sistema operativo y las mismas bibliotecas de software que requiere la herramienta. Por esta razón, recomienda trabajar en un entorno informático autónomo, un contenedor Docker, que se puede ensamblar en cualquier lugar. Haibe-Kains y su equipo utilizan la plataforma en línea Code Ocean (que se basa en Docker) para capturar y compartir sus entornos virtuales; Otras opciones incluyen Binder, Gigantum y Nextjournal. "Diez años a partir de ahora, aún podría ejecutar esa tubería exactamente de la misma manera si lo necesita", dice Haibe-Kains.

No descargue los datos.

Descargar y almacenar grandes conjuntos de datos no es práctico. Los investigadores deben ejecutar análisis de forma remota, cerca de donde se almacenan los datos, dice Brown. Muchos proyectos de big data usan Jupyter Notebook, que crea documentos que combinan código de software, texto y figuras. Los investigadores pueden "girar" dichos documentos en o cerca de los servidores de datos para realizar análisis remotos, explorar los datos y más, dice Brown. Brown dice que Jupyter Notebook no es particularmente accesible para los investigadores que podrían sentirse incómodos usando una línea de comando, pero hay plataformas más fáciles de usar que pueden cerrar la brecha, incluidas Terra y Seven Bridges Genomics.

Empezar temprano

La gestión de datos es crucial incluso para los investigadores jóvenes, así que comience su entrenamiento temprano. "Las personas sienten que nunca tienen tiempo para invertir", dice Elmer, pero "a la larga se ahorra tiempo". Comience con los conceptos básicos de la línea de comandos, más un lenguaje de programación como Python o R, lo que sea más importante para su campo, dice. Lyons está de acuerdo: "Paso uno: familiarizarse con los datos de la línea de comandos". En noviembre, algunos de sus colaboradores que no dominaban el uso de la línea de comandos tuvieron problemas con los datos genómicos porque los nombres de los cromosomas no coincidían en todos sus archivos, Dice Lyons. "Tener algunas habilidades básicas de línea de comandos y programación me permite corregir rápidamente los nombres de los cromosomas".

Consigue ayuda


La ayuda está disponible, en línea y fuera de ella. Comience con el foro en línea Stack Overflow. Consulte a los bibliotecarios de su institución sobre las habilidades que necesita y los recursos que tiene disponibles, aconseja Teal. Y no descarte la capacitación en el sitio, Lyons dice: "The Carpentries es un excelente lugar para comenzar".

sábado, 28 de diciembre de 2019

Esculturas de redes de realidad aumentada


Esculturas de red aumentadas

Agoston Nagy || Startup




Su artículo presenta una colaboración continua entre la Universidad de Arte y Diseño Moholy-Nagy (Budapest, H) y Barabasi Lab (Boston, EE. UU.). El objetivo del proyecto es unir redes espaciales físicas impresas en 3D con sus correspondientes capas de información de fondo utilizando la realidad aumentada. Dado que un modelo virtual está alineado con la escultura de red impresa real, la audiencia puede revelar capas de información navegando sobre diferentes capas de la realidad: interactuando con un dispositivo móvil táctil en su pantalla, pero también, navegando en el espacio real moviéndose El dispositivo alrededor. Usando los sensores de movimiento integrados, el giroscopio y la imagen de la cámara en tiempo real, el resultado es una experiencia de realidad mixta, donde la información digital en capas se conecta a la escultura de red física real.

Un taller


Después de una lluvia de ideas inicial con el científico de redes László Albert Barabási, comenzamos el proyecto con un taller en el campus MOME con Mihály Minkó, donde se invitó a diseñadores, artistas, ingenieros y personas de diferentes campos de las humanidades. Estábamos investigando formas de cómo podemos mezclar el lenguaje de la realidad aumentada con los problemas de visualización de la red. Se dieron dos conferencias teóricas como punto de partida, que abordan las taxonomías de la realidad aumentada (y sus correspondientes modelos cognitivos de las diferentes modalidades del espacio) y la topología de la red: visualización, comprensión de las estructuras de redes complejas y sin escala.


Algunas diapositivas de la conferencia.

El pensamiento colaborativo, los ajustes y la cultura del bricolaje también son una parte crucial de la metodología de nuestro taller, por lo que obtuvimos algunos componentes de plástico que consisten en bloques de construcción simples para ensamblar diferentes sistemas moleculares, y los participantes tuvieron que construir redes simplificadas por su cuenta. Las instrucciones se basaron en algunos datos extremadamente filtrados y limitados que obtuvieron en sus manos, sentados alrededor de una mesa, construyendo el objeto juntos, independientemente de sus antecedentes profesionales. Esta forma de diseño colaborativo abre conversaciones significativas, invoca varias preguntas sobre el tema que el grupo está investigando. Como resultado del taller, obtuvimos algunas ideas interesantes sobre los conceptos de navegación dentro de la realidad aumentada, también tuvimos una experiencia de primera mano sobre cómo se pueden crear redes, nodos y sus enlaces.

Diferentes conceptos espaciales para la realidad aumentada portátil

Dado que las redes son estructuras abstractas en sí mismas, visualizarlas en otro modelo abstracto (realidad aumentada) es aún más desafiante, estamos construyendo algo que ninguno de nosotros había experimentado antes.

Hasta aquí todo bien. Parece que

Los métodos de comprensión de redes y relaciones complejas se pueden aprender y comprender mejor si tenemos experiencia práctica con respecto a una estructura (construcción, combinación, reestructuración de partes y piezas) además de leer teorías y conceptos abstractos solamente.



Colocar contenido virtual en una red física simple

La realidad aumentada es un campo emergente de comunicación visual, que tiene mucho potencial, lo que significa que también necesita mucha experimentación práctica. Como el paradigma computacional donde la fusión del espacio real y los algoritmos comenzaron con la navegación náutica, nuestro tiempo también está lidiando con el mismo paradigma con nuevos métodos. Hoy en día, las personas tienen que combinar el espacio físico real con capas de contenido virtual: estos son los conceptos básicos de la computación consciente del espacio, donde tenemos que construir el lenguaje para la próxima era del diseño computacional.

Contar historias significativas dentro de este espacio híbrido es un concepto muy novedoso para creadores de contenido, diseñadores e ingenieros. Comprender el contexto de estos escenarios complejos involucra a personas de diferentes profesiones, incluidos ingenieros, humanidades (literatura, semiótica, etc.), científicos cognitivos, expertos en visualización y, lo que es más importante, expertos que se ocupan de las consecuencias éticas y biológicas de la tecnología, como como inteligencia artificial y diferentes capas de realidad.

Taller de Realidad Aumentada y Ciencia de Redes (MOME, 2019)

Un prototipo

El objetivo de la colaboración entre los dos institutos es encontrar y construir visualizaciones significativas para estas interrelaciones conceptuales entre el espacio, los datos y su representación. Es un viaje interesante para crear una nueva estética basada en datos y redes, donde los conceptos científicos son más fáciles de comprender para las personas que están fuera de los círculos académicos de diseño o comunidades científicas.

Comenzamos a construir un prototipo de iOS en C ++ (OpenFrameworks) que se basa en la plataforma de realidad aumentada de Apple, ARKit. Estamos utilizando puntos de características de la alimentación de la cámara del dispositivo para construir, cargar y guardar coordenadas mundiales que están conectadas a la escultura de la red física. También utilizamos la misma aplicación para representar contenido virtual en la pantalla, usando OpenGL combinado con el Metal de Apple como el procesador gráfico.


Proceso de calibración en el prototipo.

La interfaz de usuario y el ciclo de vida de la aplicación se basan en componentes personalizados, no hay elementos y módulos integrados específicos del sistema operativo que se utilicen, lo que conduce a una portabilidad más fácil y una estrategia de desarrollo multiplataforma a prueba de futuro. El prototipo más tarde se puede portar a la plataforma ARCore de Android u otros sistemas operativos de la próxima industria de realidad montada en la cabeza.

El uso de la aplicación está destinado a ser "consciente del espacio", lo que significa que está utilizando algunos conceptos especiales más allá de las rutinas de navegación convencionales (como tocar, deslizar, pellizcar, etc.). La distancia del objeto físico real juega un papel extremadamente importante en la experiencia.

El concepto de aplicación, transformación de datos, diseño y desarrollo se realiza junto con Mihály Minkó. La aplicación está a punto de ser lanzada en 2020 como una parte integrada de las próximas exhibiciones de diferentes redes y esculturas generativas hechas por Barabasi Lab, esta publicación se actualizará, en consecuencia.

martes, 24 de diciembre de 2019

9 consejos rápidos para analizar datos de red

Nueve consejos rápidos para analizar datos de red


Vincent Miele, Catherine Matias, Stéphane Robin, Stéphane Dray (2019) Nine quick tips for analyzing network data. PLoS Comput Biol 15(12): e1007434.
https://doi.org/10.1371/journal.pcbi.1007434



Introducción

Desde el nivel molecular hasta el ecosistema, un sistema biológico a menudo se puede representar como un conjunto de entidades que interactúan entre sí. Los avances recientes en la tecnología de adquisición de datos (por ejemplo, la secuenciación de alto rendimiento o los dispositivos de seguimiento) abren la oportunidad de cuantificar estas interacciones y exigen el desarrollo de una metodología ambiciosa para abordar estos datos. En este contexto, las redes se utilizan ampliamente en biología, bioinformática, ecología, neurociencia o epidemiología para representar datos de interacción [1]. Una red contiene un conjunto de entidades (los nodos o vértices) que están conectados por bordes (o enlaces) que representan algunas interacciones o relaciones. Estas relaciones pueden observarse directamente o deducirse de los datos sin procesar. El primer caso abarca las redes de interacción proteína-proteína (PPI), en las cuales las interacciones entre 2 proteínas se evalúan experimentalmente, o las interacciones planta-polinizador que se observan directamente en el campo. Las redes reguladoras de genes reconstruidas a partir de datos de expresión génica, las redes de coincidencia deducidas de la abundancia de especies o las redes de contacto social con animales deducidas de las pistas del Sistema de Posicionamiento Global (GPS) son algunos ejemplos del segundo caso. Todavía están surgiendo nuevos tipos de redes (por ejemplo, redes de similitud célula-célula [2], redes Hi-C y redes de similitud de imagen [3]).

Las redes son objetos muy atractivos y se han desarrollado muchos métodos para analizar su estructura. Sin embargo, las redes biológicas a menudo son analizadas por no especialistas, y puede ser difícil para ellos navegar a través de la gran cantidad de conceptos y métodos disponibles. En este documento, proponemos 9 consejos para evitar dificultades comunes y mejorar el análisis de los datos de la red por parte de los biólogos.

Consejo 1: Formule preguntas primero; usar redes más tarde

La teoría de redes está bien establecida y es realmente poderosa, pero no se puede usar como una "caja negra". De hecho, construir una red no debe considerarse como un fin en sí mismo. Recomendamos (1) establecer una lista de preguntas e hipótesis científicas antes de manipular los datos, y luego (2) evaluar si estas preguntas se traducen naturalmente en una serie de análisis de red, en lugar de hacer análisis de red primero y verificar si plantean preguntas después ( de acuerdo con la Regla 1 en [4]). De hecho, generalmente es inmediato representar y modelar los datos con una red, pero es mucho más complicado traducir una pregunta en un análisis basado en la red.

Para este fin, además de integrar el formalismo de la red, es importante adoptar el punto de vista de la red. Se basa en una idea fundamental que hace la fuerza pero también el desafío del modelado de red: cualquier interacción se considera dentro de su contexto, teniendo en cuenta las otras interacciones que ocurren (o no). Desde este punto de vista, cualquier interacción entre 2 nodos se considera no solo en el contexto de otros pares que involucran estos nodos sino también en relación con el patrón de conectividad global. Por ejemplo, la importancia de un límite particular entre 2 genes se evaluará de manera diferente si el gen objetivo es o no un centro (es decir, regulado por muchos genes). Este punto de vista no considera las interacciones como objetos independientes y, por lo tanto, es exactamente lo contrario de examinar el conjunto de interacciones una por una.

Finalmente, obviamente se recomienda verificar si sus preguntas y datos realmente se ajustan al punto de vista de la red antes de realizar cualquier análisis. Si el número de nodos y / o bordes es muy bajo, se puede aplicar el análisis de red, pero los resultados pueden ser decepcionantes porque no hay suficientes interacciones observadas para identificar una estructura en los datos. Por otro lado, aunque cualquier matriz puede verse como una red (1 borde por celda; ver el siguiente consejo), a menudo es más adecuado considerar el uso de métodos que no sean de red dedicados a completar matrices. Por ejemplo, una matriz de correlación, posiblemente vista como una red de correlación, puede analizarse naturalmente con un agrupamiento jerárquico o un análisis de componentes principales. En otras palabras, el análisis de red no es necesariamente la respuesta al analizar una matriz de datos.

Consejo 2: categorice sus datos de red correctamente

Para captar los conceptos y métodos de vanguardia en el campo de las redes, aprender el vocabulario apropiado de la teoría de grafos es un requisito previo [5]. En particular, es importante clasificar su red adecuadamente para asegurarse de aplicar los métodos adecuados. Las diferentes categorías de red para diferentes datos conducen a diferentes enfoques. Los bordes se pueden dirigir (de una fuente a un objetivo), posiblemente incluyendo bucles automáticos (por ejemplo, una proteína que interactúa consigo misma o el canibalismo en las redes alimentarias). Ignorar esta información por simplicidad traicionaría los datos originales. Cuando se trata de bordes que incorporan un valor (un peso), le recomendamos que evite transformar la red en una binaria, sin tener en cuenta los pesos o manteniendo solo los bordes con peso por encima o por debajo de un cierto umbral. De hecho, borra una parte importante de la información disponible porque algunos aspectos de la estructura de la red podrían no ser detectados en la red binarizada [6]. Por lo tanto, sería ingenuo considerar que analizar una red binarizada o la ponderada original es más o menos equivalente. Además, los métodos que manejan redes ponderadas generalmente están disponibles y, por lo tanto, son más apropiados. Sin embargo, en algunos casos, en realidad es útil estudiar las versiones ponderadas y binarias por separado, para poder desenredar 2 efectos que conducen la estructura de la red: interacción (presencia o ausencia) e intensidad (pesos). Por ejemplo, algunos autores han informado que un patrón anidado se observó con frecuencia en redes ecológicas binarizadas pero no en redes ponderadas [7]. Por último, el analista de datos debe ser muy cauteloso ya que, en la literatura y en los métodos disponibles, los pesos se pueden considerar basados ​​en la intensidad (cuanto mayor es el peso, más fuerte es el borde) así como en la distancia (cuanto menor es el peso, cuanto más cerca están los nodos).

Los nodos pueden pertenecer a diferentes categorías, y los bordes solo se pueden permitir entre nodos de diferentes categorías (redes bipartitas, tripartitas y multipartitas; por ejemplo, nodos como anfitriones y parásitos, o como dispersores de plantas, hongos y semillas [8]). Es obligatorio seleccionar métodos que manejen esta particularidad. Por ejemplo, muchos enfoques estadísticos se basan en el número esperado de aristas (por ejemplo, en el cálculo de la modularidad, consulte el Consejo 5), que aquí es claramente diferente en comparación con el caso unipartito.

Finalmente, la información adicional sobre los nodos a menudo está disponible. Por ejemplo, los nodos pueden tener posiciones espaciales (por ejemplo, nodos como parches de hábitat o granjas en 2D y área del cerebro en 3D) o pueden estar asociados a atributos externos (por ejemplo, rasgos de especies en una red alimentaria). Esta información adicional se puede considerar explícitamente en el análisis, ya sea para comprender si contribuye a organizar la red [9] o para buscar alguna estructura restante una vez que se tenga en cuenta su efecto (p. Ej., Efecto espacial [10] o filogenético [11]) . En el primer caso, una alternativa más simple pero subóptima a menudo consiste en utilizar esta información a posteriori en la interpretación de los resultados (por ejemplo, explicando la estructura de las redes genéticas con información espacial [12] o comparando la estructura de la red con los metadatos [13]).

Consejo 3: use un software de análisis de red específico

Una gama de software versátil está dedicada al análisis de redes. Por lo tanto, es una pérdida de tiempo tratar de usar herramientas inespecíficas. Estas herramientas de software pertenecen a 2 categorías distintas que tienen pros y contras: interfaz gráfica de usuario (navegación basada en mouse) y paquetes de software (interfaz de línea de comandos o programación). La primera categoría está dedicada principalmente a la visualización potente e interactiva (ver Consejo 4). Incluye las 2 principales herramientas de software de código abierto, Gephi y Cytoscape, ambas compatibles con una comunidad activa. También ofrecen el cálculo de algunas métricas de red (la elección de una métrica relevante se trata en el Consejo 5). La segunda categoría está dominada por los 2 principales paquetes de red de propósito general, NetworkX e igraph, pero existen muchos paquetes más específicos (por ejemplo, bipartito en R). La visualización basada en navegador [14] surgió recientemente como una categoría intermedia, principalmente basada en una colección de bibliotecas de JavaScript (por ejemplo, Sigma.js).

Dicho esto, le recomendamos encarecidamente que aprenda a programar y escribir su análisis (de acuerdo con los documentos de la colección "Diez reglas simples" sobre habilidades informáticas y reproducibilidad [15, 16]). El manejo del código reproducible mejora la investigación de la red: puede volver a ejecutar sin esfuerzo el análisis completo de una versión modificada de sus datos sin procesar en diferentes conjuntos de datos y compartir el código con otros colegas interesados ​​en el enfoque de modelado. Finalmente, existe un conjunto limitado de formatos de archivo de red comunes (por ejemplo, una lista de adyacencia en el destino de origen del formato) que debe adoptar desde el principio para cambiar fácilmente entre diferentes herramientas de software.

Mientras tanto, el analista de datos debe evitar el uso apresurado de las diferentes funciones implementadas en estas herramientas. Como se subraya en los Consejos 5 y 6, es crucial comprender las métricas y los métodos antes de ejecutar las funciones y seleccionar los apropiados con respecto a las preguntas y los datos disponibles.

Consejo 4: Tenga en cuenta que la visualización de red puede ser útil pero posiblemente engañosa

Un aspecto poderoso de las redes es su capacidad para representar datos complejos en un solo objeto. Por lo tanto, puede ser natural representar redes gráficamente en 2 dimensiones: los nodos se extienden en el plano y los bordes se dibujan en consecuencia, con el objetivo de lograr el diseño más estético e informativo [17]. Antes de continuar, dado que las posiciones de los nodos (denominadas diseño de grafos) en una pantalla de este tipo no son parte de los datos, sino que resultan de una elección o método en particular, alentamos a los biólogos a describir claramente el diseño utilizado en cualquier representación gráfica de un red en publicaciones científicas, especialmente para que sea reproducible.

Los grafos generalmente se consideran una herramienta importante para el análisis exploratorio de datos [18]. Una comunidad de investigación activa propuso una serie de heurísticas (disponibles en las herramientas mencionadas en el Consejo 3) destinadas a obtener una buena vista de la red en un tiempo razonable, a pesar del tamaño creciente de las redes disponibles. Esta tarea aparentemente simple es, de hecho, un problema combinatorio muy difícil y consiste en buscar el diseño óptimo para un conjunto dado de objetivos que a menudo ignoras (por ejemplo, maximizar las atracciones entre los nodos conectados o minimizar los cruces de bordes). Como consecuencia, lo que ves con tus ojos puede ser parcial. De hecho, se requiere un cuidado especial para no sobreinterpretar la visualización de la red al explorar los datos. Por ejemplo, siempre tenga en cuenta que la distancia entre 2 nodos no debe interpretarse como una medida intrínseca de proximidad porque otro algoritmo de visualización podría resultar en una distancia posiblemente muy diferente (ver 2 nodos rojos en la figura 1A-1C). Además, es mejor evitar conclusiones apresuradas basadas únicamente en una visualización de red (por ejemplo, la figura 1C podría sugerir una estructura modular con 3 grupos, mientras que un análisis riguroso de la red podría concluir 5 grupos como se representa en la figura 1D). Por otro lado, si no surge una estructura de una inspección visual de la red en un paso explicativo, no significa que no sea necesario un análisis de red adicional (ver Fig. 2A), especialmente cuando se trata de redes grandes.




Fig. 1. Cuatro visualizaciones de las mismas interacciones de modelado de red entre 64 tejedores sociables [14, 22].

(a – c) Los mismos 2 nodos están coloreados en rojo para mostrar que su distancia varía según el diseño. (a) Diseño aleatorio. (b) Diseño circular en el que el tamaño y la posición de los nodos se definen por su grado. (c) Diseño de Fruchterman y Reingold, que muestra 3 grupos aparentes en la parte superior e inferior derecha e izquierda. (d) Conjunto de diseño de Kamada y Kawai con pesos en los bordes (en rojo) que conectan los 5 grupos obtenidos con el algoritmo de Lovaina (ver Sugerencia 6 y [23] para más detalles). Los grupos están delineados por diferentes colores. Realizado con el paquete R igraph.

https://doi.org/10.1371/journal.pcbi.1007434.g001

Fig. 2. Red sintética con 200 nodos y 700 aristas generadas con un SBM (ver Consejo 6) con 4 grupos de intraconectividad e interconectividad de 0.1 y 0.015, respectivamente.

(a) La visualización de red con diseño Kamada y Kawai no resalta ninguna estructura modular, mientras que existe. (b) Representación de la matriz de adyacencia con ordenación de filas y columnas consistente con los 4 grupos. Realizado con el paquete R igraph. SBM, modelo de bloque estocástico.
https://doi.org/10.1371/journal.pcbi.1007434.g002

Por otro lado, la visualización de red puede ser útil como una forma de ilustrar los resultados de un análisis de red (como se presenta en los Consejos 5 y 6). En este caso, se debe elegir un diseño por su capacidad para resaltar las propiedades de la red (heterogeneidad de grado en la figura 1B) o las conclusiones extraídas por un análisis (figura 1D). Por ejemplo, los nodos pueden posicionarse de acuerdo con los valores de algunas métricas particulares de interés [19]. Sin embargo, una ilustración de red no solo debe ser estética, sino que debe ser informativa sobre los nodos y la estructura de los bordes. Por lo tanto, alentamos al analista a considerar cuidadosamente los mensajes que se transmitirán a través de una ilustración de red. Por ejemplo, es frecuente que las redes ecológicas bipartitas se ilustren con 2 capas apiladas (por ejemplo, en un paquete bipartito); en algunos casos, estas ilustraciones solo resaltan la información de los nodos (en cuántos bordes están involucrados) pero generalmente no muestran la estructura de ningún borde debido a los muchos bordes cruzados inherentes a esta representación.

Por último, también recomendamos considerar la visualización de la matriz de adyacencia como un mapa de calor o una matriz de color (consulte la Fig. 2 en [20] para obtener una explicación). Permite representar la presencia o el peso de los bordes (celdas de colores), pero también tiene la ventaja de resaltar la ausencia de bordes (celdas de matriz en blanco). Esto es particularmente relevante cuando las filas y columnas de la matriz se reordenan de manera informativa (por ejemplo, al aumentar el valor de una métrica [21] o de acuerdo con algunos resultados de agrupamiento; consulte los Consejos 5 y 6 y la Figura 2B).

Consejo 5: Evite el uso ciego de métricas; entender fórmulas en su lugar

Además de las limitaciones de la visualización de red, la descripción de una red también puede (y ventajosamente) consistir en calcular estadísticas resumidas. El principiante encontrará inmediatamente el camino hacia una serie de métricas de red: un número por nodo o borde (métricas locales; por ejemplo, grado) o un número para toda la red (métricas globales; por ejemplo, conexión / densidad o modularidad). Las métricas han proliferado, y se recomienda encarecidamente tomarse un tiempo para leer detenidamente la definición matemática de las métricas que se tienen a mano (ver también el Consejo 9): cuanto más profunda sea la comprensión matemática, más fácil será la interpretación. Por ejemplo, el concepto de centralidad de los nodos va con una gama de métricas de centralidad que tienen diferentes significados. Además, es tan fácil calcular cualquier métrica con las herramientas de software antes mencionadas que a veces puede evitar que el analista verifique sus pros y sus contras. Como ejemplo, al leer la definición de la centralidad de intermediación ampliamente utilizada, puede comprender que se basa en caminos más cortos. Si tiene la intención de utilizar esta medida, es necesario verificar si la ruta más corta es un concepto relevante asociado al proceso en estudio (como los flujos de energía en las redes alimentarias) o si es más cuestionable (por ejemplo, rutas en redes funcionales puede que en realidad no se corresponda con el flujo de información [20]; las rutas en las redes de contacto pueden no ser relevantes cuando no se estudia la difusión de la información o la enfermedad [24]). Otro ejemplo consiste en el análisis de redes dirigidas y / o ponderadas con extensiones de métricas para este caso. Es importante tener en cuenta que la fórmula del grado ponderado tiene en cuenta 2 efectos: cuántos vecinos y qué tan grandes son los pesos, 2 efectos que son imposibles de desenredar (un grado ponderado de 2 puede corresponder a un solo borde de peso 2 o 4 bordes de peso 0.5 cada uno). También se puede plantear un problema similar para la ruta ponderada (posibles dificultades resaltadas en [25]). Por último, las métricas globales a menudo se usan para comparar redes (redes medidas a partir de diferentes datos o condiciones o redes simuladas como se menciona en el Consejo 7). En este caso, se debe tener especial cuidado al comparar valores, ya que las diferencias de métricas pueden ser un efecto secundario de las diferencias en las características simples de la red, como el número de nodos o bordes (véanse las dificultades comunes mencionadas en [26] para las redes cerebrales y una discusión sobre covarianza de métricas con características de redes ecológicas en [27]). Por ejemplo, se sabe que la modularidad, el número de módulos y el tamaño de la red están entrelazados [28].

No es inusual que los autores, en lugar de elegir una métrica dada adaptada a una pregunta en particular, calculen una gran cantidad de métricas entre las disponibles. Sin embargo, muchas métricas están correlacionadas (ver un estudio de correlación en [24]), y se hace necesario lidiar con esta redundancia para interpretar los resultados (por ejemplo, con un método de ordenación [29]). Este enfoque no se basa en hipótesis como se recomienda en el Consejo 1 y, sin lugar a dudas, puede ser reemplazado por un enfoque incremental en el que las métricas se seleccionan una a la vez por su capacidad de verificar hipótesis particulares asociadas a las preguntas fundamentales sobre los datos (como para muchos análisis estadísticos , ver la regla 5 en [4]).

Consejo 6: Evite el uso ciego de métodos de agrupamiento; comprobar su diferencia en su lugar

Con la avalancha de datos que surgió en esta década, que condujo a redes más grandes, el agrupamiento se ha convertido en una de las herramientas más populares para obtener una visión integral de la estructura de la red. Su propósito general es agregar nodos en grupos para identificar una estructura de mesoescala en la red (es decir, alejar la red). Elegir una agrupación en red plantea problemas similares a elegir una métrica de red (Consejo 5). Es mucho más que usar una de las funciones disponibles en un software. En cuanto a los métodos de agrupamiento en nubes de puntos, los construidos en redes tienen como objetivo reunir objetos similares (es decir, nodos) y, por lo tanto, se basan en una definición específica de similitud de nodos. ¿Qué quiere el analista ser similar en una red? Discutir los pros y los contras de los diferentes métodos está más allá del alcance de este artículo, mientras que existe una literatura masiva sobre el tema (ver Consejo 9). Sin embargo, ilustramos el impacto de elegir una definición específica para la similitud de nodos con 3 propuestas clásicas (entre otras).

Una primera y natural definición de la similitud entre nodos es la existencia de una conexión entre ellos. Según esta definición, la agrupación en red consiste en encontrar una estructura modular, es decir, identificar grupos densos de nodos (también llamados módulos o comunidades) mal conectados con otros. Los métodos de detección comunitaria [23] implementan este enfoque, que supone implícitamente la existencia de módulos en la red. Se aplicaron con éxito en muchos estudios de biología (por ejemplo, para identificar dominios de cromatina [30]). Un segundo enfoque considera que 2 nodos son similares cuando tienden a estar conectados (o no) con el mismo tipo de nodos. Por lo tanto, las especies en una red alimentaria se consideran similares si tienen presas y depredadores similares [31]. Esta definición puede acomodar redes con estructura no modular [32], ya que supone que los nodos están involucrados en una "diversidad de arquitecturas de mesoescala" [33]. El modelo de bloque estocástico (SBM) es un método popular basado en esta definición [32, 34], que ha demostrado ser relevante para el análisis de algunas redes biológicas (para resaltar la compleja arquitectura de conectomas [33] o grupos funcionales en ecológicos). redes [35]). Una característica importante es que le permite a uno modelar explícitamente direcciones de borde y pesos por medio de diferentes distribuciones estadísticas [11]. Un tercer enfoque consiste en asociar un vector de características a cada nodo y luego reunir nodos con características similares. Esto incluye enfoques basados ​​en motivos [36] y una amplia gama de técnicas innovadoras de inclusión de nodos [37, 38]. Los nodos se describen como puntos en un espacio con una dimensión razonablemente baja, lo que permite aplicar la gran variedad de métodos de agrupamiento existentes para datos multivariados. Es importante darse cuenta de que cada uno de estos conceptos de similitud naturalmente da como resultado una agrupación de nodos diferentes. La elección entre estas alternativas debe ser impulsada por preguntas biológicas, no por su disponibilidad en herramientas de software (Consejo 1).

Consejo 7: no elija la manera fácil al simular redes

Para resaltar las propiedades específicas de una red observada (por ejemplo, un valor métrico peculiar), una práctica común consiste en comparar con redes simuladas. Estas propiedades se detectan como una desviación significativa (o no) de un comportamiento típico implementado en redes simuladas. Sin embargo, no existe una definición genérica de una red típica y, como consecuencia, las características que se pueden detectar dependen dramáticamente del modelo nulo utilizado para simular redes. Este modelo nulo debe elegirse para un propósito dado, ajustarse a los comportamientos esperados, al tiempo que contrasta con los que nos interesan. En otras palabras, debe ajustarse razonablemente a los datos para evitar numerosos descubrimientos falsos, pero no demasiado bien para que puedan surgir desviaciones.

Una opción natural podría consistir en seleccionar un modelo nulo entre la serie de modelos de grafos aleatorios (por ejemplo, Erdős – Rényi, mundo pequeño, sin escala, SBM, grafo aleatorio exponencial o modelo de configuración). Sin embargo, recomendamos no usarlos demasiado apresuradamente porque a menudo son demasiado generales. Por ejemplo, el modelo Erdős – Rényi (todos los bordes son independientes y tienen la misma probabilidad de ocurrencia) es a menudo un modelo nulo pobre para detectar nodos que tienen un grado inesperadamente alto. De hecho, induce una distribución de grados de Poisson, que está tan lejos de la observada en la mayoría de las redes que muchos nodos parecen estar conectados inesperadamente. Por otro lado, ningún nodo puede mostrar un grado inesperadamente alto con respecto al modelo de configuración, ya que este modelo nulo se ajusta con precisión al grado de cada nodo. Además, el analista suele ser consciente de una serie de propiedades que una red simulada debe mostrar: distribución de grados desequilibrados, diferentes roles de los nodos asociados con la información lateral disponible, interacciones prohibidas (por ejemplo, dependiendo de la masa corporal en las redes alimentarias [39] ), etc. Tales propiedades esperadas deben codificarse en el proceso de simulación (por ejemplo, una secuencia de grado fijo [35]), de lo contrario surgirán y se detectarán como significativas o contribuirán a detectar efectos falsos significativos como efectos secundarios. Como ejemplo, al evaluar si el número de bucles de avance es inesperado en una red de transcripción dada, el procedimiento de simulación debe basarse en un número fijo de nodos y grados, mientras que el número de estos bucles permanece libre.

Por último, cuando la red en estudio no se observa directamente, sino que se construye a partir de la interpretación de datos sin procesar, puede ser relevante simular todo el proceso de construcción. Considere el caso de las redes de contactos inferidas de los datos de movimiento [24]: se puede simular trayectorias manteniendo algunas propiedades de los datos originales y luego construir una red de contactos o simular directamente una red de contactos "realista". El primer enfoque tendrá en cuenta intrínsecamente las incertidumbres y los prejuicios inducidos por los pasos de construcción, que es probable que el último enfoque pase por alto.

Consejo 8: reconsidere los datos para construir múltiples capas de red

Un objeto de red puede ser el resultado de la agregación de datos. De hecho, las interacciones a menudo se observan en diferentes momentos y lugares o en diferentes condiciones. Por lo tanto, se recomienda encarecidamente tener en cuenta (y tener a la mano) las diferentes capas de datos (tiempo, espacio, tipo, etc.) y considerar las redes compuestas de varias capas, porque las redes de múltiples capas pueden proporcionar nuevas ideas en comparación con una agregada [ 40-42].

Una red se llama dinámica cuando reúne una serie temporal de instantáneas de red correspondientes a rondas sucesivas de recopilación de datos (la lista de nodos posiblemente varía en el tiempo). En este caso, se puede evaluar la variabilidad temporal de la estructura de la red (p. Ej., Reconexión de interacciones o cambios en las métricas de la red a lo largo del tiempo), y las extensiones de los conceptos desarrollados en el Consejo 6 ahora existen en el caso dinámico [43, 44]. Por ejemplo, la dinámica de la estructura social animal se puede inferir de las redes dinámicas para mejorar la comprensión de la transmisión de enfermedades [45]. Por otro lado, las interacciones se pueden observar en diferentes ubicaciones espaciales. En ecología, a menudo se agregan en una metared (o metaweb [46]) para estudiar cómo las redes locales difieren de esta metared y explicar estas variaciones con factores ambientales. En estos 2 casos, las capas múltiples permiten describir una red como un objeto en evolución, y el análisis tiene como objetivo identificar las variaciones espacio-temporales de las interacciones y sus impulsores.

También se pueden observar diferentes tipos de interacciones entre nodos. El apilamiento de capas que representan interacciones moleculares en diferentes tejidos humanos [47] o el mapeo de conectomas extrasinápticos y sinápticos [48] conduce a una red multiplex: entre 2 nodos, posiblemente exista más de 1 borde, 1 por tipo de interacción como máximo (a menudo visualizado con Colores diferentes). Tener en cuenta conjuntamente las diferentes capas mejora la comprensión de la interacción de los nodos. Por ejemplo, el uso conjunto de interacciones tróficas y no tróficas mejora la definición de los roles ecológicos de las especies en comparación con el uso de capas individuales de forma independiente [35]. Finalmente, también es posible integrar diferentes capas de información con diferentes conjuntos de nodos para cada capa, como proteínas y compuestos químicos [49]. En este caso, se definen diferentes tipos de interacciones dentro y entre capas. En todos estos casos, las diferentes capas de información se integran en una red integral, de modo que se tratan conjuntamente en lugar de una tras otra.

Consejo 9: Sumérgete en la literatura de la red más allá de tu disciplina

La ciencia de redes ahora involucra una comunidad hiperactiva de investigadores de diferentes dominios como física, estadística, informática o ciencias sociales. Como resultado, existe una literatura masiva sobre redes, y es un desafío para los biólogos sumergirse en ella. De hecho, no estamos acostumbrados a explorar la bibliografía fuera de nuestro dominio de investigación. Los libros de referencia [5, 42, 50, 51] y las revisiones [23, 40, 52] son ​​obviamente buenos puntos de entrada para desarrollar sus habilidades de red. Sin embargo, sin lugar a dudas, se beneficiará enormemente de un viaje de ida y vuelta en esta literatura exógeno a su campo (incluidos los avances más recientes en la metodología de red disponibles en el repositorio de preimpresión arXiv), siempre que haga el esfuerzo de aprender el vocabulario apropiado de esta área. Ejemplos concretos incluyen el análisis de la modularidad en biología, que se tomó prestada de la física (a diferencia de la anidación, que se origina en la biogeografía), o el uso reciente de SBM (Consejo 6) que se han aplicado en la literatura de ciencias sociales desde el siglo pasado.

Conclusión

Los 9 consejos presentados aquí deberían ser una forma para que el analista de datos ponga un pie en la puerta del análisis de datos de red. Estos consejos no son exclusivos y conocemos otras preguntas basadas en la red que merecen un interés especial, incluida la difusión en redes, por ejemplo. Aún así, el especialista no especializado en redes debe confiar en su capacidad para aprender, paso a paso, los conceptos y métodos de la red con un efecto productivo en sus preguntas científicas.


Referencias

1. Ideker T, Nussinov R. Network approaches and applications in biology. PLoS Comput Biol. 2017;13(10):e1005771. pmid:29023447
View Article
PubMed/NCBI
Google Scholar
2. Zitnik M, Sosi R, Leskovec J. Prioritizing network communities. Nature Communications. 2018;9(1):2544. pmid:29959323
View Article
PubMed/NCBI
Google Scholar
3. Wang B, Pourshafeie A, Zitnik M, Zhu J, Bustamante CD, Batzoglou S, et al. Network enhancement as a general method to denoise weighted biological networks. Nature Communications. 2018;9(1):3108. pmid:30082777
View Article
PubMed/NCBI
Google Scholar
4. Kass RE, Caffo BS, Davidian M, Meng XL, Yu B, Reid N. Ten simple rules for effective statistical practice. PLoS Comput Biol. 2016;12(6):e1004961. pmid:27281180
View Article
PubMed/NCBI
Google Scholar
5. Diestel R. Graph Theory. Springer-Verlag; 2016.
6. Barrat A, Barthelemy M, Pastor-Satorras R, Vespignani A. The architecture of complex weighted networks. Proceedings of the national academy of sciences. 2004;101(11):3747–3752.
View Article
Google Scholar
7. Staniczenko PP, Kopp JC, Allesina S. The ghost of nestedness in ecological networks. Nature communications. 2013;4:1391. pmid:23340431
View Article
PubMed/NCBI
Google Scholar
8. Pavlopoulos GA, Kontou PI, Pavlopoulou A, Bouyioukos C, Markou E, Bagos PG. Bipartite graphs in systems biology and medicine: a survey of methods and applications. GigaScience. 2018;7(4):giy014.
View Article
Google Scholar
9. Miele V, Picard F, Dray S. Spatially constrained clustering of ecological networks. Methods in Ecology and Evolution. 2014;5(8):771–779.
View Article
Google Scholar
10. Expert P, Evans TS, Blondel VD, Lambiotte R. Uncovering space-independent communities in spatial networks. Proceedings of the National Academy of Sciences. 2011;108(19):7663–7668.
View Article
Google Scholar
11. Mariadassou M, Robin S, Vacher C. Uncovering latent structure in valued graphs: a variational approach. The Annals of Applied Statistics. 2010;4(2):715–742.
View Article
Google Scholar
12. Fortuna MA, Albaladejo RG, Fernández L, Aparicio A, Bascompte J. Networks of spatial genetic variation across species. Proceedings of the National Academy of Sciences. 2009;106(45):19044–19049.
View Article
Google Scholar
13. Hric D, Darst RK, Fortunato S. Community detection in networks: Structural communities versus ground truth. Physical Review E. 2014;90(6):062805.
View Article
Google Scholar
14. Rossi R, Ahmed N. The network data repository with interactive graph analytics and visualization. In: Twenty-Ninth AAAI Conference on Artificial Intelligence; 2015.
15. Sandve GK, Nekrutenko A, Taylor J, Hovig E. Ten simple rules for reproducible computational research. PLoS Comput Biol. 2013;9(10):e1003285. pmid:24204232
View Article
PubMed/NCBI
Google Scholar
16. Carey MA, Papin JA. Ten simple rules for biologists learning to program. PLoS Comput Biol. 2018;14(1):e1005871. pmid:29300745
View Article
PubMed/NCBI
Google Scholar
17. Pocock MJ, Evans DM, Fontaine C, Harvey M, Julliard R, McLaughlin Ó, et al. The visualisation of ecological networks, and their use as a tool for engagement, advocacy and management. In: Advances in Ecological Research. vol. 54. Elsevier; 2016. p. 41–85.
View Article
Google Scholar
18. Tukey JW. Exploratory data analysis. Reading: Addison-Wesley; 1977.
19. Krzywinski M, Birol I, Jones SJ, Marra MA. Hive plots—rational approach to visualizing networks. Briefings in Bioinformatics. 2011;13(5):627–644. pmid:22155641
View Article
PubMed/NCBI
Google Scholar
20. Rubinov M, Sporns O. Complex network measures of brain connectivity: uses and interpretations. Neuroimage. 2010;52(3):1059–1069. pmid:19819337
View Article
PubMed/NCBI
Google Scholar
21. Bascompte J, Jordano P, Melián CJ, Olesen JM. The nested assembly of plant–animal mutualistic networks. Proceedings of the National Academy of Sciences. 2003;100(16):9383–9387.
View Article
Google Scholar
22. Van Dijk RE, Kaden JC, Argüelles-Ticó A, Dawson DA, Burke T, Hatchwell BJ. Cooperative investment in public goods is kin directed in communal nests of social birds. Ecology letters. 2014;17(9):1141–1148. pmid:25039999
View Article
PubMed/NCBI
Google Scholar
23. Fortunato S, Hric D. Community detection in networks: A user guide. Physics Reports. 2016;659:1–44.
View Article
Google Scholar
24. Farine DR, Whitehead H. Constructing, conducting and interpreting animal social network analysis. J Anim Ecol. 2015;84(5):1144–1163. pmid:26172345
View Article
PubMed/NCBI
Google Scholar
25. Costa A, Gonzalez AMM, Guizien K, Doglioli AM, Gomez JM, Petrenko A, et al. Ecological networks: Pursuing the shortest path, however narrow and crooked. bioRxiv. 2018;.
View Article
Google Scholar
26. Van Wijk BC, Stam CJ, Daffertshofer A. Comparing brain networks of different size and connectivity density using graph theory. PLoS ONE. 2010;5(10):e13701. pmid:21060892
View Article
PubMed/NCBI
Google Scholar
27. Pellissier L, Albouy C, Bascompte J, Farwig N, Graham C, Loreau M, et al. Comparing species interaction networks along environmental gradients. Biological Reviews. 2018;93(2):785–800. pmid:28941124
View Article
PubMed/NCBI
Google Scholar
28. Fortunato S, Barthelemy M. Resolution limit in community detection. Proceedings of the National Academy of Sciences. 2007;104(1):36–41.
View Article
Google Scholar
29. Kortsch S, Primicerio R, Aschan M, Lind S, Dolgov AV, Planque B. Food-web structure varies along environmental gradients in a high-latitude marine ecosystem. Ecography. 2019;42(2):295–308.
View Article
Google Scholar
30. Norton HK, Emerson DJ, Huang H, Kim J, Titus KR, Gu S, et al. Detecting hierarchical genome folding with network modularity. Nature methods. 2018;15(2):119. pmid:29334377
View Article
PubMed/NCBI
Google Scholar
31. Allesina S, Pascual M. Food web models: a plea for groups. Ecology Letters. 2009;12(7):652–662. pmid:19453619
View Article
PubMed/NCBI
Google Scholar
32. Newman ME, Leicht EA. Mixture models and exploratory analysis in networks. Proceedings of the National Academy of Sciences. 2007;104(23):9564–9569.
View Article
Google Scholar
33. Betzel RF, Medaglia JD, Bassett DS. Diversity of meso-scale architecture in human and non-human connectomes. Nature Communications. 2018;9(1):346. pmid:29367627
View Article
PubMed/NCBI
Google Scholar
34. Daudin JJ, Picard F, Robin S. A mixture model for random graphs. Statistics and computing. 2008;18(2):173–183.
View Article
Google Scholar
35. Kéfi S, Miele V, Wieters EA, Navarrete SA, Berlow EL. How Structured Is the Entangled Bank? The Surprisingly Simple Organization of Multiplex Ecological Networks Leads to Increased Persistence and Resilience. PLoS Biol. 2016;14(8):e1002527. pmid:27487303
View Article
PubMed/NCBI
Google Scholar
36. Stouffer DB, Sales-Pardo M, Sirer MI, Bascompte J. Evolutionary conservation of species’ roles in food webs. Science. 2012;335(6075):1489–1492. pmid:22442483
View Article
PubMed/NCBI
Google Scholar
37. Perozzi B, Al-Rfou R, Skiena S. DeepWalk: Online Learning of Social Representations. In: Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. KDD '14. New York, NY, USA: ACM; 2014. p. 701–710.
38. Grover A, Leskovec J. node2vec: Scalable feature learning for networks. In: Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining. ACM; 2016. p. 855–864.
39. Brose U, Jonsson T, Berlow EL, Warren P, Banasek-Richter C, Bersier LF, et al. Consumer–resource body-size relationships in natural food webs. Ecology. 2006;87(10):2411–2417. pmid:17089649
View Article
PubMed/NCBI
Google Scholar
40. Boccaletti S, Bianconi G, Criado R, Del Genio CI, Gómez-Gardenes J, Romance M, et al. The structure and dynamics of multilayer networks. Physics Reports. 2014;544(1):1–122.
View Article
Google Scholar
41. Pilosof S, Porter MA, Pascual M, Kéfi S. The multilayer nature of ecological networks. Nature Ecology & Evolution. 2017;1(4):0101.
View Article
Google Scholar
42. Bianconi G. Multilayer Networks: Structure and Function. Oxford university press; 2018.
43. Matias C, Miele V. Statistical clustering of temporal networks through a dynamic stochastic block model. Journal of the Royal Statistical Society: Series B (Statistical Methodology). 2017;79(4):1119–1141.
View Article
Google Scholar
44. Rossetti G, Cazabet R. Community discovery in dynamic networks: a survey. ACM Computing Surveys (CSUR). 2018;51(2):35.
View Article
Google Scholar
45. Farine D. The dynamics of transmission and the dynamics of networks. Journal of Animal Ecology. 2017;86(3):415–418. pmid:28394028
View Article
PubMed/NCBI
Google Scholar
46. Ohlmann M, Miele V, Dray S, Chalmandrier L, O’Connor L, Thuiller W. Diversity indices for ecological networks: a unifying framework using Hill numbers. Ecology letters. 2019;.
View Article
Google Scholar
47. Zitnik M, Leskovec J. Predicting multicellular function through multi-layer tissue networks. Bioinformatics. 2017;33(14):i190–i198. pmid:28881986
View Article
PubMed/NCBI
Google Scholar
48. Bentley B, Branicky R, Barnes CL, Chew YL, Yemini E, Bullmore ET, et al. The multilayer connectome of Caenorhabditis elegans. PLoS Comput Biol. 2016;12(12):e1005283. pmid:27984591
View Article
PubMed/NCBI
Google Scholar
49. Berenstein AJ, Magariños MP, Chernomoretz A, Agüero F. A multilayer network approach for guiding drug repositioning in neglected diseases. PLoS Negl Trop Dis. 2016;10(1):e0004300. pmid:26735851
View Article
PubMed/NCBI
Google Scholar
50. Newman M. Networks. Oxford University Press; 2018. https://doi.org/10.1002/net.21828
51. Barabási AL. Network Science; 2019. [cited 2019 Oct 15]. Available from: http://networksciencebook.com.
View Article
Google Scholar
52. Goyal P, Ferrara E. Graph embedding techniques, applications, and performance: A survey. Knowledge-Based Systems. 2018;151:78–94.
View Article
Google Scholar