sábado, 2 de junio de 2018

Abusos de la metáfora de red en los historiadores


Esto es lo que sucede cuando los historiadores abusan de la idea de la red

Por David A. Bell | The New Republic

David A. Bell es el Profesor Lapidus en el Departamento de Historia de Princeton y el autor de The First Total War (Houghton Mifflin).

Sherlock Holmes, la mayoría de los personajes de ficción en inglés, no parecería un icono obvio de la globalización. Sin embargo, la novela en la que apareció por primera vez, Un estudio en escarlata, comienza con las hazañas del Dr. Watson en Afganistán. En las cuatro novelas que Arthur Conan Doyle escribió sobre Holmes, dos de las tramas dependen de los estadounidenses que persiguen venganzas en Europa, y dos sobre las fortunas adquiridas (en un caso robado) en las colonias británicas de ultramar. En cuanto a las cincuenta y seis historias cortas, las tres cuartas partes de ellas tienen una dimensión extranjera significativa, que a menudo se extiende más allá del continente europeo. Holmes's London es una metrópolis predeciblemente exótica, llena de indios, exiliados radicales europeos, estadounidenses ricos y diversos aristócratas, marineros y espías extranjeros. Pero incluso los crímenes que atraen al detective al campo engañosamente tranquilo casi siempre parecen involucrar una propiedad comprada con ganancias de la minería australiana, o un resentimiento entre los soldados que se remonta al motín indio. El Sabueso de los Baskerville, aunque ambientado en la parte más profunda de Devon, gira en torno a los esfuerzos de un inglés nacido en Costa Rica para robar una fortuna hecha en Sudáfrica por un primo canadiense.

Durante muchos años, ha sido la furia entre los historiadores descubrir conexiones mundiales pasadas de este tipo. En el llamado "giro global" de la historiografía contemporánea, no ha sido suficiente simplemente estudiar la forma en que las potencias occidentales han afectado al resto del mundo: un tema venerable. La tarea también ha sido mostrar cómo el resto del mundo afectó a Occidente; cómo las ideas y las prácticas fluían de un lado a otro en un flujo constante de apropiación, transformación y resistencia; cómo la opresión del fuerte se encontró con las "armas de los débiles"; y cómo se puede hacer que hable el "subalterno" reprimido de la historia. En otras palabras, no se trata simplemente de desacreditar las afirmaciones de una "misión civilizadora" occidental, en la que la mayoría de la gente de Occidente dejó de creer en décadas atrás. También es una cuestión de restaurar la "agencia" a los pueblos no occidentales, para garantizar que no sean tratados como los objetos pasivos de la actividad occidental. Ha sido una cuestión de mostrar cómo, incluso en un pasado relativamente lejano, los patrones globales de movimiento, intercambio, explotación y agresión formaron fenómenos que los historiadores alguna vez consideraron puramente locales. Y ha sido una cuestión de aplicar, incluso en períodos históricos bastante distantes, la metáfora dominante de la era digital: la "red".
Durante muchos años, ha sido la furia entre los historiadores descubrir las conexiones globales pasadas.
El impulso inicial detrás del giro fue fuerte, aunque a menudo de manera incoherente, político. Revelar cómo incluso los primeros patrones de globalización se extendieron, como icebergs, muy por debajo de la superficie visible de la política y el comercio, pareció una forma efectiva de aumentar la sensibilidad a la persistencia de patrones de desigualdad y explotación a largo plazo, particularmente en relación con el sur. "Demostrar las innumerables formas en que los pueblos particulares resistieron las formas de globalización, o se apropiaron de ellas para sus propios usos, les permitió servir como modelos de inspiración. Para tomar un ejemplo prominente, historiadores como Laurent Dubois han interpretado las masivas revueltas de esclavos en el Caribe francés en la década de 1790, ni como una simple explosión de ira contra la opresión horrible ni como un mero eco de las revoluciones europeas. Las revueltas han surgido en cambio como un proceso complejo en el cual los esclavos rebeldes tomaron las ideas europeas de los derechos y la libertad y los mezclaron con las ideas y prácticas caribeñas y africanas para crear algo completamente nuevo.

Con el tiempo, las operaciones ordinarias de la vida académica han embotado el mensaje político. Las peleas han cobrado su precio. ¿Hace demasiado énfasis en la "agencia" de los pueblos indígenas para minimizar ingenuamente las realidades brutales de la explotación imperial? O, por el contrario, ¿un enfoque excesivo en esta explotación termina haciendo que los pueblos indígenas parezcan nada más que víctimas pasivas, manteniendo así al Occidente mismo en el centro de la historia? Cautelosos de aventurarse en tales campos minados, muchos "historiadores globales" ahora encierran cada afirmación vacilante en una sofocante gasa de cobertura y calificación. Mientras tanto, la esperanza de tomar parte en una tendencia intelectual poderosa y emocionante (junto, quizás, con la perspectiva de viajes de investigación de invierno a Barbados o Goa) ha atraído a muchos académicos con poca preocupación por los intereses políticos originales.

Aún así, la tendencia solo ha ganado fuerza y ​​amplitud. Lo que la historia social fue a los años 1960 y 1970, y la historia cultural a los años 1980 y 1990, la historia mundial se ha convertido en las primeras décadas del nuevo siglo. Hace cuarenta años, un joven historiador interesado en la era de la Revolución Estadounidense podría haber realizado una disertación sobre cómo la independencia afectaba la vida cotidiana en la pequeña ciudad de Nueva Inglaterra. Veinte años atrás, ella pudo haber rastreado los discursos de la masculinidad en los periódicos de la república temprana. Hoy en día, es más probable que un tema típico involucre el impacto de productos "globales" como el té y el vino en las ciudades estadounidenses, o el papel de los marineros extranjeros en buques mercantes estadounidenses, o el establecimiento de redes de correspondencia entre propietarios de esclavos en los Estados Unidos. Sur y el Caribe. Al igual que en los "giros" anteriores, los defensores de este último insisten en la necesidad de aplicar sus conocimientos a todo tipo de temas familiares. Incluso hay una literatura creciente desde esta perspectiva dedicada a, sí, Sherlock Holmes. (Un artículo reciente en Critical Review lleva el título "Sherlock Holmes, Crime and the Anxieties of Globalization")


En el mejor de los casos, este nuevo trabajo abre nuevas perspectivas notables en el pasado. Solía ​​ser posible para los historiadores dedicar carreras completas a los estudios de la Revolución Francesa (mi propio campo) sin prestar la menor atención al hecho de que la Francia revolucionaria poseía colonias caribeñas. Sin embargo, el crecimiento prerrevolucionario de la economía francesa fue en gran medida impulsado por la espectacular expansión de la producción de azúcar en estas colonias. Esta producción a su vez dependía de un gran número de esclavos que trabajaban en algunas de las condiciones más brutales jamás vistas en el planeta. En 1789, las tres pequeñas colonias francesas de Martinica, Guadalupe y Saint-Domingue (actual Haití), con una superficie combinada aproximadamente igual a la de Massachusetts, tenían tantos esclavos africanos como todos los Estados Unidos (aproximadamente 700,000). . La mayoría de ellos había nacido en África, y sobrevivieron, en promedio, poco más de una década después de su llegada al Nuevo Mundo. En 1791, estos esclavos se levantaron en la mayor rebelión de esclavos jamás vista en la historia. En 1794, la Francia revolucionaria se convirtió en el primer imperio europeo en abolir la esclavitud (aunque Napoleón la restableció más tarde). El "giro global" ha insistido con razón en que las historias de la Revolución Francesa toman en cuenta estos eventos en su totalidad. Ha hecho cosas similares para muchos otros temas.

Sin embargo, ha demostrado ser menos exitoso al proporcionar nuevas narrativas generales con las que dar sentido a la experiencia humana pasada. Un clásico del género como El nacimiento del mundo moderno de C. A. Bayly, 1780-1914, que apareció en 2003, trazó conexiones y paralelismos entre partes remotas del mundo, destacó el crecimiento de las redes de comunicación y transformación. , y concluyó con una meditación mordaz sobre la "gran aceleración" de los años desde 1890 hasta 1914, cuando el mundo entero parecía dirigirse hacia un conflicto dramático, en medio del eclipse de las primeras esperanzas liberales. Sin embargo, incluso tan magníficamente seguro de sí mismo, un escritor como Bayly encontró difícil reunir océanos enteros y océanos en una historia coherente. Y a la hora de explicar "los motores del cambio", podría ofrecer solo dos páginas y medio pálidas que proponían, como clave, nada más que "la concatenación de cambios producidos por las interacciones de los cambios políticos, económicos e ideológicos en muchos diferentes niveles ": una declaración vaga y lo suficientemente abstracta como para aplicarse a prácticamente cualquier situación histórica en cualquier lugar.

A pesar de este problema, o quizás debido a él, los defensores del giro global han desarrollado una especie de obsesión por la síntesis. Las editoriales publican enciclopedias, manuales, manuales y diccionarios de historia global más rápido de lo que nadie puede hacer un seguimiento, y mucho menos leer. Las revistas aprendidas se llenan de foros, discusiones y debates en línea sobre el "estado del campo". Y autores especialmente ambiciosos han producido descripciones individuales, cuanto más voluminosas, mejor para hacer justicia lo más literalmente posible a lo que es literalmente el ser humano más grande. historia. Algunos años después del relativamente esbelto volumen de 540 páginas de Bayly, el erudito alemán Jürgen Osterhammel intervino ("pesó" la palabra operativa) con una historia de 1,568 páginas del siglo XIX titulada La Transformación del Mundo. Y ahora Osterhammel se ha asociado con Akira Iriye para editar una historia masiva de seis volúmenes del mundo, para aparecer tanto en inglés como en alemán, de los cuales el tomo de 1.161 páginas en revisión, que cubre los años 1870 a 1945, es el primero en ver impresión. Consta de cinco "capítulos", cada uno de los cuales, si se publica por separado, ya habría ocupado una longitud respetable de la estantería.

Este tomo, editado por Emily Rosenberg, proporciona una excelente ilustración de lo que el giro global puede y no puede lograr. Cada uno de sus cinco capítulos se basa en un amplio rango y cantidad de material fuente. Cada uno logra no solo sintetizar este material, sino también hacer nuevos argumentos al respecto. Tomados en conjunto, los capítulos proporcionan una imagen amplia de la forma en que ciertos tipos de conexiones globales cambiaron entre 1870 y 1945. Pero otras conexiones quedan extrañamente descuidadas. Y a pesar de los valientes esfuerzos de los autores, los capítulos muestran cuán difícil es escribir de una manera atractiva sobre un tema tan vasto y amorfo, y desarrollar marcos explicativos generales convincentes.

El volumen analiza el tema general de las "conexiones globales" en cinco partes aproximadas: cooperación, intercambio, movimiento, coacción y resistencia. La propia Rosenberg aborda el primero, en un capítulo virtuoso que examina todas las variedades imaginables de conferencias y acuerdos internacionales: sobre la estandarización de zonas horarias, deportes, distribución de películas, guerra y tratamiento de presos, banca y la moneda y el comercio, en las líneas internacionales de telégrafos y ferrocarriles, en los intercambios artísticos, científicos y profesionales, sin olvidar a la Liga de las Naciones. Mira los intentos fallidos de internacionalismo como el movimiento Esperanto, y muestra cómo las formas de entretenimiento desarrollaron audiencias en todo el mundo. El período aparece en sus páginas como una de las redes globales frenéticas. (De todos los autores, Rosenberg está más enamorada de la imagen de "red", aunque su copa metafórica rebosa con invocaciones de "corrientes", "caminos entrelazados", "flujos de conexión" y "el dominio fluido de la" trans- ". '') Lo más interesante es que ella argumenta que el cataclismo de la Primera Guerra Mundial terminó interrumpiendo el proceso sorprendentemente poco.

Dirk Hoerder tiene un tono más sombrío en su capítulo sobre migraciones y movimiento. La primera imagen que llega a las mentes estadounidenses, al considerar la migración en este período, es generalmente una de las masas acurrucadas a bordo contemplando con asombro la Estatua de la Libertad. Hoerder muestra, con estadísticas de sobra, cuán pequeña es una parte de la imagen general que capta esta imagen. Al distinguir cuidadosamente entre los diferentes tipos de migrantes -migrantes libres, trabajadores migrantes, trabajadores contratados, refugiados, personas desplazadas- señala los vastos flujos de humanidad que los buques de vapor y ferrocarriles hicieron posibles en todo el mundo. Los indios se trasladaron a través del imperio británico, a África e incluso a América del Sur. Los rusos se extendieron hacia el este en Siberia, los chinos descendieron hacia el sudeste asiático. Los flujos inversos a veces importaban casi tanto como los originales. Y en la historia de las migraciones, el conflicto internacional tuvo un impacto creciente, y los refugiados asumieron una parte cada vez mayor del movimiento general. Steven Topik y Allen Wells también enfatizan la discontinuidad y las relaciones desiguales de poder en una contribución más específica a los flujos de productos básicos. Los procesos industriales, argumentan, pueden haberse sentido tanto en la agricultura como en los sectores más "avanzados" de la economía mundial, pero la distribución de los beneficios siguió siendo tremendamente desigual, y la promesa de la prosperidad mundial prácticamente no se mantuvo.
La mayor ausencia individual del volumen es la guerra.
La coacción y la resistencia dominan las contribuciones de Charles Maier, sobre el estado, y Antoinette Burton y Tony Ballantyne, sobre los imperios. El espléndido capítulo de Maier, el más largo del volumen, también tiene la tesis más clara: demostrar lo que él llama "una intensificación decisiva de la ambición estatal y el poder gubernamental" en todo el mundo. (El ensayo tiene el inspirado título "Leviathan 2.0.") Maier es particularmente bueno en la forma en que las comunicaciones y el transporte mejorados podrían facilitar nuevas formas de poder estatal, pero también ayudar a provocar la revolución en todas partes, desde México hasta China y Rusia. También se muestra lírico sobre la crueldad con que los estados territoriales en expansión subyugaron e incorporaron pueblos con patrones más nómadas de asentamiento y organización política, desde las Grandes Llanuras de América hasta Asia Central. Burton y Ballantyne, por su parte, asumen la formidable tarea de discutir el imperialismo y el antiimperialismo en poco menos de 150 páginas. Su capítulo busca, sobre todo, desacreditar la noción comúnmente aceptada de que los movimientos de descolonización solo alcanzaron una masa crítica con las perturbaciones de la Segunda Guerra Mundial. Por el contrario, argumentan que estos movimientos se formaron en tándem con el mismo imperialismo y, lo que es más importante, que tomaron forma entre los imperios, no solo dentro de ellos. Sostienen a W. E. B. Du Bois, que llamó a la solidaridad mundial de los pueblos de África y Asia, como un excelente ejemplo de establecimiento de una red antiimperialista, señalando que este oponente afroamericano de las empresas estadounidenses de ultramar "comparó las calles de Shanghai a los de Mississippi y desafió a los banqueros chinos a resistir 'la dominación del capital europeo' ".

En resumen, las contribuciones reúnen un conjunto notable de ideas sobre conexiones y redes globales. Y, sin embargo, también falta una cantidad notable. Para empezar, los lectores del libro aprenderán mucho más aquí sobre sistemas postales, telégrafos y teléfonos que sobre las ideas transmitidas a través de ellos. Tal vez nada en el período comprendido entre 1870 y 1945 creó una solidaridad internacional más intensa que las ideas socialistas: "¡trabajadores del mundo, uníos!" No era más que un llamado a la conexión global. Gracias al socialismo, se llevaron a cabo simultaneamente argumentos casi idénticos sobre medios y fines, etapas del desarrollo histórico, el capital y la industria en Santiago y Beijing, Londres y Nueva York. (No en vano, Lionel Abel llamó al City College de Nueva York en la década de 1930 "la parte más interesante de la Unión Soviética ... la única parte de ese país en la que se podía expresar abiertamente la lucha entre Stalin y Trotsky".) Sin embargo El capítulo de Rosenberg tiene apenas cuatro páginas sobre el tema. El libro en su totalidad menciona a docenas de organizaciones internacionales, incluyendo el Consejo Internacional para la Preservación de Aves y la Junta Interamericana del Precio del Café, pero puede prescindir exactamente de tres oraciones para la Primera y Segunda Internacional Socialista. No hace un trabajo mucho mejor con la transmisión de ideas religiosas, y sobre las formas en que nuevas formas de "conexión global" a veces se basan en las más antiguas desarrolladas por la organización internacional más exitosa, la Iglesia Católica Romana.

A pesar de sus abundantes estadísticas sobre los flujos de productos básicos, el libro también tiene muy poco que decir sobre cómo se usaban realmente los productos básicos y sobre la vida cotidiana en general. Una de las características más sorprendentes del período comprendido entre 1870 y 1914 fue la aparición de culturas de la clase media estrechamente relacionadas en gran parte de Occidente, y cada vez más fuera de ella. Las burguesías emergentes de la época otorgaron una gran importancia a las vidas hogareñas bien ordenadas y cultivadas, con "compañerismo", pero con roles muy restringidos para las mujeres. Fueron, en gran medida, los productos (masculinos) de estos hogares quienes crearon las organizaciones internacionales discutidas por Rosenberg; atendió a las burocracias nacionales e imperiales trazadas por Maier, Burton y Ballantyne; y, por supuesto, consumió los productos estudiados por Topik y Wells, desde viejos estándares como el azúcar y el tabaco hasta los recién llegados como el petróleo y el caucho para neumáticos. Burton y Ballantyne tienen una anécdota reveladora sobre la forma en que un líder nacionalista indio se apropió y adaptó las nociones occidentales de la domesticidad de clase media, pero el libro de otra manera deja estos temas en gran medida intactos.

La única gran ausencia del volumen, sin embargo, es la guerra. La conquista militar, del tipo emprendida por Alemania y Japón en la Segunda Guerra Mundial, es la forma más directa de "conexión global" imaginable. Además, las dos guerras mundiales, con sus niveles insondables de matanza y destrucción, posiblemente hicieron más por romper las redes mundiales que cualquier otra cosa en la historia. Charles Maier tiene mucho interés en decir acerca de la forma en que la guerra contribuyó a la configuración de su "Leviatán 2.0". Sin embargo, en ninguna parte los autores de este libro ofrecen una visión sistemática de la guerra en este período, que incluyó los treinta y un años más sanguinarios en la historia humana (1914-1945). Los autores podrían haber argumentado colectivamente, como lo hace Rosenberg individualmente con referencia a las organizaciones internacionales, que incluso las guerras mundiales realmente hicieron muy poco para interrumpir el crecimiento a largo plazo de las conexiones y redes globales. Esta sería una tesis interesante y provocadora, si acaso difícil de sostener. Pero el libro como un todo nunca hace el caso. Y, curiosamente, mientras los autores ofrecen resúmenes de eventos que suponen que sus lectores encontrarán desconocidos, como la Revolución Mexicana de 1916, no hacen nada similar para las guerras mundiales. La "masacre de Amritsar" de indios realizada por las tropas británicas en 1919, con un número de muertos tal vez de mil, aparece tres veces separadas en el libro, pero Stalingrado y el Somme, con sus millones de muertos, no se mencionan. Sí, Stalingrado fue una batalla "europea" en un sentido, pero representó el momento clave en una lucha por la mayor parte de la masa terrestre de Eurasia a través de la cual Hoerder traza con conocimiento tantas migraciones. Stalingrado también trajo, en el lado soviético, combatientes de toda Eurasia, mientras que el Somme involucró a soldados coloniales de imperios globales. También es de notar que Winston Churchill, posiblemente una figura con más que una relevancia pasajera al tema de las "conexiones globales", tiene precisamente tres referencias en el libro, menos que su compatriota David Livingstone (del "Dr. Livingstone, supongo, "Fama".

Es posible que estos problemas hayan sido abordados -con el riesgo de extender un volumen ya masivo al punto de ruptura literal- mediante la adición de otros ensayos. La ausencia de Churchill, sin embargo, apunta a un problema más general que ha plagado la escritura de la historia global: cómo llevar a los individuos a historias contadas en escalas tan vastas, porque de hecho, pocas personas del período lo hacen mucho mejor que él en Un mundo Conectando. Algunos practicantes de la "historia global", en un giro hacia las técnicas de la microhistoria, han producido narrativas notablemente efectivas centradas en las experiencias de individuos por lo demás oscuros atrapados en las corrientes globales de migración, imperialismo y comercio. Por ejemplo, The Ordeal de Elizabeth Marsh, de Linda Colley, utilizó brillantemente las odiseas de una inglesa del siglo XVIII entre cuatro continentes como una ventana a un período anterior de globalización. Pero una cosa es "ver un mundo en un grano de arena", como dijo Blake, y otra contar la historia del mundo como un todo. Los autores de A World Connecting tienen que meter tanta información en un espacio tan pequeño que los individuos tienden a desaparecer de la vista, incluso cuando sus personalidades y acciones particulares tuvieron un efecto decisivo en los eventos. Maier al menos maneja un breve boceto incisivo de Stalin. Pero trescientas páginas más tarde, mientras Hoerder reconoce la gran escala de la migración forzada en la Unión Soviética, la atribuye a "burócratas soviéticos" sin rostro, a pesar de que el propio Stalin ordenó personalmente las "transferencias de población" más grandes y brutales.
Los eventos pasados ​​no siempre se manejan mejor al establecerlos dentro de un contexto vasto.

La ausencia general de individuos es solo una cosa que hace que A World Connecting, al igual que tanta historia global, a veces sea difícil de leer. La necesidad de ilustrar cada argumento con una larga cadena de ejemplos de todo el mundo también contribuye al problema. Un párrafo típico de Burton y Ballantyne salta de Taiwán a la estepa rusa al sur de África. Uno de Hoerder incluye referencias a América del Norte, Australia y Nueva Zelanda, Sudáfrica, África Oriental, Manchuria y los Andes. Rosenberg, mientras tanto, es un devoto de listas: "en Europa occidental, en los antiguos imperios ruso, austrohúngaro y otomano, en Egipto, Turquía, India, Japón y América Latina". Los autores no son malos escritores, pero la propia naturaleza del libro los impulsa a saltar de esta manera, y cuidadosamente a notar excepciones-a veces muy numerosas-a casi todos los patrones generales que disciernen.

¿Es posible escribir la historia global de una manera más vigorosa? Supongo que sí, pero hacerlo generalmente requiere que los autores vengan armados con tesis fuertes y globales, no solo sobre cómo cambiaron las cosas, sino por qué. Una generación anterior de historiadores marxistas, al menos aquellos que lograron salir arrastrados por debajo del caparazón de la jerga materialista histórica, pudieron escribir con brío excepcional sobre los eventos a escala global, porque vieron estos eventos como impulsados ​​sobre todo por un solo conjunto de Procesos económicos occidentales. Pero en A World Connecting, un historiador marxista como Eric Hobsbawm se ve reprendido por su "perspectiva eurocéntrica". Como lo expresa Rosenberg en su introducción, "el volumen evita cualquier afirmación sobre alguna fuerza motriz única de la historia". Bayly con sus "interacciones" de varias capas, explica que el libro enfatiza "el cambio como proceso y desigual, forjado en el intercambio y la relacionalidad en lugar de ser unidireccional, fuerzas generales". Cada uno de los autores regresa, en muchos puntos, a los efectos decisivos de las nuevas tecnologías de transporte y comunicaciones entre 1870 y 1945, y el libro está repleto de asombrosas observaciones contemporáneas sobre las formas en que los ferrocarriles, los buques a vapor y el telégrafo parecían aniquilar el tiempo y el espacio. Pero la visión general del "intercambio y la relacionalidad" prohíbe reunir este material en un argumento único y global. También tiene efectos desafortunados, por decir lo menos, en la prosa: "las relaciones recíprocas entre los impulsos de flujo y de estabilización pusieron de relieve las similitudes y las diferenciaciones que surgieron en el período" (Rosenberg); "Rastrear esta globalidad imperial tanto en sus dimensiones temporales como espaciales, viéndola como la interacción de regímenes múltiples que se distribuían simultáneamente, aunque de manera desigual, en la superficie del mundo" (Burton y Ballantyne); y así. Afirmaciones como estas proliferan en el libro como espuma de poliestireno.

Las motivaciones para esas declaraciones, y para evitar las narraciones fuertes, son en cierto sentido admirables. Los autores desean evitar el reduccionismo y reconocer la complejidad muy real de los procesos globales que han rastreado. Pero el hecho de que las "corrientes" fluyeran en múltiples direcciones, y que las "redes" tuvieran múltiples nodos, no debería significar que no podamos rastrear una lógica subyacente a la forma en que se desarrollaron. Los autores también son acertadamente sensibles a las críticas poscoloniales a una iteración anterior de la historia global, que con demasiada frecuencia redujo a los pueblos no occidentales a "primitivos" o meras víctimas pasivas que permanecían fuera de la historia "real". Sin embargo, a veces llevan esa sensibilidad a un extremo. "Cada perspectiva o posicionamiento", escribe Hoerder, "implica un punto de vista, particular o partidista, y margina a otros de los muchos puntos de vista disponibles". Bueno, sí. Pero no todos los puntos de vista son igualmente importantes y precisos, y seguramente es posible hacer distinciones entre ellos sin caer en el eurocentrismo prejuiciado. Por desgracia, cuando el temor al reduccionismo se combina con el horror de la incorrección política, la descendencia es con demasiada frecuencia simple banalidad: "Durante el período de 1870 a 1945, el mundo se convirtió en un lugar más familiar y desconocido". ¿No sabíamos? esto ya?

Ciertamente, no deberíamos esperar de la historia global la prolijidad y el drama narrativo de una historia de Sherlock Holmes. ("Y así, Watson, la evidencia muestra indudablemente que el culpable es el imperialismo occidental". "Pero Holmes, eso es lo que dijiste la última vez"). Sin embargo, si es tan difícil hacer la historia global de una manera satisfactoria y atractiva y sin hacer injusticia a los múltiples actores de la historia, entonces quizás los historiadores no deberían invertir tanto esfuerzo y recursos en síntesis como este volumen. Tal vez el "giro global", para todas sus ideas e instrucciones, haya alcanzado un punto de rendimiento decreciente. El hecho de que la tecnología, la economía y la política contemporáneas nos hayan hecho tan plenamente conscientes de las conexiones globales en nuestros días no significa que los eventos pasados ​​siempre se resuelvan mejor al colocarlos dentro de un contexto igualmente amplio. "Podría limitarme en pocas palabras y considerarme un rey de espacio infinito", dijo Hamlet. Muchos de los fenómenos históricos más interesantes -piénsese únicamente en los orígenes de la mayoría de las principales religiones mundiales- han comenzado con cambios rápidos e increíblemente intensos que tuvieron lugar en espacios muy pequeños. Tal vez es hora de volverse hacia ellos.



jueves, 31 de mayo de 2018

Ridiculogramas, bolas de pelo y complejidad: Reflexiones para rederos

Ridículogramas: un diálogo ridículo

Petter Holme


Si eres un científico de redes, o andas juntado con uno, probablemente hayas escuchado acerca de los ridículogramas. Es una palabra despectiva irónica para tramas de redes enormes destinadas a impresionar por su complejidad. Tengo un vago recuerdo de alguien que acreditó a Marc Vidal por haberlo acuñado. En esta publicación de blog, exploraremos si realmente son tan ridículos en un diálogo entre mi gemelo Vidalesque y yo desde la tierra de las sombras.Las visualizaciones de grafos realmente dan una buena sensación para el tamaño y la complejidad de un sistema en red. A menudo también se puede entender la estructura a gran escala, gracias al ingenio de los algoritmos de visualización. Es posible que solo deba dejar su programa funcionando durante la noche. Anexo 1: Una red de 8507 nodos de flujos de pacientes entre unidades de un sistema regional de atención médica. Diferentes regiones geográficas salen como clusters en la red.



 

En serio hombre ¿Qué pasa si la trama es simplemente una bola de pelo sin estructura? Si lo ejecuta de la noche a la mañana y no ve ninguna estructura, ¿cómo puede estar seguro de que no lo hay? ¿Tendría que ejecutar el programa en una computadora cuántica de un millón de núcleos para verlo?

Si se trata simplemente de una bola de pelo sin estructura, ¿no es eso también interesante? Para una red lo suficientemente grande, los tipos de estructuras que son visibles en un ridículo son solo de todos modos mesoscópicos: estructura de la comunidad, estructura núcleo-periferia, otras fluctuaciones de densidad sin nombre,.

Puede haber todo tipo de otras estructuras, que debe medir con sus habilidades netsci ninja. Pero sí, es un fastidio que la mayoría del software disponible no te diga cuán bien convergente es el argumento. Uso para marcar algunos nodos, tomar capturas de pantalla y comprobar cuánto difieren a medida que pasan las horas.
Amigo, ahora entiendo por qué se llama ridiculograma! Eso es como revisar fotos del cielo para el Planeta X. . Además, si ejecuta el programa nuevamente, no verá lo mismo.
Si ejecutas esos programas de (algoritmo de energía de) relajación de resortes dos veces, no dan exactamente las mismas parcelas, sino parcelas que dan la misma impresión. 
Eso no suena muy exacto, ¿verdad? 
Por supuesto, son complementarios al resto de los análisis. Eres ese tipo de persona que piensa que cada trama en un documento debe corresponderse con un punto que hagas en el texto. ¡Las figuras podrían ser mucho más que eso! Si escribes un artículo sobre una especie animal peluda de cinco patas que descubriste, supongo que no pondrás una foto, porque podría describirse en el texto. .

 [aquí el diálogo se sale de control y se convierte en blasfemias y violencia]

martes, 29 de mayo de 2018

Redes de contratación de docentes limita la difusión de ideas

El prestigio impulsa la desigualdad epistémica en la difusión de las ideas científicas

Allison C. Morgan, Dimitrios Economou, Samuel F. Way, Aaron Clauset
PDF










    
La difusión de ideas en la comunidad científica a menudo se ve como una competencia, en la cual las buenas ideas se extienden aún más debido a una mayor aptitud intrínseca. Como resultado, comúnmente se cree que el lugar de publicación y los recuentos de citas se correlacionan con la importancia y el impacto. Sin embargo, se sabe relativamente poco sobre cómo los factores estructurales influyen en la difusión de las ideas, y específicamente cómo se origina una idea puede influir en cómo se propaga. Aquí, investigamos el papel de las redes de contratación de docentes, que encarnan el conjunto de transiciones de los investigadores de doctorado a las instituciones docentes, en la conformación de la difusión de ideas en ciencias de la computación, y la importancia de en qué parte de la red se origina una idea. Consideramos datos completos sobre los eventos de contratación de 5.032 docentes en los 205 departamentos de ciencias de la computación que otorgan doctorado en los Estados Unidos y Canadá, y sobre los tiempos y los títulos de 200.476 publicaciones asociadas. Analizando tres temas de investigación populares, demostramos empíricamente que la contratación de docentes juega un papel importante en impulsar la difusión de ideas en toda la comunidad. Luego utilizamos modelos de epidemia para simular la propagación genérica de ideas de investigación y cuantificar las consecuencias de dónde se origina una idea en su difusión a largo plazo a través de la red. Encontramos que la investigación de instituciones de prestigio se extiende más rápida y completamente que un trabajo de calidad similar originado en instituciones menos prestigiosas. Nuestros análisis establecen las compensaciones teóricas entre el prestigio de la universidad y la calidad de las ideas necesarias para una circulación eficiente. Estos resultados sugieren un límite inferior para la desigualdad epistémica, identifican un mecanismo para la ventaja epistémica persistente observada para las instituciones de élite y resaltan las limitaciones para los ideales meritocráticos.



sábado, 26 de mayo de 2018

Jerarquía y superposición de comunidades en redes complejas

Detectar la estructura sobrepuesta y jerárquica de comunidades en complejas redes

Andrea Lancichinetti, Santo Fortunato y János Kertész
Publicado el 10 de marzo de 2009 • IOP Publishing and Deutsche Physikalische Gesellschaft
New Journal of Physics


Resumen
Muchas redes en la naturaleza, la sociedad y la tecnología se caracterizan por un nivel de organización mesoscópico, con grupos de nodos que forman unidades estrechamente conectadas, llamadas comunidades o módulos, que están débilmente vinculadas entre sí. Descubrir esta estructura de comunidad es uno de los problemas más importantes en el campo de las redes complejas. Las redes a menudo muestran una organización jerárquica, con comunidades integradas en otras comunidades; además, los nodos se pueden compartir entre diferentes comunidades. Aquí, presentamos el primer algoritmo que encuentra comunidades superpuestas y la estructura jerárquica. El método se basa en la optimización local de una función de aptitud. La estructura de la comunidad se revela por los picos en el histograma de la aptitud física. La resolución puede ajustarse mediante un parámetro que permita investigar los diferentes niveles jerárquicos de la organización. Las pruebas en redes reales y artificiales dan excelentes resultados.

1. Introducción

El estudio de las redes como el 'andamio de la complejidad' ha demostrado ser muy exitoso para comprender tanto la estructura como la función de muchos sistemas naturales y artificiales [1] - [5]. Una característica común de las redes complejas es la estructura de la comunidad [6] - [9], es decir, la existencia de grupos de nodos tales que los nodos dentro de un grupo están mucho más conectados entre sí que con el resto de la red. Los módulos o las comunidades reflejan las relaciones topológicas entre los elementos del sistema subyacente y representan las entidades funcionales. Por ejemplo, las comunidades pueden ser grupos de personas relacionadas en las redes sociales [6, 10, 11], conjuntos de páginas web que tratan el mismo tema [12], categorías taxonómicas en redes tróficas [13, 14], rutas bioquímicas en redes metabólicas [15] - [17], etc. Por lo tanto, la identificación de las comunidades es de importancia central, pero sigue siendo una tarea formidable.
La solución se ve obstaculizada por el hecho de que la organización de redes en el nivel modular "mesoscópico" generalmente es altamente no trivial, por al menos dos razones. En primer lugar, a menudo existe toda una jerarquía de módulos, porque las comunidades están anidadas: las comunidades pequeñas construyen las más grandes, que a su vez se agrupan para formar otras aún más grandes, etc. Un ejemplo podría ser la organización de una empresa grande, y ha sido argumentó que la complejidad de la vida también se puede asignar a una jerarquía de redes [18]. La forma jerárquica de organización puede ser muy eficiente, y los módulos se encargan de las funciones específicas del sistema [19]. En presencia de una jerarquía, el concepto de estructura de la comunidad se vuelve más rico y exige un método que sea capaz de detectar todos los niveles modulares, no solo uno. La agrupación jerárquica es una técnica bien conocida en el análisis de redes sociales [20, 21], la biología [22] y las finanzas [23]. A partir de una partición en la que cada nodo es su propia comunidad, o todos los nodos están en la misma comunidad, se fusionan o dividen los clústeres según una medida topológica de similitud entre los nodos. De esta manera, uno construye un árbol jerárquico de particiones, llamado dendrograma. Aunque este método produce naturalmente una jerarquía de particiones, nada se conoce a priori sobre sus cualidades. La modularidad de Newman y Girvan [24] es una medida de la calidad de una partición, pero puede identificar una única partición, es decir, la que corresponde al valor más grande de la medida. Recientemente, los académicos comenzaron a enfocarse en el problema de identificar jerarquías significativas [19, 25].
Una segunda dificultad es causada por el hecho de que los nodos a menudo pertenecen a más de un módulo, lo que resulta en la superposición de comunidades [17], [26] - [29]. Por ejemplo, las personas pertenecen a diferentes comunidades sociales, dependiendo de sus familias, amigos, profesiones, pasatiempos, etc. Los nodos que pertenecen a más de una comunidad son un problema para los métodos estándar y reducen la calidad de los módulos detectados. Además, esto oculta información importante, y a menudo conduce a clasificaciones erróneas. El problema de la superposición de las comunidades se expuso en [17], donde también se ofreció una solución. El método propuesto se basa en la percolación de la camarilla: una k-clique (un subgrafo completo de k nodos) se extiende a través de la red a través de otras camarillas con k-1 nodos comunes. De esta forma, se puede llegar a un conjunto de nodos, que se identifica como una comunidad. Un nodo puede participar en más de una de esas unidades, por lo tanto, las superposiciones ocurren naturalmente. El método, sin embargo, no es adecuado para la detección de la estructura jerárquica, ya que una vez que se especifica el tamaño k de la camarilla, en su mayoría se puede recuperar una sola estructura modular. En la figura 1, mostramos distintas redes con estructura jerárquica y comunidades superpuestas, aunque debe enfatizarse que estas características a menudo ocurren simultáneamente.




Figura 1. Parte superior: una red con una estructura jerárquica. Cada uno de los cuatro grupos grandes está formado por 128 nodos y tiene una subdivisión interna en cuatro clústeres con 32 nodos. Abajo: comunidades superpuestas. Los nodos verdes están relacionados topológicamente con más grupos.

Con el fin de proporcionar la información más exhaustiva sobre la estructura modular de un grafo, un buen algoritmo debería ser capaz de detectar tanto comunidades superpuestas como jerarquías entre ellas. En este documento, presentamos un marco que cumple estas dos demandas. El método realiza una exploración local de la red, buscando la comunidad natural de cada nodo. Durante el procedimiento, los nodos se pueden visitar muchas veces, sin importar si se han asignado a una comunidad o no. De esta manera, las comunidades superpuestas se recuperan naturalmente. La variación de un parámetro de resolución, que determina el tamaño promedio de las comunidades, permite explorar todos los niveles jerárquicos de la red.

2. El método

La suposición básica detrás de nuestro algoritmo es que las comunidades son esencialmente estructuras locales, que involucran los nodos que pertenecen a los módulos mismos y como mucho un vecindario extendido de ellos. Esto es ciertamente plausible para redes grandes, donde cada nodo no depende de la mayoría de sus pares. En el grafo de enlace de la WWW, por ejemplo, uno ni siquiera tiene una percepción de qué tan grande es la red, y las comunidades temáticas se forman basándose solo en información parcial sobre el grafo. Del mismo modo, las comunidades sociales son estructuras locales sin ninguna referencia a la humanidad como un todo.
Aquí, una comunidad es un subgrafo identificado por la maximización de una propiedad o aptitud de sus nodos. Hemos probado varias opciones para la forma de la condición física y obtuvimos los mejores resultados con la expresión simple



dónde  y  son los grados totales internos y externos de los nodos del módulo , y α es un parámetro positivo de valor real, que controla el tamaño de las comunidades. El grado interno de un módulo equivale al doble del número de enlaces internos del módulo. El grado externo es el número de enlaces que unen a cada miembro del módulo con el resto del grafo. El objetivo de este documento es determinar un subgrafo que comience en el nodo A de manera que la inclusión de un nuevo nodo o la eliminación de un nodo del subgrafo disminuya. Llamamos a este subgrafo la comunidad natural del nodo A. Esto equivale a determinar los máximos locales para la función de aptitud para un α determinado. El máximo verdadero para cada nodo corresponde trivialmente a toda la red, porque en este caso y el valor de es el más grande que la medida puede alcanzar para un α determinado. La idea de detectar comunidades mediante una optimización local de alguna métrica ya se aplicó anteriormente [26, 27, 30, 31].

Es útil introducir el concepto de aptitud del nodo. Dada una función de aptitud, la aptitud de un nodo A con respecto a un subgrafo , se define como la variación de la aptitud del subgrafo  con y sin el nodo A, es decir.

Equation (2)

En la ecuación (2), el símbolo () indica el subgrafo obtenido del módulo  con el nodo A dentro (afuera).

La comunidad natural del nodo A se identifica con el siguiente procedimiento. Supongamos que hemos cubierto un subgrafo  que incluye el nodo A. Inicialmente,  se identifica con el nodo A (). Cada iteración del algoritmo consta de los siguientes pasos:

La comunidad natural del nodo A se identifica con el siguiente procedimiento. Supongamos que hemos cubierto un subgrafo que incluye el nodo A. Inicialmente, se identifica con el nodo A (). Cada iteración del algoritmo consta de los siguientes pasos:

1. un bucle se realiza sobre todos los nodos vecinos de  no incluidos en ;
2. se agrega el vecino con la aptitud más grande a , produciendo un subgrafo  más grande;
3. la aptitud de cada nodo de  es recalculada;
4. si un nodo tiene una aptitud física negativa, se elimina de este , produciendo un nuevo subgrafo ;
5. si ocurre 4, repita desde 3, de lo contrario repita desde 1 para el subgrafo .

El proceso se detiene cuando los nodos examinados en el paso 1 tienen una aptitud física negativa (figura 2). Este procedimiento corresponde a una especie de optimización codiciosa de la función de aptitud, ya que en cada movimiento se busca el mayor aumento posible. Otras recetas pueden ser adoptadas también. Por ejemplo, uno podría retroceder los nodos con una aptitud física negativa solo cuando el clúster deja de crecer y / o incluir en el clúster el primer nodo vecino que produce un aumento de la aptitud. Dichas recetas pueden conducir a clústeres de acondicionamiento físico más altos en un tiempo más corto, y merecen investigaciones en profundidad, que dejamos para el trabajo futuro.

Figura 2. Ejemplo esquemático de comunidad natural para un nodo (punto azul celeste en la figura) según nuestra definición. Los nodos azules son los otros miembros del grupo y tienen una aptitud física positiva dentro del grupo, mientras que los nodos rojos tienen una aptitud física negativa con respecto al grupo.

Definimos una cubierta del grafo como un conjunto de clústeres de modo que cada nodo se asigna a al menos un clúster. Esta es una extensión del concepto tradicional de partición de grafos (en la cual cada nodo pertenece a un solo grupo), para tener en cuenta posibles comunidades superpuestas. En nuestro caso, detectar una cobertura equivale a descubrir la comunidad natural de cada nodo del grafo que se estudia. La forma directa de lograr esto es repetir el procedimiento anterior para cada nodo individual. Esto es, sin embargo, computacionalmente costoso. Las comunidades naturales de muchos nodos a menudo coinciden, por lo que la mayor parte del tiempo de la computadora se utiliza para redescubrir los mismos módulos una y otra vez. Una salida económica se puede resumir de la siguiente manera:

1. elige un nodo A al azar;
2. detectar la comunidad natural del nodo A;
3. elegir al azar un nodo B aún no asignado a ningún grupo;
4. detectar la comunidad natural del nodo B, explorando todos los nodos independientemente de su posible pertenencia a otros grupos;
5. repetir desde 3.

El algoritmo se detiene cuando todos los nodos han sido asignados a al menos un grupo. Nuestra receta está justificada por el siguiente argumento. Los nodos de cada comunidad se superponen con otras comunidades o no. La comunidad fue explorada alrededor de un nodo específico; si uno elige cualquiera de los otros nodos, uno recuperaría la misma comunidad o una de las posibles comunidades superpuestas. Pero este último también se puede encontrar si uno parte de nodos que se encuentran fuera de la comunidad y no se superponen con él. De esta forma, uno debería recuperar todos los módulos sin necesidad de comenzar desde cada nodo. Al mismo tiempo, se cubrirán nodos superpuestos durante la construcción de cada comunidad a la que pertenecen, ya que es posible incluir nodos ya asignados a otros módulos. Extensas pruebas numéricas muestran que la pérdida de precisión es mínima si se procede como sugerimos en lugar de encontrar la comunidad natural de todos los nodos. Observamos que el procedimiento tiene cierto grado de estocasticidad, debido a la elección aleatoria de las semillas de nodo de las cuales las comunidades están cerradas. Este problema se analiza en el apéndice A.

El parámetro α sintoniza la resolución del método. La fijación de α significa establecer la escala a la que estamos mirando la red. Los valores grandes de α producen comunidades muy pequeñas, los valores pequeños en cambio proporcionan módulos grandes. Si α es lo suficientemente pequeño, todos los nodos terminan en el mismo clúster, la red misma. Hemos encontrado que, en la mayoría de los casos, para α <0.5, solo hay una comunidad; para α> 2, uno recupera las comunidades más pequeñas. Una elección natural es α = 1, ya que es la relación entre el grado externo y el grado total de la comunidad. Esto corresponde a la llamada definición débil de comunidad introducida por Radicchi et al [32]. Encontramos que, en la mayoría de los casos, la cobertura encontrada para α = 1 es relevante, por lo que brinda información útil sobre la estructura de la comunidad real del grafo en cuestión. Mantener un valor específico de α significa restringir la resolución del método, al igual que sucede al optimizar la modularidad de Newman-Girvan [33, 34]. Sin embargo, no se puede saber a priori qué tan grandes son las comunidades, ya que esta es una de las incógnitas del problema, por lo que es necesario comparar las coberturas obtenidas a diferentes escalas.

Al variar el parámetro de resolución uno explora toda la jerarquía de las cubiertas del grafo, desde toda la red hasta los nodos individuales, lo que lleva a la información más completa sobre la estructura de la comunidad de la red. Sin embargo, el método también proporciona una forma natural de clasificar las coberturas según su relevancia. Es razonable pensar que una buena cobertura de la red es estable, es decir, que solo se puede destruir cambiando sensiblemente el valor de α para el que se recuperó. Cada portada se entrega para α que se encuentra dentro de cierto rango. Una cobertura estable estaría indicada por un amplio rango de α. Lo que necesitamos es un índice cuantitativo para etiquetar una cobertura . Adoptaremos el valor promedio  de la aptitud de sus comunidades, es decir

Equation (3)

donde nc es el número de módulos. La aptitud debe calcularse para un valor fijo de α (elegimos α = 1 por simplicidad), de modo que se puedan reconocer cubiertas idénticas (diferentes) por valores iguales (diferentes). Obtendremos el histograma de los valores  de las cubiertas obtenidas para diferentes valores α: las cubiertas estables se revelan mediante picos pronunciados en el histograma de aptitud física resultante. Cuanto más alto es el pico, más estable es la cobertura. De esta manera, las cubiertas se pueden clasificar según su frecuencia. Un concepto similar de estabilidad ha sido adoptado en un estudio reciente, donde se introdujo un parámetro de resolución en la modularidad de Newman-Girvan [35].

Una pregunta natural es cómo combinar comunidades jerárquicas con comunidades superpuestas, ya que el significado habitual de la jerarquía parece incompatible con la existencia de nodos compartidos entre las comunidades. Sin embargo, esto es solo aparente y la misma definición de particiones jerárquicas puede extenderse al caso de comunidades superpuestas. Decimos que hay dos coberturas  y  están ordenados jerárquicamente, con un número  superior a , si todos los nodos de cada comunidad de  participan (total o parcialmente) en una sola comunidad de cobertura .

Es difícil estimar la complejidad computacional del algoritmo, ya que depende del tamaño de las comunidades y del alcance de sus superposiciones, que a su vez depende en gran medida de la red específica que se estudia junto con el valor del parámetro α. El tiempo para construir una comunidad con nodos s se escala aproximadamente como O(s2), debido a los pasos de retroceso. Por lo tanto, una estimación aproximada de la complejidad para un valor α fijo es O(nclangs2rang), donde nc es el número de módulos de la cubierta entregada y langs2rang el segundo momento del tamaño de la comunidad. El cuadrado proviene del ciclo de todos los nodos de una comunidad para verificar su estado físico después de cada movimiento. La complejidad del caso más desfavorable es O(n2), donde n es la cantidad de nodos de la red cuando las comunidades son de un tamaño comparable con n. En general, este no es el caso, por lo que en la mayoría de las aplicaciones el algoritmo se ejecuta mucho más rápido y casi linealmente cuando las comunidades son pequeñas. La situación se muestra en la figura 3, donde trazamos el tiempo para ejecutar el algoritmo hasta su finalización para dos valores α diferentes como una función del número de nodos para los grafos Erdös-Rényi con un grado promedio de 10: la complejidad va desde la cuadrática a lineal. La complejidad total del algoritmo para realizar el análisis completo de una red también depende del número de valores α necesarios para resolver su estructura jerárquica. Cuanto mejor se muestre la jerarquía de cubiertas, mayor será el número de valores α utilizados para ejecutar el algoritmo. Si la red tiene una estructura jerárquica, como sucede a menudo en sistemas reales, el número de cubiertas crece como log n. En este caso, el número de diferentes valores α necesarios para resolver la jerarquía también es del orden de log n y el análisis completo puede llevarse a cabo muy rápidamente. Notamos que cada iteración del algoritmo para un α dado es independiente de los otros. Entonces, el cálculo se puede paralelizar trivialmente ejecutando diferentes valores α en cada computadora. Si no se dispone de grandes recursos informáticos, una manera económica de proceder podría ser comenzar desde un gran valor α, para el cual el algoritmo se ejecuta hasta su finalización en un tiempo muy corto, y usar la cubierta final como configuración inicial para una ejecución en un valor α ligeramente menor. Dado que la cubierta correspondiente es similar a la inicial, la segunda carrera también se completará en un tiempo corto y uno puede repetir el procedimiento hasta la izquierda del rango de α.


Figura 3. Complejidad computacional del algoritmo. Las dos curvas muestran cómo el tiempo para ejecutar el algoritmo se escala con el tamaño del grafo para redes Erdös-Rényi con un grado promedio de 10 para α = 0.9 y 1.6, respectivamente. La complejidad varía desde cuadrático para α = 0.9, para el cual las comunidades son considerables, hasta lineal para α = 1.6, para el cual las comunidades son pequeñas.

Concluimos que para las redes jerárquicas nuestro procedimiento tiene una complejidad computacional del peor caso de O(n2log n). Observamos que, si bien es cierto que actualmente varios algoritmos tienen una complejidad menor, ninguno de ellos es capaz de llevar a cabo un análisis completo de la estructura jerárquica de la comunidad, ya que generalmente ofrecen una única partición. Por lo tanto, una comparación justa no es posible. Además, otras recetas para la optimización local de nuestra u otras funciones de acondicionamiento físico pueden reducir considerablemente la complejidad computacional del algoritmo, lo que parece una prometedora dirección de investigación para el futuro.

3. Resultados

Probamos ampliamente nuestro método en redes artificiales con una estructura de comunidad jerárquica incorporada. Adoptamos una referencia similar a la propuesta recientemente por Arenas et al [36, 37], que es una simple extensión de la referencia clásica propuesta por Girvan y Newman [6]. Hay 512 nodos, organizados en 16 grupos de 32 nodos cada uno. Los 16 grupos están ordenados en cuatro supergrupos. Cada nodo tiene un promedio de enlaces k1 con los 31 socios de su grupo y enlaces k2 con los 96 nodos de otros tres grupos dentro del mismo supergrupo. Además, cada nodo tiene un número k3 de enlaces con el resto de la red. De esta forma, surgen dos niveles jerárquicos: uno que consta de los 16 grupos pequeños y uno de los supergrupos con 128 nodos cada uno (la figura 1 (arriba) es un ejemplo). El grado de mezcla de los cuatro supergrupos se expresa mediante el parámetro k3 que sintonizamos libremente. En principio, también podríamos sintonizar la mezcla de las pequeñas comunidades, variando la relación k1 / k2, pero preferimos establecer k1 = k2 = 16, de modo que las microcomunidades sean "borrosas", es decir, bien mezcladas entre sí. , y plantear una dura prueba para nuestro método.

Tenemos que verificar si la jerarquía incorporada se recupera a través del algoritmo. Esto, en general, depende del parámetro k3. Por lo tanto, consideramos diferentes valores de k3: para cada valor, construimos 100 realizaciones de la red. Para comparar la estructura modular incorporada con la proporcionada por el algoritmo, adoptamos la información mutua normalizada, una medida de similitud tomada de la teoría de la información, que ha demostrado ser confiable [38]. La extensión de la medida a la superposición de comunidades no es trivial y existen varias alternativas. Nuestra extensión se analiza en el apéndice B. En la figura 4, trazamos el valor promedio de la información mutua normalizada como una función de k3 para los dos niveles jerárquicos. Vemos que en ambos casos los resultados son muy buenos. La cobertura en los cuatro supergrupos o macrocomunidades está identificada correctamente para k3 <24, con muy pocas excepciones, y el algoritmo comienza a fallar solo cuando k3 ~ 32, es decir, cuando cada nodo tiene 32 enlaces dentro y 32 fuera de su macro- comunidad, que luego se mezcla bien con los demás. El rendimiento también es muy bueno para el nivel jerárquico inferior: los módulos siempre están bien mezclados entre sí, ya que k1 = k2 = 16 para cualquier valor de k3, por lo que es notable que la estructura modular resultante encontrada por el algoritmo esté todavía tan cerca de la estructura modular incorporada, hasta k3 ~ 32. El principal problema con este tipo de pruebas es que no se cuenta con información independiente sobre las cubiertas, por lo tanto, solo se puede juzgar si son razonables o no. Afortunadamente, para algunas redes, las cubiertas se identificaron con información especial sobre el sistema y / o su historial. En la figura 5, mostramos los histogramas de fitness correspondientes a algunas de estas redes, a menudo utilizados para probar algoritmos: el club de karate Zachary [39] (panel superior izquierdo), la red de delfines de Lusseau [40] (panel superior derecho) y el red de equipos de fútbol americano universitario [6] (panel inferior izquierdo). La red social de miembros del club de karate estudiada por el sociólogo Wayne Zachary se ha convertido en un punto de referencia para todos los métodos de detección comunitaria. La red consta de 34 nodos, que se separaron en dos grupos distintos debido a un contraste entre uno de los instructores y el administrador del club. La pregunta es si uno es capaz de detectar la fisión social de la red. La segunda red representa las interacciones sociales de los delfines mulares que viven en Doubtful Sound, Nueva Zelanda. La red fue estudiada por el biólogo David Lusseau, quien dividió los delfines en dos grupos según su edad. El tercer ejemplo es la red de equipos de fútbol americano universitario. Aquí, hay 115 nodos, que representan a los equipos, y dos nodos están conectados si sus equipos juegan uno contra el otro. Los equipos están divididos en 12 conferencias. Los juegos entre equipos en la misma conferencia son más frecuentes que los juegos entre equipos de diferentes conferencias, por lo que uno tiene una cobertura natural donde las comunidades corresponden a las conferencias.


Figura 4. Prueba de la precisión de nuestro método en un punto de referencia jerárquico. La información mutua normalizada se usa para comparar la cobertura encontrada por el algoritmo con la cobertura natural de la red en cada nivel. En el nivel superior (círculos), las comunidades son cuatro clusters, cada uno de los cuales incluye 32 nodos, para un total de 128 nodos por clúster. Nuestro método encuentra los grupos correctos siempre que no estén bien mezclados entre sí. En el nivel inferior (cuadrados), las comunidades son 16 grupos de 32 nodos cada uno. El método funciona muy bien, teniendo en cuenta que cada nodo tiene tantos enlaces dentro como fuera de cada microcomunidad, para cualquier valor de k3. La línea vertical punteada marca las configuraciones de grafo para las cuales el número de enlaces de cada nodo dentro de su macrocomunidad es igual a la cantidad de enlaces que conectan el nodo con las otras tres macrocomunidades.


Figura 5. Análisis de redes reales. Los histogramas de aptitud corresponden al club de karate de Zachary (panel superior izquierdo), la red de delfines de Lusseau (panel superior derecho) y la red de equipos de fútbol americano universitario (panel inferior izquierdo). Los picos más altos indican las mejores coberturas, que coinciden con las coberturas naturales de los grafos, a excepción del club de karate de Zachary, donde corresponde a la misma división en cuatro clústers encontrados a través de la optimización de la modularidad. Sin embargo, la cobertura social en dos de las redes es la tercera tapa más relevante. En el panel inferior derecho, mostramos el histograma de fitness para un grafo aleatorio Erdös-Rényi con 100 nodos y el mismo grado promedio que la red de equipos de fútbol americano universitario: no hay una estructura visible, como se esperaba.

Los picos pronunciados en los histogramas de la figura 5 muestran que estas redes sí tienen estructura de comunidad. Para la red de Zachary, encontramos que la cubierta más estable consiste en cuatro clusters. Incluso si esto no es lo que a uno le gustaría recuperar, hacemos hincapié en que esta cobertura a menudo se encuentra por otros métodos, como la optimización de la modularidad, que indica que es topológicamente significativo. Pero nuestro método puede funcionar mejor: la división social en dos grupos (figura 6 (a)) resulta ser un nivel jerárquico más alto, dado por una fusión por pares de las cuatro comunidades de la cobertura principal. Curiosamente, encontramos que los dos grupos se superponen y comparten algunos nodos. Para la red de delfines, el pico más alto corresponde a la subdivisión de Lusseau de la población de animales en dos comunidades, con cierta superposición entre los dos grupos (figura 6 (b)). De manera similar, el pico más alto en la figura 5 (panel inferior izquierdo) corresponde a la partición natural de los equipos en conferencias.


Figura 6. (a) club de karate de Zachary. Mostramos los niveles jerárquicos correspondientes a la cobertura en dos grupos (0,76 <α <0,84). Los nodos 3, 9, 10, 14 y 31 se comparten entre los dos grupos: dichos nodos a menudo se clasifican erróneamente mediante algoritmos tradicionales. Los nodos superpuestos reflejan la fisión social observada por Zachary, ilustrada por los cuadrados y los círculos en la figura. (b) La red de delfines mulares de Lusseau. La mejor cobertura en dos conglomerados que encontramos (0,77 <α <0,82) concuerda con la separación observada por Lusseau (cuadrados y círculos en la figura). Los nodos 8, 20, 29, 31 y 40 se comparten entre los dos grupos.

Para verificar qué tan bueno es nuestro algoritmo en comparación con otros métodos, hemos analizado el karate, los delfines y las redes de fútbol americano universitario con el método de filtración de camarilla (CPM) de Palla et al [17]. Los valores de la información mutua normalizada de las coberturas encontradas por el algoritmo con respecto a las coberturas reales son 0.690 (nuestro método) y 0.170 (CPM) para el club de karate, 0.781 (nuestro método) y 0.254 (CPM) para los delfines. red, y 0.754 (nuestro método) y 0.697 (CPM) para la red de fútbol americano universitario. Por lo tanto, nuestro método es superior al CPM en estos casos. Por otro lado, el CPM funciona mejor para redes con muchas camarillas. Un ejemplo está representado por la palabra asociación de red construida en la Asociación de Normas Libres de la Universidad del Sur de la Florida [41], analizada en [17]. El CPM encuentra grupos de palabras que corresponden a categorías bien definidas, mientras que con nuestro método las categorías son más mixtas. Una razón importante de esta discrepancia es que nuestro método recupera nodos superpuestos que generalmente se encuentran en el límite entre comunidades, mientras que en la red de asociación de palabras a menudo son nodos centrales de una comunidad. Por ejemplo, la palabra "color" es el eje central de la comunidad de colores, pero también pertenece a otras categorías como "astronomía" y "luz".

Realizamos pruebas en muchos otros sistemas reales, incluidas redes de interacción de proteínas, redes de colaboración científica y otras redes sociales. En todos los casos, encontramos portadas razonables. Por otro lado, encontramos que los grafos aleatorios no tienen una estructura de comunidad natural, ya que las cubiertas son inestables (figura 5 (panel inferior derecho)). Esto es notable, ya que se sabe que otros enfoques también pueden encontrar cubiertas en grafos aleatorios [42], un problema que desencadenó un debate en curso sobre cuándo una portada es de hecho relevante [43].

En la figura 7, mostramos cómo el grado de superposición entre las comunidades depende del parámetro de resolución α, para tres redes reales. A partir de la figura, no es posible inferir ninguna dependencia sistemática de la superposición en α, el patrón depende en gran medida de la topología de grafo específica.


Figura 7. Fracción de nodos superpuestos como una función de α para las tres redes reales discutidas en la figura 5: el club de karate de Zachary y las redes de delfines y equipos de fútbol americano. No existe un patrón único, la extensión de la superposición no muestra una variación sistemática con α.

Concluimos la sección con un análisis de las propiedades estadísticas de la estructura de la comunidad en grafos. La Figura 8 muestra la distribución de tamaños de comunidad para una muestra del grafo de enlace WWW, correspondiente al subconjunto de páginas web dentro del dominio .gov. Analizamos el componente conectado más grande del grafo, que consta de 774 908 nodos y 4 711 340 enlaces. La figura hace referencia a la cubierta encontrada para α = 1, que se identificó en menos de 40 h de tiempo de CPU en una PC pequeña. La distribución del tamaño de la comunidad está sesgada, con una cola que sigue una ley de poder con el exponente 2.2 (1). El resultado es consistente con los análisis previos de distribuciones de tamaño de la comunidad en grafos grandes [8, 17, 44, 45], aunque este es el primer resultado relacionado con la WWW. Hacemos hincapié en que no hemos realizado un análisis completo de esta red, ya que requeriría una gran cantidad de procesadores para llevar a cabo el alto número de ejecuciones en diferentes valores α que son necesarios para un análisis confiable. Por lo tanto, la distribución en la figura 8 no corresponde necesariamente a la cobertura más significativa. Sin embargo, los valores α de las cubiertas más representativas de todas las redes que hemos considerado resultaron cercanas a 1, por lo que es probable que la gráfica de la figura 8 sea una aproximación aproximada de la distribución real.


Figura 8. Distribución de tamaños de comunidad para el grafo de enlace correspondiente al dominio .gov de la WWW. El parámetro de resolución α = 1. La distribución es claramente sesgada, de acuerdo con hallazgos previos en grafos grandes. La cola puede ajustarse bien mediante una ley de potencia con el exponente 2.2 (1) (línea discontinua en la figura).

4. Conclusiones

En este documento, presentamos el primer método que descubre simultáneamente tanto la estructura jerárquica como la estructura de comunidad superpuesta de redes complejas. El método consiste en encontrar los máximos locales de una función de aptitud mediante búsqueda iterativa local. El procedimiento permite que cada nodo se incluya en más de un módulo, lo que lleva a una descripción natural de comunidades superpuestas. Finalmente, ajustando el parámetro de resolución α se puede sondear la red a diferentes escalas, explorando la posible jerarquía de la estructura de la comunidad. La aplicación de nuestro método a varias redes construidas y empíricas ha dado excelentes resultados.

Nos gustaría hacer hincapié en que nuestro método proporciona un marco general que produce una gran clase de algoritmos. Por ejemplo, uno podría elegir una expresión diferente para la función de aptitud, otro criterio para definir la cubierta más significativa, o un procedimiento de optimización diferente de la aptitud para un solo grupo. La configuración que hemos probado demuestra ser muy confiable, pero no podemos excluir que las diferentes opciones rindan incluso mejores resultados. De hecho, el marco es tan flexible que se puede adaptar fácilmente al problema en cuestión: si uno tiene pistas sobre la topología de las comunidades que se encuentran para un sistema específico, esta información puede usarse para diseñar una función de acondicionamiento físico particular, teniendo en cuenta las características requeridas de los módulos.

Dado que el análisis completo de la estructura de la comunidad de una red se puede llevar a cabo simultáneamente en muchas computadoras, el límite de tamaño superior de los grafos tratables puede aumentar considerablemente. Nuestro método brinda la oportunidad de estudiar sistemáticamente la distribución de tamaños de comunidades de redes grandes hasta millones de nodos, un aspecto crucial de la organización interna de un grafo, que los estudiosos recién han empezado a examinar. Un subproducto interesante de nuestra técnica es la posibilidad de cuantificar la participación de nodos superpuestos en sus comunidades por los valores de su aptitud (nodo) con respecto a cada grupo al que pertenecen.

Finalmente, nos gustaría mencionar que el método puede extenderse naturalmente a redes ponderadas, es decir, redes donde los enlaces tienen un peso. No es necesario utilizar ningún tipo de umbralización [46], ya que la generalización de la fórmula de aptitud es sencilla: en la ecuación (1), tenemos que reemplazar el grado k con la fuerza correspondiente s (expresando la suma sobre los enlaces ' pesos). Las aplicaciones a las redes dirigidas también se pueden diseñar fácilmente con opciones adecuadas de la función de aptitud. Nuestra propia función (1) podría extenderse al caso dirigido, ya que considera el grado de los nodos de un subgrafo: es plausible suponer que el grado total de los nodos del subgrafo debido a enlaces internos al subgrafo excede el grado total de grado entrante producido por enlaces provenientes de nodos externos, si el subgrafo es una comunidad.

jueves, 24 de mayo de 2018

Protocolos de difusión afectan las cascadas de Facebook

¿Los protocolos de difusión gobiernan el crecimiento en cascada en Facebook?

Justin Cheng, Jon Kleinberg, Jure Leskovec, David Liben-Nowell, Bogdan State, Karthik Subbian, Lada Adamic

Figura 1: El árbol de difusión de una cascada con un protocolo de difusión voluntaria, donde los individuos publicaron música de un artista cuyo nombre coincidía con la letra que les asignó un amigo. Los enlaces se colorean de rojo (temprano) a azul (tarde).

Las grandes cascadas pueden desarrollarse en las redes sociales en línea a medida que las personas comparten información entre sí. Aunque las cascadas de compartición simples se han estudiado ampliamente, el alcance completo de comportamientos en cascada en las redes sociales es mucho más diverso. Aquí estudiamos cómo los protocolos de difusión, o los intercambios sociales que permiten la transmisión de información, afectan el crecimiento en cascada, de forma análoga a la forma en que los protocolos de comunicación definen cómo se transmite la información de un punto a otro. Estudiando 98 de las cascadas de información más grandes en Facebook, encontramos una amplia gama de protocolos de difusión, desde la distribución en cascada de imágenes, que usan un protocolo simple de tocar un solo botón para la propagación, hasta ALS Ice Bucket Challenge, cuyo protocolo de difusión involucraba individuos crear y publicar un video, y luego nominar a otros para que hagan lo mismo. Encontramos clases recurrentes de protocolos de difusión e identificamos dos factores clave de contrapeso en la construcción de estos protocolos, con implicaciones para el crecimiento de una cascada: el esfuerzo requerido para participar en la cascada y el costo social de permanecer al margen. Los protocolos que requieren un mayor esfuerzo individual ralentizan la propagación de una cascada, mientras que los que imponen un mayor costo social de no participar aumentan la probabilidad de adopción de la cascada. La previsibilidad de la transmisión también varía con el protocolo. Pero independientemente del mecanismo, todas las cascadas de nuestro análisis tienen un número de reproducción similar (≈ 1,8), lo que significa que las menores tasas de exposición se pueden compensar con mayores tasas de adopción por exposición. Por último, mostramos cómo la estructura de una cascada no solo puede diferenciar estos protocolos, sino también modelarse a través de procesos de ramificación. Juntos, estos hallazgos proporcionan un marco para comprender cómo una amplia variedad de cascadas de información puede lograr una adopción sustancial a través de una red.






ARXiv

martes, 22 de mayo de 2018

Introducción: Visualización en Gephi


Usando Gephi para visualización de datos


Autor: Maristella Feustle | Digital Humanities


Muchos de nosotros hemos estado haciendo visualizaciones básicas de datos cuantitativos desde la escuela primaria, convirtiendo la información numérica en cuadros y gráficos. En algún lugar a lo largo de la línea, la mayoría de nosotros también hemos encontrado diagramas de Venn para visualizar relaciones conceptuales y atributos que se tienen en común entre las entidades. Pero cuando pensamos en la visualización, las visualizaciones cuantitativas como las producidas por Excel son más accesibles.

Por supuesto, no todos los datos son cuantitativos. No todos los puntos de datos son números, y no todas las relaciones entre ellos son numéricas, y sin embargo, intuimos que el contexto puede ser tan complejo como importante. Ahí es donde entra Gephi. Si puedes articular una relación, puedes mapearla.

Gephi depende de la relación "triple" que también subyace a RDF, el modelo de metadatos del Marco de Descripción de Recursos, de claro interés para la biblioteca y la ciencia de la información. En el triple, Algo tiene una conexión con otra cosa. O bien, la Persona 1 está de alguna manera conectada a la Persona 2. El atributo 1 está conectado de alguna manera con el Atributo 2.

Los atributos son nodos, y la conexión, sea lo que sea, es un borde. Dos nodos más un borde son tres cosas, o un triple. Las conexiones pueden ser recíprocas, o solo una dirección.

Los ejemplos potenciales son virtualmente ilimitados: digamos, por ejemplo, que Jeremiah era una rana toro. Es decir, Jeremiah tiene el atributo de ser una rana toro. Jeremías y la rana toro (para acuñar un término) son nodos. Tener el atributo es una ventaja. Jeremiah también fue un buen amigo mío. Es decir, Jeremiah era miembro del grupo de buenos amigos míos.

Esas son solo algunas conexiones. ¿Qué pasa cuando tus conexiones tienen conexiones? Necesitamos una forma más sofisticada de hacer un seguimiento de ellos.

Esta demostración utiliza datos de listas de óperas y artistas intérpretes o ejecutantes en el apéndice de La Scala West de Ronald Davis: La Scala West: The Dallas Opera under Kelly and Rescigno, siguiendo aproximadamente los primeros diez años de producciones de la Ópera de Dallas.

Utilizando un valor separado por coma (archivo CSV), hemos articulado las personas y los roles que desempeñaron respectivamente como las dos columnas requeridas para que Gephi importe como una tabla de borde: Origen y Destino.

Aquí, vale la pena señalar que Gephi puede ser muy exigente con la forma en que se forman sus datos. Para evitar la creación de conexiones y nodos espurios, es importante asegurarse de que sus datos estén libres de espacios y caracteres adicionales que podrían, por ejemplo, hacer que Gephi decida que María [espacio] Callas y María [espacio espacial] Callas son dos personas diferentes Cuando tienes cientos o miles de nodos y conexiones, las distinciones innecesarias como esas realmente pueden arrojar tu visualización. Para la preparación de datos, OpenRefine es un compañero muy útil para Gephi.

Incluso con un conjunto de datos bien construido, la salida de visualización inicial de Gephi parece lanzar espaguetis y albóndigas en la pared, solo que más angulares:



La diferencia importante que debemos mencionar aquí es que Gephi hace los cálculos por usted, pero no toma decisiones por usted. Por lo tanto, depende de usted la elección de cómo aplicar los colores para diferenciar los tipos de nodos y aristas, o los grados de conectividad, y qué algoritmos representan mejor el significado que desea que su visualización muestre, qué etiquetar, etc. Estas características están fuertemente empaquetadas en la interfaz de usuario de Gephi, y experimentar con ellas es parte de la diversión del programa. Otras opciones residen en los complementos que vienen incluidos con el programa.

En este caso, el resultado final nos permitió mostrar en una sola imagen las complejidades de las conexiones entre los artistas intérpretes o ejecutantes en la Ópera de Dallas, así como los artistas principales, artistas frecuentes y producciones frecuentes en los primeros años de la Ópera de Dallas - en en resumen, un mapa de las relaciones entre los artistas intérpretes o ejecutantes, las obras y entre sí.




Para comenzar con Gephi, visite los enlaces a continuación:

https://gephi.org/tutorials/gephi-tutorial-quick_start.pdf (Refiere a una vieja versión, pero todavía útil)
http://www.martingrandjean.ch/gephi-introduction/
https://seinecle.github.io/gephi-tutorials/