La gran idea detrás de Big Data
ADAM FRANK - National Public RadioLa teoría de redes tiene cientos de aplicaciones, dice el físico Adam Frank.
Matjaz Slanic / Getty Images / iStockphoto
En la primavera de 2009, el virus H1N1 / 09, conocido como "gripe porcina", dio el salto de los cerdos a las personas y comenzó a reclamar sus primeras víctimas.
Temiendo el comienzo de una pandemia mundial de gripe porcina, los aterrorizados funcionarios de salud comenzaron a planificar lo peor. La clausura de los principales aeropuertos del mundo se convirtió en la opción nuclear de su arsenal: la última esperanza para detener el virus llega a límites de contagio imparables.
Eso, sin embargo, fue antes de que dos científicos italianos demostraran que el encofrado del sistema de transporte aéreo podría retrasar el temido umbral epidémico por, como máximo, unas pocas semanas (mientras que también conduce al caos económico).
Los investigadores que proporcionaron esta información crucial no eran médicos sino físicos. Más importante aún, las matemáticas que implementaron fueron las mismas que usan diariamente los investigadores de los gigantes de "Big Data" como Facebook, Google y la NSA. También fue la misma matemática utilizada por científicos de todo el mundo que estudian el genoma humano, las eficiencias de las redes eléctricas verdes, la economía del comercio mundial y un centenar de otras aplicaciones. Era la matemática de un nuevo tipo de ciencia cuya promesa había que sopesar contra el lado oscuro de Big Data, con todas sus implicaciones para la vigilancia y el control.
Es una ciencia llamada teoría de redes.
Durante más de 400 años, la ciencia ha transformado el mundo una y otra vez al descubrir nuevas adiciones a su censo de "cosas". Los descubrimientos de gérmenes microscópicos, de campos electromagnéticos, de genes y de quarks nos introdujeron a jugadores nuevos e inimaginables en el escenario cósmico.
A medida que encontramos nuestro camino en un mundo conformado por Big Data, no es la gran cantidad de información que reunimos, sino las redes que iluminan las que son la más reciente adición al índice de cosas de la ciencia. Eso es lo que hace que las redes sean la gran idea detrás de Big Data.
Pero, ¿qué son las redes y cómo encajan en nuestra cultura basada en datos? Una red es solo una entidad donde las conexiones entre las partes son más importantes que las partes mismas. Todos tenemos una experiencia íntima con las redes en la red de relaciones personales que se expande de usted a sus amigos y sus amigos, y así sucesivamente - la red social Facebook lo hizo de manera explícita. Pero los genes de los que depende la vida también forman una red donde la expresión de un gen depende de la actividad de otros. Las cadenas alimentarias interconectadas en ecología son redes de múltiples depredadores que se alimentan de múltiples capas de presas. La cadena de comercio mundial también es una red donde el comercio representa conexiones entre negocios y naciones.
Las redes están en todas partes en la naturaleza y la sociedad. Pero antes de que las computadoras nos concedieran el poder de recopilar, almacenar y analizar cantidades astronómicas de datos, Big Data, estábamos ciegos ante su penetración y su poder para dar forma al mundo.
El laberinto parecido a un espagueti de rutas aéreas que se encuentra en la parte posterior de su revista de a bordo le da una pista visual de por qué las redes (en este caso, la red de transporte aéreo) son difíciles de estudiar. Representan una propiedad que los científicos llaman complejidad. Cuando todo está conectado con todo lo demás, eso es complejidad, y crea problemas perversamente difíciles.
Las redes y su complejidad desafían la inclinación de la ciencia por el reduccionismo, por dividir los fenómenos en partes más pequeñas. Pero al ver las redes en términos de sus propios elementos esenciales, los científicos todavía han encontrado una manera de abrazar su holismo inherente. No importa cuán complejo sea, cada red es solo una colección de nodos (es decir, puntos) y conexiones (líneas).
El poder de esta abstracción es algo que cada habitante de la ciudad ya entiende a través de los mapas de tránsito, como los del metro de Londres. Las estaciones se convierten en puntos vinculados por líneas que representan diferentes rutas de tren. En 1931, Henry Beck desarrolló los primeros mapas abstractos de la red de metro después de muchos intentos fallidos de combinar una representación del sistema del metro con la geografía real de Londres. Beck finalmente se dio cuenta de que la geografía no les importaba a los jinetes. Al tratar de llegar desde Liverpool St. a Gloucester Rd., Solo la arquitectura de los enlaces entre las estaciones es importante.
La geografía importa menos que la "netografía". Esta es una lección fundamental para todas las redes y el primer paso para reconocerlas como una entidad nueva y distinta para que la ciencia explore.
Kevin Bacon entiende netografía. En la década de 1990, el juego "Six-Degrees of Kevin Bacon" relacionó al actor con cualquier otro jugador de Hollywood basado en las películas en las que aparecía, y enlazaba con actores en común de las películas. El juego Bacon se originó a partir de famosos experimentos tempranos con redes sociales que muestran que estás conectado con cualquier otro ciudadano de EE. UU. en solo seis enlaces.
Explicar este fenómeno de "seis grados de separación" fue una de las primeras victorias de Network Theory. Utilizando las matemáticas para representar nodos y conexiones, científicos como Steven Strogatz descubrieron cómo unos pocos atajos (como personas que se reúnen al azar en un tren) permiten que las redes se conviertan en mundos pequeños (sí, ese es un término técnico). Estos accesos directos reducen enormemente la cantidad de saltos necesarios para ir desde cualquier lugar de la red a cualquier otro lugar. En ese sentido, "es un mundo pequeño" no es solo un coloquialismo. Es una ley universal de estas "cosas" llamadas redes, así como la gravedad es una ley universal de las cosas llamada materia.
Las redes del mundo real son tan complejas, sin embargo, que los modelos matemáticos abstractos por sí solos solo van tan lejos. Aquí es donde Big Data entra en la historia, con el rápido crecimiento de Internet en la década de 1990. Con cada clic entre páginas web, cientos de millones de personas comenzaron a establecer pistas que los científicos podrían utilizar para finalmente mapear el comportamiento real de redes complejas. Al explorar estos enormes conjuntos de datos, los investigadores encontraron sorprendentes nuevas leyes sobre cómo se comportan las redes del mundo real. Una clave fue el descubrimiento de nodos superconectados que llamaron "centros". El aeropuerto O'Hare es un centro súper conectado en la red de transporte aéreo, al igual que Andy Warhol era un centro neurálgico en la red de arte de la ciudad de Nueva York.
Utilizando la primera generación de Big Data de Internet, investigadores como el físico Albert-László Barabási de Northeastern descubrieron centros que controlan el comportamiento de todas las grandes redes, desde la regulación de proteínas hasta las páginas web.
"La naturaleza evolucionó la red metabólica para las células durante más de 4 mil millones de años", dice Barabasi, "pero esa misma arquitectura surgió en la World Wide Web después de solo una década".
Diferentes redes, mismas leyes.
El encanto esencial de la ciencia siempre ha sido la oportunidad de comprender el mundo en un nivel fundamental. Para físicos como yo, esto ha significado estudiar las entidades más básicas del mundo, como las partículas subatómicas. Pero suba más en la escala de estructuras del mundo, desde moléculas a células y sociedades, y las "cosas" se vuelven más complejas y, finalmente, imposiblemente difíciles de describir de esta manera. Nadie está lo suficientemente loco como para intentar predecir la respuesta social a un terremoto al describir los átomos en sus víctimas. Reducir el todo a sus partes tiene límites. La teoría de redes ofrece un camino diferente, y eso es lo que lo hace tan emocionante.
Ver el mundo a través de la lente de la teoría de redes ofrece a los científicos una poderosa perspectiva de arriba hacia abajo. Mantiene la promesa de que podríamos encontrar leyes elegantes y matemáticas para dominios como el comportamiento del cerebro o el movimiento de la sociedad, dominios que solían estar fuera del alcance de tales descripciones. La Teoría de la Red promete ideas de un tipo que antes eran imposibles, y ya está cumpliendo esa promesa de una manera que puede ofrecer asistencia real a un mundo plagado de más de 7 mil millones de habitantes.
Es Network Science que permite a Alessandro Vespignani, uno de los investigadores que condujo el innovador estudio H1N1, cumplir con el reto de los Centros para el Control y la Prevención de Enfermedades de predecir con precisión la extensión anual de los brotes de gripe. Dichas predicciones de gripe mes a mes, imposibles en el pasado, pueden permitirle a los CDC un mejor tiempo de producción y distribución de vacunas. El politólogo David Lazer de Harvard está utilizando ideas similares para desarrollar herramientas que supervisen el comportamiento de las redes de telefonía celular tras las emergencias como el atentado de Boston Marathon. Al observar cómo se ilumina la red durante un desastre, es posible atravesar la niebla de la confusión e identificar exactamente dónde deben responder los primeros en responder a sus recursos. El rápido desarrollo de la comprensión de las redes también ha permitido a biólogos como Neo Martinez en la Universidad de Arizona, mapear la respuesta de todo un ecosistema al colapso de una sola especie. Los resultados de Martínez tienen la promesa de manejar con precisión las pesquerías frente al cambio climático y el agotamiento de los recursos con una agudeza que puede poner orden a su complejidad perversa.
Como científico, es imposible ignorar la perspectiva verdaderamente revolucionaria. La Teoría de la Red se abre no solo al mundo natural (el dominio tradicional de los físicos) sino también al mundo que hemos creado: el orden social y las tecnologías de las que depende. Pero como ciudadano, estoy profundamente preocupado por las implicaciones más oscuras inherentes a los recursos de Big Data en los que se basa esta nueva ciencia. Estamos obteniendo herramientas que pueden hacer que el mundo no solo sea menos humano, sino menos humano.
Sin embargo, equilibrar tales dualidades en una revolución científica no es nuevo. A finales del siglo XX, no sabíamos nada de los átomos o sus componentes. Penetrar en el mundo atómico nos llevó a las maravillas electrónicas diarias que ahora damos por sentadas. También nos permitió construir armas nucleares de inconcebible poder destructivo cuyo legado todavía nos persigue.
La teoría de la red es quizás la primera ciencia verdadera y universal que emerge de nuestra revolución digital. Nos ha dado una forma fundamentalmente nueva de comprender cómo se construye el mundo. Nos está mostrando que toda la vida existe en y a través de redes, cuya red de conexiones parpadea, parpadea y pulsa con energía e información.
A medida que se expanda ese conocimiento y se entiendan sus implicaciones, el miedo debe equilibrarse con una discusión informada.