domingo, 11 de febrero de 2018

Usando ARS para búsquedas de estructura en textos

Usando métodos de búsqueda eficientes para la estructuración del contenido





Esta charla fue preparada para la presentación de un libro en Motto Art Bookstore en Berlín. El libro, Way to Russia Guidance, es una guía de viajes a Rusia realizada por Nodus Labs en colaboración con el recurso en línea más popular sobre Rusia waytorussia.net, que utiliza polysingularity como metodología para estructurar el contenido del libro.

Nodus Lab


El problema de la búsqueda y la recuperación de contenido

Considere que estás buscando algo en un libro. ¿Cuáles son las diferentes estrategias que podrías usar?

Una opción sería leerlo desde el principio hasta el final, pero eso llevaría mucho tiempo y no es el método más eficiente. Usar una computadora ayudaría, pero básicamente hace lo mismo y solo funciona porque puede realizar millones de operaciones por segundo. Preguntar a alguien que sabe es otra opción, pero es posible que no estén disponibles o que quizás no lo recuerden.

Otra tarea más complicada es obtener una visión general rápida del contenido del libro.
Es comparable a la primera tarea, excepto que no sabes lo que estás buscando.

De hecho, este es un problema muy serio, especialmente en los momentos de sobrecarga de información.

Entonces, ¿cómo podría resolverse de la manera más eficiente?


Inspiración # 1: Estrategias de búsqueda de ADN

Cada célula de nuestro cuerpo se enfrenta al mismo problema. Cualquier proceso que implique leer información genética tiene que leer primero esa información de la molécula de ADN larga. Las proteínas de unión podrían simplemente deslizarse a lo largo de la longitud completa del ADN, pero tomaría mucho tiempo y no sería eficiente (también podrían encontrar obstáculos).

La forma en que la evolución resolvió este problema es una búsqueda 1D / 3D (Marcovitz & Levy 2013).



Para encontrar el lugar correcto para unirse a lo largo de la molécula de ADN, una proteína se desliza a través de su longitud por un período de tiempo (esto se denomina búsqueda 1D). Luego, ya sea a intervalos o porque encuentra un obstáculo, realiza un "salto" de un lugar de la molécula a otro (esto se denomina búsqueda 3D).

La combinación de deslizamiento y saltos produce una estrategia de búsqueda muy eficiente donde la proteína se une rápidamente a las partes de la molécula que está buscando.

Inspiración # 2: narrativas adivinatorias

Otro ejemplo proviene de un área, que es diferente, pero todavía está relacionada con el estudio de la vida.

Las narrativas de la Divinidad, como el Tarot y el I Ching, se han usado durante mucho tiempo para proporcionar orientación y ayudar a encontrar la información correcta para actuar.

Tanto el Tarot como el I Ching están estructurados de forma modular. Hay 22 cartas (arcanos mayores) en el Tarot, cada una de las cuales representa un concepto y cuenta una historia (lea nuestro estudio sobre la estructura de la red del Tarot para obtener más información). I Ching tiene 64 hexagramas, cada hexagrama también representa un cierto concepto o una historia.

La lectura divinacional avanza a través de una serie de iteraciones aleatorias donde el lector elige uno o varios puntos de partida para leer. Las cartas (o hexagramas) luego conducen a las otras cartas (o hexagramas), por lo que al final el lector obtiene una muy buena visión general de todo el contenido sin tener que leer todo el libro.

De esta forma, tanto el Tarot como el I Ching son estructuras narrativas muy eficientes en el sentido de que le permiten al lector obtener la esencia del contenido en solo una fracción del tiempo que llevaría revisarlo todo.

Las conexiones entre los elementos no son aleatorias. De hecho, hay una estructura muy precisa en juego, que permite al lector obtener la representación más completa de las diferentes partes de la narración.

Por ejemplo, cada carta en Tarot está conectada a la carta antes y después (simplemente por orden cronológico). Es como abrir una página al azar en un libro y leer un poco antes y después para obtener el contexto correcto.
Luego, hay dos ciclos en arcanos mayores del Tarot, un ciclo procede de la tarjeta n. ° 1 a la n. ° 10, el otro ciclo procede de la n. ° 11 a la n. ° 20. Cada tarjeta en el primer ciclo se conecta a la tarjeta en el ciclo paralelo "paralelo". Este ciclo paralelo es simplemente una línea argumental paralela que comienza en el medio del "libro" del Tarot y pasa por un desarrollo similar a la primera línea argumental, pero con algunas alternancias. Una historia que es más madura, en cierto sentido. Por ejemplo, una tarjeta n. ° 2 está conectada a la tarjeta n. ° 12, n. ° 5 a n. ° 15, y así sucesivamente.
Finalmente, el último enlace es desde el comienzo del primer ciclo hasta el final del ciclo alternativo. Es como abrir un libro de 22 páginas en la página 3 y también leer la página 19, para que pueda hacerse una idea sobre el comienzo y el final de la historia.

Si todas las conexiones que existen entre las diferentes tarjetas se representan como una red, obtendremos una estructura que se ve así:

Conexiones entre cartas del Tarot


Curiosamente, tiene forma de hélice, una estructura que a menudo se encuentra en la biología.

Como podemos ver, este tipo de estructura de red es un mecanismo eficiente para estructurar la narrativa en el sentido de que si comienzas a "leer" esa estructura desde cualquier punto del gráfico, cubrirás toda la forma con solo unos pocos movimientos a lo largo de los vértices .

De esta manera, la estructura de la narrativa del Tarot logra el mismo objetivo que la búsqueda de ADN 1D / 3D: combina los movimientos a lo largo de la línea (cronología) con saltos en 3D a través de la estructura para obtener una visión más completa de una manera más eficiente.

Aún más interesante, este tipo de estructura de hélice se relaciona con la forma en que los cromosomas humanos están conectados entre sí. Si representamos 22 cromosomas como un gráfico (omitimos el 23 porque es un interruptor X / Y masculino / femenino) sus interacciones son muy similares a la hélice del Tarot, que es otra evidencia visual de que este tipo de estructura puede ser muy eficiente para la recuperación de información. (Ver el trabajo de Lieberman-Aiden para los antecedentes científicos detrás de este enfoque)

Análisis de la red de conexiones cromosómicas basado en el método hi-c


De la teoría a la práctica: construcción de la narrativa de un libro

Decidimos aplicar las dos metodologías anteriores para una tarea práctica de estructurar el contenido de un libro.

El tema seleccionado fue la guía de viaje porque ya implica algún tipo de eficiencia en la estructuración y también porque la gente suele leer la guía de viaje de forma rizomática.

En aras de la simplicidad, nos referimos a los métodos anteriores (búsqueda 1D / 3D y estructura narrativa similar a hélice) como Polysingularity. La razón es que ambos métodos combinan movimientos locales dentro de un determinado grupo (página) con saltos de largo recorrido a través de los grupos (de una página a otra). Entonces, si tuviéramos que representar el contenido de un libro como una red, donde los distintos temas son los nodos y sus conexiones son las relaciones entre ellos, obtendríamos una estructura que parece una combinación de singularidades que son lo suficientemente distintas pero que están conectados el uno con el otro.



Siguiendo esta metodología para la estructuración del libro, identificamos varios temas y las relaciones entre ellos.

Por ejemplo, como la guía de viaje es para Rusia, una página trata del Sputnik (el famoso satélite ruso) y la siguiente página sobre el arma Kalashnikov (otro tipo de tecnología militar rusa conocida). Sin embargo, la página del Sputnik también enlaza con el museo de Cosmonáutica en Moscú pero también con un hermoso lago en las montañas Altay donde las partes de los cohetes de la estación de lanzamiento espacial Baikonur caen para producir efectos de iluminación sorprendentes y contaminar la naturaleza circundante.



Una página con consejos de seguridad para los viajeros les aconseja disipar cualquier tensión que pueda surgir durante su viaje a Rusia a través de la disipación, lo que se puede lograr utilizando prácticas físicas (como Systema), pero también, si salen a bailar a música techno o para disparar en el campo de tiro en Moscú. Por lo tanto, la narrativa original se ramifica en muchas direcciones diferentes y permite al lector obtener una gama completa de experiencias contrastantes.



Este tipo de estructura es similar a la estructura de enlace de los documentos de Internet, excepto que conscientemente intenta enfocarse no solo en el contenido que es similar y relacionado, sino también en el contenido que puede estar en el lado opuesto del espectro, enriqueciendo así la experiencia de los viajeros y también proporcionar una especie de narrativa meta-guía a través de la guía en sí.

Referencias

Marcovitz & Levy (2013). Obstacles May Facilitate and Direct DNA Search by Proteins. Biophysics Journal
Lieberman-Aiden et al (2010). Comprehensive mapping of long range interactions reveals folding principles of the human genome. Science Magazine.

No hay comentarios:

Publicar un comentario