Mostrando entradas con la etiqueta redes de co-ocurrencia. Mostrar todas las entradas
Mostrando entradas con la etiqueta redes de co-ocurrencia. Mostrar todas las entradas

jueves, 29 de marzo de 2018

Redes de sabores y principios de maridaje

La red de sabores y los principios del maridaje de alimentos

Yong-Yeol Ahn, Sebastian E. Ahnert, James P. Bagrow y Albert-László Barabási
Scientific Reports volume 1, Article number: 196 (2011)
doi: 10.1038/srep00196
Nature

Resumen

La diversidad cultural de la práctica culinaria, ilustrada por la variedad de cocinas regionales, plantea la cuestión de si existen patrones generales que determinen las combinaciones de ingredientes utilizadas en la comida de hoy o los principios que trascienden los gustos y las recetas individuales. Presentamos una red de sabores que captura los compuestos de sabor compartidos por ingredientes culinarios. Las cocinas occidentales muestran una tendencia a utilizar pares de ingredientes que comparten muchos compuestos de sabor, apoyando la llamada hipótesis de emparejamiento de alimentos. Por el contrario, las cocinas del este de Asia tienden a evitar el uso compartido de ingredientes. Dada la disponibilidad cada vez mayor de información sobre la preparación de alimentos, nuestra investigación impulsada por datos abre nuevos caminos hacia una comprensión sistemática de la práctica culinaria.

Introducción

Como omnívoros, los seres humanos históricamente hemos enfrentado la difícil tarea de identificar y recolectar alimentos que satisfagan las necesidades nutricionales mientras se evitan las enfermedades transmitidas por los alimentos1. Este proceso ha contribuido a la dieta actual de los seres humanos, que está influenciada por factores que van desde una preferencia evolucionada por el azúcar y la grasa hasta la palatabilidad, el valor nutricional, la cultura, la facilidad de producción y el clima1,2,3,4,5,6, 7,8,9. El número relativamente pequeño de recetas en uso (~106, por ejemplo, http://cookpad.com) en comparación con el enorme número de recetas posibles (> 1015, ver Información complementaria Sec S1.2), junto con la recurrencia frecuente de combinaciones particulares en varias cocinas regionales, indica que estamos explotando, pero una pequeña fracción de las posibles combinaciones. Aunque este patrón en sí mismo puede explicarse por un modelo evolutivo simple10 o por enfoques basados ​​en datos11, aún queda una pregunta fundamental: ¿existen principios cuantificables y reproducibles detrás de nuestra elección de ciertas combinaciones de ingredientes y evitación de otros?

Aunque muchos factores como los colores, la textura, la temperatura y el sonido desempeñan un papel importante en la sensación alimenticia12,13,14,15, la palatabilidad está determinada en gran medida por el sabor, que representa un grupo de sensaciones que incluyen olores (debido a moléculas que pueden unirse a receptores olfatorios) ), sabores (debido a las moléculas que estimulan las papilas gustativas) y frescura o pungencia (sentidos del trigémino) 16. Por lo tanto, el perfil del compuesto de sabor (químico) de los ingredientes culinarios es un punto de partida natural para una búsqueda sistemática de los principios que podrían subyacer a nuestra elección de combinaciones de ingredientes aceptables.

Una hipótesis, que en la última década ha recibido atención entre algunos chefs y científicos de alimentos, afirma que los ingredientes que comparten compuestos de sabor tienen más probabilidades de probar bien juntos que los ingredientes que no lo hacen17 (también consulte http://www.foodpairing.com). Esta hipótesis de emparejamiento de alimentos se ha utilizado para buscar nuevas combinaciones de ingredientes y ha provocado, por ejemplo, que algunos restaurantes contemporáneos combinen chocolate blanco y caviar, ya que comparten trimetilamina y otros compuestos de sabor, o chocolate y queso azul que comparten al menos 73 sabores. compuestos. A medida que buscamos pruebas que respalden (o refuten) cualquier 'regla' que pueda ser la base de nuestras recetas, debemos tener en cuenta que es poco probable que el análisis científico de cualquier arte, incluido el arte de cocinar, sea capaz de explicar todos los aspectos del creatividad artística involucrada. Además, hay muchos ingredientes cuyo papel principal en una receta puede no ser solo saborizante sino también algo más (por ejemplo, el papel de los huevos para garantizar la estabilidad mecánica o el papel del páprika para agregar colores vivos). Finalmente, el sabor de un plato debe tanto al modo de preparación como a la elección de ingredientes particulares12,18,19. Sin embargo, nuestra hipótesis es que, dada la gran cantidad de recetas que utilizamos en nuestro análisis (56,498), dichos factores se pueden filtrar sistemáticamente, lo que permite descubrir patrones que pueden trascender determinados platos o ingredientes.

Aquí presentamos un enfoque basado en la red para explorar el impacto de los compuestos de sabor en las combinaciones de ingredientes. Los esfuerzos de los químicos de alimentos para identificar los compuestos de sabor contenidos en la mayoría de los ingredientes culinarios nos permiten vincular cada ingrediente a 51 compuestos de sabor en promedio201. Construimos una red bipartita21,22,23,24,25,26 que consta de dos tipos diferentes de nodos: (i) 381 ingredientes utilizados en recetas en todo el mundo, y (ii) 1,021 compuestos de sabor que contribuyen al sabor. de cada uno de estos ingredientes (Fig. 1A). Una proyección de esta red bipartita es la red de sabores en la que dos nodos (ingredientes) están conectados si comparten al menos un compuesto de sabor (figura 1B). El peso de cada enlace representa el número de compuestos de sabor compartidos, convirtiendo la red de sabores en una red ponderada27,22,23. Si bien la concentración de compuestos en cada ingrediente y el umbral de detección de cada compuesto idealmente deben tenerse en cuenta, la falta de datos sistemáticos nos impide explorar su impacto (véase la sección S1.1.2 sobre limitaciones de datos).

Figura 1: red de sabores.


(A) Los ingredientes contenidos en dos recetas (columna izquierda), junto con los compuestos de sabor que se sabe están presentes en los ingredientes (columna derecha). Cada compuesto de sabor está vinculado a los ingredientes que lo contienen, formando una red bipartita. Algunos compuestos (que se muestran en negrita) son compartidos por múltiples ingredientes. (B) Si proyectamos la red bipartita compuesto-ingrediente en el espacio de ingredientes, obtenemos la red de sabores, cuyos nodos son ingredientes, vinculados si comparten al menos un compuesto de sabor. El grosor de los enlaces representa el número de compuestos de sabor que comparten dos ingredientes y el tamaño de cada círculo corresponde a la prevalencia de los ingredientes en las recetas. (C) La distribución del tamaño de la receta, capturando el número de ingredientes por receta, a través de las cinco cocinas exploradas en nuestro estudio. (D) El gráfico de rango de frecuencia de los ingredientes de las cinco cocinas muestra una distribución aproximadamente invariante en las cocinas.


Dado que varios compuestos de sabor son compartidos por una gran cantidad de ingredientes, la red de sabor resultante es demasiado densa para la visualización directa (grado promedio). Por lo tanto, utilizamos un método de extracción de la red troncal28,29 para identificar los enlaces estadísticamente significativos para cada ingrediente dada la suma de los pesos que caracterizan el nodo particular (Fig. 2), ver SI para más detalles). No es sorprendente que cada módulo en la red corresponda a una clase de alimentos distinta, como las carnes (rojas) o las frutas (amarillas). Los enlaces entre los módulos nos informan de los compuestos de sabor que mantienen juntas diferentes clases de alimentos. Por ejemplo, las frutas y los productos lácteos son similares a las bebidas alcohólicas, y los hongos aparecen aislados, ya que comparten una cantidad estadísticamente significativa de compuestos de sabor solo con otros hongos.

Figura 2: La columna vertebral de la red de sabores.

Cada nodo denota un ingrediente, el color del nodo indica la categoría de alimento, y el tamaño del nodo refleja la prevalencia de ingredientes en las recetas. Dos ingredientes están conectados si comparten un número significativo de compuestos de sabor, el espesor del enlace representa la cantidad de compuestos compartidos entre los dos ingredientes. Los enlaces adyacentes se incluyen para reducir el desorden. Tenga en cuenta que el mapa muestra solo los enlaces estadísticamente significativos, identificados por el algoritmo de Refs.28,29 para el valor de p 0.04. Un dibujo de la red completa es demasiado denso para ser informativo. Sin embargo, utilizamos la red completa en nuestras mediciones posteriores.

La red de sabores nos permite reformular la hipótesis del emparejamiento de alimentos como una propiedad topológica: ¿usamos con mayor frecuencia los pares de ingredientes que están fuertemente vinculados en la red de sabores o los evitamos? Para probar esta hipótesis, necesitamos datos sobre combinaciones de ingredientes preferidos por los humanos, información disponible en el cuerpo actual de recetas. Para la generalidad, utilizamos 56.498 recetas proporcionadas por dos repositorios estadounidenses (epicurious.com y allrecipes.com) y para evitar una interpretación claramente occidental de la cocina del mundo, también utilizamos un repositorio coreano (menupan.com). Las recetas se agrupan en cocinas geográficamente distintas (América del Norte, Europa Occidental, Europa del Sur, América Latina y Asia Oriental, ver Fig. 1 y Tabla S2). El número promedio de ingredientes utilizados en una receta es de alrededor de ocho, y la distribución general está limitada (Fig. 1C), lo que indica que las recetas con un número muy grande o muy pequeño de ingredientes son raros. Por el contrario, la popularidad de los ingredientes específicos varía en más de cuatro órdenes de magnitud, documentando enormes diferencias en la frecuencia con que se usan varios ingredientes en las recetas (figura 1D), como se observa en 10. Por ejemplo, el té de jazmín, el ron de Jamaica y otros 14 ingredientes se encuentran en una sola receta (ver SI S1.2), pero el huevo aparece en hasta 20,951, más de un tercio de todas las recetas.

Resultados

La Figura 3D indica que las cocinas de Norteamérica y Europa Occidental exhiben una tendencia estadísticamente significativa hacia las recetas cuyos ingredientes comparten compuestos de sabor. Por el contrario, las cocinas de Asia oriental y del sur de Europa evitan las recetas cuyos ingredientes comparten compuestos de sabor (ver la Fig. 3D para el puntaje Z, que captura la significación estadística de ΔN). La diferencia sistemática entre las recetas de Asia oriental y América del Norte es particularmente clara si inspeccionamos la distribución del conjunto de datos de recetas aleatorizadas, en comparación con el número observado de compunds compartidos que caracterizan las dos cocinas, Ns. Esta distribución revela que los platos de América del Norte usan mucho más pares de distribución de compuestos de lo esperado por azar (figura 3E), y los platos de Asia oriental son mucho menos numerosos (figura 3F). Finalmente, generalizamos la hipótesis del emparejamiento de alimentos al explorar si los pares de ingredientes que comparten más compuestos tienen más probabilidades de ser utilizados en cocinas específicas. Los resultados se correlacionan en gran medida con nuestras observaciones anteriores: en las recetas de América del Norte, cuanto más compuestos son compartidos por dos ingredientes, es más probable que aparezcan en las recetas. Por el contrario, en la cocina del este de Asia, cuanto más compuestos de sabor comparten dos ingredientes, es menos probable que se utilicen juntos (Fig. 3G y 3H, ver SI para más detalles y resultados en otras cocinas).

Figura 3: prueba de la hipótesis de emparejamiento de alimentos.

Ilustración esquemática de dos pares de ingredientes, el primero compartiendo muchos más (A) y el segundo mucho menos (B) compuestos de lo esperado si los compuestos de sabor se distribuyeron al azar. (C, D) Para probar la validez de la hipótesis de emparejamiento de alimentos, construimos 10.000 recetas aleatorias y calculamos ΔN. Encontramos que los pares de ingredientes en las cocinas de América del Norte tienden a compartir más compuestos, mientras que las cocinas de Asia oriental tienden a compartir menos compuestos de lo esperado en un conjunto de datos de recetas al azar. (E, F) Las distribuciones P (Ns) para 10.000 conjuntos de datos de recetas aleatorizadas en comparación con los valores reales de la cocina de Asia oriental y América del Norte. Ambas cocinas exhiben valores de p significativos, según se estima utilizando una prueba z. (G, H) Enumeramos cada posible par de ingredientes en cada cocina y mostramos la fracción de pares en las recetas en función de la cantidad de compuestos compartidos. Para reducir el ruido, solo utilizamos puntos de datos calculados a partir de más de 5 pares. Los valores de p se calculan usando una prueba t. La cocina norteamericana está sesgada hacia pares con más compuestos compartidos, mientras que Asia oriental muestra la tendencia opuesta (ver SI para detalles y resultados para otras cocinas). Tenga en cuenta que utilizamos la red completa, no la red troncal que se muestra en la Fig. 2 para obtener estos resultados. (I, J) La contribución y la frecuencia de uso de cada ingrediente en la cocina de América del Norte y Asia Oriental. El tamaño de los círculos representa la prevalencia relativa. La cocina de Norteamérica y Asia del Este muestra las tendencias opuestas. (K, L) Si eliminamos secuencialmente los ingredientes altamente contribuyentes (de la mayor contribución en la cocina norteamericana y de la contribución más pequeña en la cocina de Asia oriental), el efecto de los compuestos compartidos se desvanece rápidamente cuando quitamos cinco (este asiático) a quince ( Ingredientes de América del Norte).


¿Cuál es el mecanismo responsable de estas diferencias? Es decir, ¿las Fig. 3C a H implican que todas las recetas apuntan a emparejar los ingredientes que comparten (América del Norte) o no comparten (este de Asia) los compuestos de sabor, o podríamos identificar algunos compuestos responsables de la mayor parte del efecto observado? Por lo tanto, medimos la contribución χi (ver Métodos) de cada ingrediente al efecto compuesto compartido en una cocina dada c, cuantificando hasta qué punto su presencia afecta la magnitud de ΔN.

En la Fig. 3I, J mostramos como una gráfica de dispersión χi (eje horizontal) y la frecuencia fi para cada ingrediente en las cocinas de Norteamérica y Asia del Este. La gran mayoría de los ingredientes se encuentran en el eje χi = 0, lo que indica que su contribución a ΔNs es insignificante. Sin embargo, observamos algunos valores atípicos frecuentemente utilizados, que tienden a estar en la región positiva de fori para la cocina norteamericana, y se encuentran predominantemente en la región negativa para la cocina del este de Asia. Esto sugiere que el efecto de emparejamiento de alimentos se debe a unos pocos valores atípicos que se utilizan con frecuencia en una cocina en particular, p. leche, mantequilla, cacao, vainilla, crema y huevo en América del Norte, y carne de res, jengibre, cerdo, cayena, pollo y cebolla en el este de Asia. El soporte para el papel definitivo de estos ingredientes se proporciona en la Fig. 3K, L donde eliminamos los ingredientes en orden de sus contribuciones positivas (o negativas) a ΔN en la cocina norteamericana (o asiática oriental), encontrando que el puntaje z , que mide el significado de la hipótesis del compuesto compartido, cae por debajo de dos después de la eliminación de solo 13 (5) ingredientes de la cocina de América del Norte (o Asia oriental) (ver SI S2.2.2). Tenga en cuenta, sin embargo, que estos ingredientes desempeñan un papel desproporcionado en la cocina en cuestión, por ejemplo, los 13 ingredientes clave que contribuyen al efecto compuesto compartido en la cocina norteamericana aparecen en el 74.4% de todas las recetas.

Según una visión empírica conocida como "el principio del sabor" 30, las diferencias entre las cocinas regionales pueden reducirse a unos pocos ingredientes clave con sabores específicos: agregar salsa de soja a un plato casi automáticamente le da un sabor oriental porque los asiáticos usan la salsa de soja ampliamente en su comida y otros grupos étnicos no; en contraste, el pimentón, la cebolla y la manteca de cerdo son una firma de la cocina húngara. ¿Podemos identificar sistemáticamente las combinaciones de ingredientes responsables de la paleta de sabores de una cocina regional? Para responder a esta pregunta, medimos la autenticidad de cada ingrediente (), par de ingredientes () y triplete de ingrediente () (ver Métodos). En la Fig. 4, organizamos los seis ingredientes únicos más auténticos, pares de ingredientes y trillizos para las cocinas de América del Norte y del Este de Asia en una pirámide de sabores. Las clases de ingredientes más bien diferentes (como se refleja por su color) en las dos pirámides capturan las diferencias entre las dos cocinas: la comida norteamericana depende en gran medida de productos lácteos, huevos y trigo; por el contrario, la cocina del este de Asia está dominada por derivados de plantas como la salsa de soja, el aceite de sésamo y el arroz y el jengibre. Finalmente, las dos pirámides también ilustran las diferentes afinidades de las dos cocinas regionales hacia parejas de alimentos con compuestos compartidos. Los pares de ingredientes y trillizos más auténticos de la cocina norteamericana comparten múltiples compuestos de sabor, indicados por enlaces negros, pero tales enlaces de intercambio de compuestos son raros entre las combinaciones más auténticas de la cocina de Asia oriental.

Figura 4: Principios de sabor.

(A, B) pirámides de sabor para cocinas de América del Norte y Asia Oriental. Cada pirámide de sabores muestra los seis ingredientes más auténticos (es decir, los que tienen los más grandes), los pares de ingredientes (los más grandes) y los trillizos de ingrediente (los más grandes). El tamaño de los nodos refleja la abundancia del ingrediente en las recetas de la cocina en particular. Cada color representa la categoría del ingrediente (ver Fig. 2 para el color) y el grosor del enlace indica el número de compuestos compartidos. (C) Los seis ingredientes más auténticos y los pares de ingredientes utilizados en la cocina regional específica. El color del nodo representa la cocina y el peso del enlace refleja la prevalencia relativa del par de ingredientes.

La dependencia de las cocinas regionales en algunas combinaciones de ingredientes auténticos nos permite explorar la relación basada en ingredientes (similitud o disimilitud) entre varias cocinas regionales. Para esto, seleccionamos los seis ingredientes más auténticos y los pares de ingredientes en cada cocina regional (es decir, los que se muestran en la Fig. 4A, B), generando un diagrama que ilustra los ingredientes compartidos por varias cocinas, así como destacando aquellos que son únicos una región particular (Fig. 4C). Una vez más, encontramos una estrecha relación entre las cocinas de América del Norte y Europa occidental y observamos que, en lo que se refiere a sus combinaciones de ingredientes, la cocina del sur de Europa está mucho más cerca de la cocina latinoamericana que de Europa occidental (figura 4C).

Discusión

Nuestro trabajo resalta las limitaciones de los conjuntos de datos de receta actualmente disponibles y, en general, del análisis sistemático de los datos de preparación de alimentos. Al comparar dos ediciones del mismo conjunto de datos con una cobertura significativamente diferente, podemos demostrar que nuestros resultados son robustos frente a la incompletitud de los datos (ver SI S1.1.2). Sin embargo, mejores bases de datos compuestas, que mitiguen el carácter incompleto y los posibles sesgos de los datos actuales, podrían mejorar significativamente nuestra comprensión de los alimentos. Existe una ambigüedad inherente en la definición de una cocina regional o étnica particular. Sin embargo, como se discutió en SI S1.2, la correlación entre diferentes conjuntos de datos, que representan dos perspectivas distintas de los alimentos (estadounidense y coreano), indica que los humanos con diferentes antecedentes étnicos tienen una visión bastante consistente sobre la composición de las diversas cocinas regionales.

Un trabajo reciente de Kinouchi et al.10 observó que los gráficos de frecuencia de rango de los ingredientes son invariantes en cuatro cocinas diferentes, exhibiendo una forma que puede ser bien descrita por una curva de Zipf-Mandelbrot. Con base en esta observación, modelan la evolución de las recetas al asumir un proceso de copia-mutación, lo que lleva a una curva de frecuencia-rango muy similar. El modelo de copia-mutación proporciona una explicación de cómo un ingrediente se convierte en un ingrediente básico de una cocina: a saber, tener un alto valor o ser un ingrediente fundador. El modelo asigna a cada ingrediente un valor de aptitud aleatorio, que representa el valor nutricional, la disponibilidad, el sabor, etc. del ingrediente. Por ejemplo, se ha sugerido que se seleccionen algunos ingredientes debido a sus propiedades antimicrobianas6,7. La fase de mutación del modelo reemplaza los ingredientes menos adecuados con los más ajustados. Mientras tanto, el mecanismo de copia sigue copiando los ingredientes-ingredientes del fundador en las primeras recetas, y los hace abundantes en las recetas independientemente de su valor de aptitud.

Vale la pena discutir las similitudes y diferencias entre las cantidades que medimos y los conceptos de aptitud y fundadores. En primer lugar, la prevalencia () y la autenticidad () son valores medidos empíricamente mientras que la aptitud física es una variable oculta intrínseca. Entre la lista de ingredientes de alta prevalencia, encontramos ingredientes antiguos, fundadores, que se han usado en la misma región geográfica durante miles de años. Al mismo tiempo, hay ingredientes relativamente nuevos como tomates, patatas y pimientos que se introdujeron en Europa y Asia hace unos cientos de años. Se puede considerar que estos ingredientes nuevos pero prevalentes tienen valores de aptitud física elevados. Si un ingrediente tiene un alto nivel de autenticidad, entonces prevalece en una cocina mientras que no es tan frecuente en todas las otras cocinas.

De hecho, cada cultura ha desarrollado sus propios ingredientes auténticos. Puede indicar que la condición física puede variar mucho entre las cocinas o que la estocasticidad de la evolución de la receta hace que las recetas en diferentes regiones se dividan en conjuntos completamente diferentes. Una investigación más histórica nos ayudará a estimar la aptitud de los ingredientes y evaluar por qué usamos los ingredientes particulares que actualmente hacemos. El valor de aptitud de orden superior sugerido en Kinouchi et al. está muy cerca de nuestro concepto de afinidad de apareamiento de comida.

Otra diferencia en nuestros resultados es la cantidad de ingredientes en las recetas. Kinouchi et al. informó que el número promedio de ingredientes por receta varía entre los diferentes libros de cocina. Si bien también observamos variación en el número de ingredientes por receta, los patrones que encontramos no fueron consistentes con los encontrados por Kinouchi et al. Por ejemplo, el libro de cocina francés tiene más ingredientes por receta que uno brasileño, pero en nuestro conjunto de datos encontramos el resultado contrario. Creemos que un libro de cocina no puede representar una cocina completa, y que los libros de cocina con recetas más sofisticadas tienden a tener más ingredientes por receta que los libros de cocina con recetas diarias. A medida que se disponga de conjuntos de datos más completos, se pueden extraer conclusiones más precisas sobre la variación de tamaño entre las cocinas.

Nuestra contribución en este contexto es un estudio del papel que desempeñan los compuestos de sabor en la determinación de estos valores de aptitud física. Una posible interpretación de nuestros resultados es que los compuestos de sabor compartidos representan una de varias contribuciones al valor de la aptitud, y que, si bien los compuestos compartidos claramente juegan un papel importante en algunas cocinas, otras contribuciones pueden desempeñar un papel más dominante en otras cocinas. El hecho de que las recetas se basen en ingredientes no solo para el sabor sino también para proporcionar las texturas finales y la estructura general de un plato dado respalda la idea de que los valores de aptitud dependen de una multitud de características de los ingredientes además de su perfil de sabor.

En resumen, nuestra investigación basada en la red identifica una serie de patrones estadísticamente significativos que caracterizan la forma en que los humanos eligen los ingredientes que combinan en sus alimentos. Estos patrones se manifiestan en mayor o menor grado en diferentes regiones geográficas: mientras que los platos de Norteamérica y Europa occidental tienden a combinar ingredientes que comparten compuestos de sabor, la cocina de Asia oriental los evita. En términos más generales, este trabajo proporciona un ejemplo de cómo los métodos de análisis de red basados ​​en datos que han transformado la biología y las ciencias sociales en los últimos años pueden arrojar nuevos conocimientos en otras áreas, como la ciencia de los alimentos

Métodos

Compuestos compartidos

Para probar la hipótesis de que la elección de los ingredientes es impulsada por una apreciación de los pares de ingredientes que comparten compuestos de sabor (es decir, los vinculados en la Fig. 2), medimos el número medio de compuestos compartidos en cada receta, Ns, comparándolo con  obtenido para un conjunto de datos de receta de referencia construido al azar. Para una receta R que contiene nR ingredientes diferentes, donde cada ingrediente i tiene un conjunto de compuestos de sabor Ci, el número medio de compuestos compartidos es cero


si ninguno de los pares de ingredientes (i, j) en la receta comparte ningún compuesto de sabor. Por ejemplo, la receta de "salsa de sartén con crema de mostaza" contiene caldo de pollo, mostaza y crema, ninguno de los cuales comparte ningún compuesto de sabor (Ns(R) = 0) en nuestro conjunto de datos. Sin embargo, Ns(R) puede alcanzar hasta 60 para "chuletas de cerdo dulces y simples", una receta que contiene manzana, cerdo y queso cheddar (ver Fig. 3A). Para verificar si las recetas con Ns (R) alta son estadísticamente preferidas (implicando la validez de la hipótesis compuesta compartida) en una cocina c con recetas Nc, calculamos , donde 'real' y 'rand' indican recetas reales y recetas construidas al azar respectivamente y Ns = ΣR Ns (R) / Nc (ver SI para detalles del proceso de aleatorización). Esta referencia aleatoria (modelo nulo) controla la frecuencia de un ingrediente particular en una cocina regional dada, por lo tanto, nuestros resultados no se ven afectados por factores históricos, geográficos y climáticos que determinan la disponibilidad de ingredientes (ver SI S1.1.2).

Contribución

La contribución χi de cada ingrediente al efecto compuesto compartido en una cocina dada c, cuantificando en qué grado su presencia afecta la magnitud de ΔNs, se define por



donde fi representa el número de ocurrencia del ingrediente i. La contribución de un ingrediente es positiva (negativa) si aumenta (disminuye) ΔNs.


Autenticidad

definimos la prevalencia  de cada ingrediente i en una cocina c como  , donde  es el número de recetas que contienen el ingrediente particular i en la cocina y Nc es el número total de recetas en la cocina. La prevalencia relativa  mide la autenticidad -la diferencia entre la prevalencia de i en la cocina c y la prevalencia promedio de i en todas las demás cocinas. También podemos identificar pares de ingredientes o trillizos que están sobrerrepresentados en una cocina particular en relación con otras cocinas definiendo las prevalencias  de par relativas  y las prevalencias de triplete , con  y .

Referencias

1. Rozin, P. The selection of foods by rats, humans, and other animals. Advances in the Study of Behavior 7, 21–76 (1976).
2. Pfaffman, C. Olfaction and taste V, chap. Phylogenetic origins of sweet sensitivity (Academic Press, New York, 1975).
3. Garcia, J. & Hankins, W. G. Olfaction and taste V, chap. The evolution of bitter and the acquisition of toxiphobia (Academic Press, New York, 1975).
4. Drewnowski, A. & Greenwood, M. R. C. Cream and sugar: human preferences for highfat foods. Physiology & Behavior 30, 629–633 (1983).
5. Diamond, J. M. Guns, germs, and steel: The fates of human societies (W.W. Norton, New York, 1997).
6. Billing, J. & Sherman, P. W. Antimicrobial functions of spices: why some like it hot. The Quarterly Review of Biology 73, 3–49 (1998).
7. Sherman, P. W. & Hash, G. A. Why vegetable recipes are not very spicy. Evolution and Human Behavior 22, 147–163 (2001).
8. Harris, M. Good to eat: riddles of food and culture (Waveland Press, 1998).
9. Counihan, C. & van Esterik, P. (eds.) Food and culture (Routledge, 2007).
10. Kinouchi, O., Diez-Garcia, R. W., Holanda, A. J., Zambianchi, P. & Roque, A. C. The non-equilibrium nature of culinary evolution. New Journal of Physics 10, 073020 (2008).
11. Teng, C.-Y., Lin, Y.-R. & Adamic, L. A. Recipe recommendation using ingredient networks. (2011). ArXiv:1111.3919 [cs.SI].
12. This, H. Molecular gastronomy: exploring the science of flavor (Columbia University Press, 2005).
13. Johnson, J. & Clydesdale, F. Perceived sweetness and redness in colored sucrose solutions. Journal of Food Science 47, 747–752 (1982).
14. Shankaer, M. U. & Levitan, C. A. Grape expectations: the role of cognitive influences in color-flavor interactions. Conscious Cogn. 19, 380–390 (2010).
15. Zampini, M. & Spence, C. The role of auditory cues in modulating the perceived crispness and staleness of potato chips. Journal of Sensory Studies 19, 347–363 (2005).
16. Breslin, P. A. S. & Beauchamp, G. K. Suppression of bitterness by sodium: variation among bitter taste stimuli. Chem. Senses 20, 609–623 (1995).
17. Blumenthal, H. The big fat duck cookbook (Bloomsbury, London, 2008).
18. This, H. Molecular gastronomy, a scientific look at cooking. Accounts of Chemical Research 42, 575–583 (2009).
19. McGee, H. On food and cooking: the science and lore of the kitchen (Scribner, 2004).
20. Burdock, G. A. Fenaroli's handbook of flavor ingredients (CRC Press, 2004), 5th edn.
21. Newman, M. E. J., Barabási, A.-L. & Watts, D. J. The structure and dynamics of networks (Princeton University Press, 2006).
22. Caldarelli, G. Scale-free networks: complex webs in nature and technology (Oxford University Press, USA, 2007).
23. Dorogovtsev, S. N. & Mendes, J. F. F. Evolution of networks: from biological nets to the internet and WWW (Oxford University Press, USA, 2003).
24. Albert, R. & Barabási, A.-L. Statistical mechanics of complex networks. Rev. Mod. Phys. 74, 47 (2002).
25. Newman, M. E. J. The structure and function of complex networks. SIAM Review 45, 167–256 (2003).
26. Dorogovtsev, S. N., Goltsev, A. V. & Mendes, J. F. F. Critical phenomena in complex networks. Reviews of Modern Physics 80, 1275–61 (2008).
27. Barrat, A., Barthélemy, M., Pastor-Satorras, R. & Vespignani, A. The architecture of complex weighted networks. Proc. Nat. Acad. Sci. 111, 3747 (2004).
28. Serrano, M. A., Boguñá, M. & Vespignani, A. Extracting the multiscale backbone of complex weighted networks. Proceedings of the National Academy of Sciences 106, 6483–6488 (2009).
29. Lee, S. H., Kim, P.-J., Ahn, Y.-Y. & Jeong, H. Googling social interactions: web search engine based social network construction. PLoS One 5, e11233 (2010).
30. Rozin, E. The flavor-principle cookbook (Hawthorn Books, Book Club Ed. edition, 1973).





domingo, 24 de septiembre de 2017

Clusters bibliométricos sobre el Antropoceno

Mapeando una controversia de nuestro tiempo: El Antropoceno

Simone Belli | Lo Sguardo




Ofrecemos un análisis bibliométrico de la literatura y autores de la polémica disciplina antropocénica. Gracias a las herramientas digitales, comprendemos esta complejidad aprovechando la literatura existente y las redes digitales. Con el fin de apreciar el carácter interdisciplinario de la controversia, se muestran agrupamientos de co-citado publicaciones, co-autores, y co-occurrencia detérminos en los campos de las ciencias sociales, la agricultura y la biología, la ciencia ambiental y la Tierra y la ciencia planetaria. El carácter multidisciplinario de la investigación antropocénica se refleja en el análisis de la co-citación y en el análisis del término co-ocurrencia. Encontramos dos grupos de términos coexistentes, que representan acuerdo y desacuerdo con Antropoceno, y ofrecen una comparación de las obras emblemáticas presentadas en la red.



miércoles, 1 de marzo de 2017

Tutorial: Creando redes de co-ocurrencia en Gephi

Creación de una red desde una tabla de elementos co-ocurrentes
Clément Levallois
Clementlevallois@gmail.com
Fuente

Tabla de contenido
Presentación del complemento
1. La entrada
2. La salida
Instalación del complemento
Abrir el complemento
Uso del complemento
Segundo panel
3er panel
Cuarto panel
5º panel
6º panel
7º panel
El fin





Presentación del complemento
Este complemento es creado por Clement Levallois

Convierte una hoja de cálculo o un archivo csv en una red.

Este complemento le permite:

  • Comenzar desde una tabla de datos en formato Excel o csv}
  • En la tabla de datos, cada fila describe una "ocurrencia" (de un evento, una compra, una relación, etc.)
  • En las columnas A, B, C, D, tenemos las entidades involucradas: columna A para personas, columna B para lo que compraron, etc.
  • Las conexiones se crearán entre las entidades, cuando aparezcan en la misma ocurrencia (así, cuando están en la misma fila)
  • Las ocurrencias pueden tener fechas, varias instancias de una entidad se pueden enumerar en una columna determinada.


1. La entrada




Figura 1. Un archivo de Excel


2. La salida


Figura 2. Red resultante


Instalación del complemento


Figura 3. Seleccione el menú Herramientas y luego Plugins



Figura 4. Haga clic en la pestaña Plugins disponibles



Figura 5. Instalar el complemento y reiniciar Gephi


Abrir el complemento


Figura 6. Abra el complemento a través del menú Archivo - Importar


Uso del complemento

Segundo panel


Figura 7. Seleccione un archivo



Figura 8. Un archivo sin encabezados



Figura 9. Un archivo con encabezados


Para describir las siguientes pantallas del complemento, tomaremos el ejemplo del archivo de Excel que acabamos de mostrar, con encabezados.

3er panel


Figura 10. ¿Qué entidades deberían ser los nodos?



¿Qué significa este panel?

Si nos fijamos en el archivo de Excel, veremos que tenemos "Clientes" y sus "Compras".

→ Esto significa que podemos construir 2 tipos diferentes de redes, dependiendo de nuestras necesidades:

1. Una red que muestra clientes y productos, con relaciones que representan compras de un cliente a un producto.


Para crear este tipo de redes, elija "Cliente" en la ventana superior y "Compras" en la ventana inferior de la pantalla del complemento.

2. O una red en la que se conectan 2 productos, si un cliente los procesa.


Para crear este tipo de redes, seleccione "Compras" en las ventanas superior e inferior de la pantalla del complemento.

Cuarto panel


Figura 11. Selección del delimitador que se utiliza


Este tercer panel pregunta: en nuestro archivo de Excel, ¿cómo se separan los diferentes elementos en una celda determinada? En nuestro ejemplo, hemos utilizado comas: las listas de productos comprados están separadas por comas:


Figura 12. Las comas se muestran en rojo


5º panel

Este panel le permite especificar si las relaciones son dinámicas en el tiempo, o no.

En este caso, se necesita una columna adicional (columna C), donde se muestra una fecha. No cubrimos este caso aquí.

(Lea los tutoriales sobre redes dinámicas para un arrancador)

6º panel


Figura 13. Panel de opciones


"Crear vínculos entre agentes de compras y enlaces entre agentes de compras"

→ Si eligió un producto ← → Producto tipo de red en el panel 3, entonces por supuesto está interesado en enlaces entre productos. Marque esta opción.

→ Pero si eligió un cliente ← → Producto tipo de red en el panel 3, lo que necesita es menos obvio.

Tomemos el ejemplo del cliente I, que compró una mesa y algunas sillas:

1. Al cliquear en la casilla se creará una red donde:



1. No marcar la casilla creará una red en la que:



"Eliminar duplicados"
→ Active esta opción si su archivo Excel o CSV tiene filas duplicadas que desea quitar

"Eliminar los auto-bucles"
Si un cliente ha comprado dos tablas dos veces, para que tengamos "tabla, tabla" en una celda: esto crearía un vínculo de tabla a tabla (un autobucle).

→ Marque esta opción si desea que se borren los bucles auto.

7º panel

Este panel repite todas las configuraciones. Haga clic en Finalizar para crear la red.

sábado, 26 de noviembre de 2016

ARS 101: Redes de co-ocurrencia

Redes de co-ocurrencia 
Wikipedia

Las redes de co-ocurrencia se usan generalmente para proporcionar una visualización gráfica de relaciones potenciales entre personas, organizaciones, conceptos u otras entidades representadas dentro del material escrito. La generación y visualización de redes de co-ocurrencia se ha vuelto práctico con el advenimiento del texto almacenado electrónicamente que es susceptible a la minería de texto.

A modo de definición, las redes de co-ocurrencia son la interconexión colectiva de términos basados ​​en su presencia emparejada dentro de una unidad de texto especificada. Las redes se generan conectando pares de términos usando un conjunto de criterios que definen la co-ocurrencia. Por ejemplo, se puede decir que los términos A y B "co-ocurren" si ambos aparecen en un artículo particular. Otro artículo puede contener términos B y C. Vincular A a B y B a C crea una red de co-ocurrencia de estos tres términos. Las reglas para definir la co-ocurrencia dentro de un corpus de texto se pueden establecer de acuerdo con los criterios deseados. Por ejemplo, un criterio más estricto para la co-ocurrencia puede requerir un par de términos para aparecer en la misma oración.



Una red de co-occurrencia creada con KH Coder

Métodos y desarrollo

Las redes de co-ocurrencia pueden ser creadas para cualquier lista de términos (cualquier diccionario) en relación con cualquier colección de textos (cualquier corpus de texto). Los pares co-occurrentes de términos se pueden llamar "vecinos" y éstos agrupan a menudo en "barrios" basados ​​en sus interconexiones. Los términos individuales pueden tener varios vecinos. Los barrios pueden conectarse entre sí a través de al menos un término individual o pueden permanecer desconectados.

Los términos individuales son, en el contexto de la minería de textos, representados simbólicamente como cadenas de texto. En el mundo real, la entidad identificada por un término normalmente tiene varias representaciones simbólicas. Por tanto, es útil considerar los términos como representados por un símbolo primario y hasta varios símbolos sinónimos alternativos. La ocurrencia de un término individual se establece mediante la búsqueda de cada representación simbólica conocida del término. El proceso puede ser aumentado a través de algoritmos de procesamiento de lenguaje natural (NLP) que interrogan segmentos de texto para posibles alternativas como orden de palabras, espaciado y separación de palabras. La PNL también se puede usar para identificar la estructura de oraciones y categorizar las cadenas de texto de acuerdo con la gramática (por ejemplo, categorizar una cadena de texto como un sustantivo basado en una cadena de texto anterior conocida como un artículo).

La representación gráfica de las redes de co-ocurrencia permite visualizarlas e inferencias sobre las relaciones entre entidades en el dominio representado por el diccionario de términos aplicados al corpus de texto. Una visualización significativa requiere normalmente simplificaciones de la red. Por ejemplo, las redes pueden ser dibujadas de manera que el número de vecinos que se conectan a cada término sea limitado. Los criterios para limitar los vecinos podrían basarse en el número absoluto de co-ocurrencias o criterios más sutiles como la "probabilidad" de co-ocurrencia o la presencia de un término descriptivo intermedio.

Los aspectos cuantitativos de la estructura subyacente de una red de coinoconducción también pueden ser informativos, como el número total de conexiones entre entidades, el agrupamiento de entidades que representan subdominios, la detección de sinónimos [1], etc.

Aplicaciones y uso

Algunas aplicaciones de trabajo del enfoque de co-ocurrencia están disponibles para el público a través de Internet. PubGene es un ejemplo de una aplicación que se ocupa de los intereses de la comunidad biomédica mediante la presentación de redes basadas en la co-ocurrencia de la genética relacionados con los términos que aparecen en los registros de MEDLINE [2] [3] El sitio web NameBase es un ejemplo de cómo las relaciones humanas se pueden inferir mediante el examen de redes construidas a partir de la co-ocurrencia de nombres personales en los periódicos y otros textos (como en Ozgur et al [4]).

Las redes de información también se utilizan para facilitar los esfuerzos para organizar y centrar la información disponible públicamente para fines de aplicación de la ley y de inteligencia (llamada "inteligencia de código abierto" o OSINT). Las técnicas conexas incluyen las redes de co-citación, así como el análisis del hipervínculo y la estructura del contenido en Internet (como en el análisis de sitios web relacionados con el terrorismo [5]).


Véase también

  • Takada H, Saito K, Yamada T, Kimura M: “Analysis of Growing Co-occurrence Networks” SIG-KBS (Journal Code:X0831A) 2006, VOL.73rd;NO.;PAGE.117-122 Language;Japanese
  • Liu, Chua T-S; “Building semantic perceptron net for topic spotting.” Proceedings of the 39th Annual Meeting on Association for Computational Linguistics, 2001; 378 - 385

Referencias

  1. Cohen AM, Hersh WR, Dubay C, Spackman, K: “Using co-occurrence network structure to extract synonymous gene and protein names from MEDLINE abstracts” BMC Bioinformatics 2005, 6:103
  2. Jenssen TK, Laegreid A, Komorowski J, Hovig E: "A literature network of human genes for high-throughput analysis of gene expression. " Nature Genetics, 2001 May; 28(1):21-8. PMID 11326270
  3. Grivell L: “Mining the bibliome: searching for a needle in a haystack? New computing tools are needed to effectively scan the growing amount of scientific literature for useful information.” EMBO reports 2001 Mar;3(3):200-3: doi:10.1093/embo-reports/kvf059 PMID 11882534
  4. Ozgur A, Cetin B, Bingol H: “Co-occurrence Network of Reuters News” (15 Dec 2007) http://arxiv.org/abs/0712.2491
  5. Zhou Y, Reid E, Qin J, Chen H, Lai G: "US Domestic Extremist Groups on the Web: Link and Content Analysis" http://doi.ieeecomputersociety.org/10.1109/MIS.2005.96