Análisis de redes sociales: redes genéticas

Mostrando entradas con la etiqueta redes genéticas. Mostrar todas las entradas

miércoles, 18 de diciembre de 2019

Las grandes redes de colaboración científica mundial

Física, ciencias de la vida, genética: tres grandes jugadores y sus principales socios

La investigación es un juego global, pero incluso para los principales colaboradores, los socios más cercanos son principalmente locales.

Versión PDF

La infografía muestra los 25 principales socios de investigación de grandes colaboradores científicos líderes en 3 campos: física de alta energía, ciencias de la vida y genómica.

The Nature Index clasifica a las instituciones en los grandes campos de la ciencia por sus recuentos fraccionales (FC), en referencia a la parte de las contribuciones de sus autores afiliados, y los recuentos de artículos (AC) en 82 revistas de alta calidad. Las clasificaciones de la tabla son solo para artículos de alta afiliación, es decir, aquellos con autores de 10 o más instituciones principales separadas.

Nature Index 2019 Colaboración y gran ciencia

Las relaciones con los socios que se muestran son para los Institutos Nacionales de Salud de EE. UU. (NIH), que ocupa el segundo lugar entre las principales instituciones del mundo por producir grandes artículos de investigación científica en el campo de la oncología y la inmunología y el tercero en el campo de la genética; la Organización Europea para la Investigación Nuclear (CERN), en Suiza, que es el tercer mayor contribuyente a grandes artículos de ciencia en física y astronomía en el Índice de la Naturaleza; y BGI, una compañía de secuenciación del genoma que es el mayor contribuyente de China a la gran ciencia en genética. Esta infografía se basa en todos los artículos de colaboración de las tres instituciones identificadas, independientemente del número de afiliaciones.

Los 25 principales colaboradores de las tres instituciones centrales se muestran de acuerdo con su puntaje de colaboración conjunta (CS) con la institución central, derivado al sumar los FC * de los artículos con autores de ambas instituciones. CS determina el tamaño de las burbujas de las instituciones asociadas. El rango del 1 al 25 de su CS con la institución central se indica por su grosor de línea.

sábado, 29 de diciembre de 2018

Análisis de red de correlaciones ponderadas

Redes de correlación ponderadas

Wikipedia

El análisis de red de correlación ponderada, también conocido como análisis de red de coexpresión de genes ponderados (WGCNA), es un método de minería de datos ampliamente utilizado, especialmente para el estudio de redes biológicas basadas en correlaciones de pares entre variables. Si bien se puede aplicar a la mayoría de los conjuntos de datos de alta dimensión, se ha utilizado más ampliamente en aplicaciones genómicas. Permite definir módulos (clústeres), concentradores intramodulares y nodos de red con respecto a la pertenencia a módulos, estudiar las relaciones entre los módulos de coexpresión y comparar la topología de red de diferentes redes (análisis diferencial de redes). El WGCNA se puede usar como una técnica de reducción de datos (relacionada con el análisis factorial oblicuo), como un método de agrupamiento (agrupamiento difuso), como un método de selección de características (por ejemplo, como método de detección de genes), como marco para integrar datos complementarios (genómicos) ( basado en correlaciones ponderadas entre variables cuantitativas) y como una técnica de exploración de datos. [1] Aunque WGCNA incorpora técnicas tradicionales de exploración de datos, su lenguaje de red intuitivo y su marco de análisis trascienden cualquier técnica de análisis estándar. Debido a que utiliza una metodología de red y es adecuada para integrar conjuntos de datos genómicos complementarios, puede interpretarse como un método de análisis de datos genéticos de sistemas biológicos o sistemas. Al seleccionar los centros intramodulares en los módulos de consenso, WGCNA también da lugar a técnicas de metanálisis basadas en redes. [2]

Historia

El método WGCNA fue desarrollado por Steve Horvath, profesor de genética humana en la Escuela de Medicina David Geffen en UCLA y de bioestadística en la Escuela de Salud Pública Fielding de la UCLA y sus colegas en la UCLA, y (ex) miembros del laboratorio (en particular Peter). Langfelder, Bin Zhang, Jun Dong). Gran parte del trabajo surgió de colaboraciones con investigadores aplicados. En particular, las redes de correlación ponderadas se desarrollaron en conversaciones conjuntas con los investigadores del cáncer Paul Mischel, Stanley F. Nelson y los neurocientíficos Daniel H. Geschwind, Michael C. Oldham (según la sección de reconocimiento en [1]). Existe una vasta literatura sobre redes de dependencia, redes de escala libre y redes de coexpresión.

Comparación entre redes de correlación ponderadas y no ponderadas

Una red de correlación ponderada puede interpretarse como un caso especial de una red ponderada, una red de dependencia o una red de correlación. El análisis de la red de correlación ponderada puede ser atractivo por los siguientes motivos.

La construcción de la red (basada en un umbral suave del coeficiente de correlación) preserva la naturaleza continua de la información de correlación subyacente. Por ejemplo, las redes de correlación ponderadas que se construyen sobre la base de correlaciones entre variables numéricas no requieren la elección de un umbral duro. La información dicotomizante y el umbral (difícil) pueden llevar a la pérdida de información. [3]
La construcción de la red tiene resultados altamente robustos con respecto a las diferentes opciones de umbral suave. [3] Por el contrario, los resultados basados en redes no ponderadas, construidas por el umbral de una medida de asociación por pares, a menudo dependen en gran medida del umbral.
Las redes de correlación ponderadas facilitan una interpretación geométrica basada en la interpretación angular de la correlación, capítulo 6 en. [4]
Las estadísticas de red resultantes pueden utilizarse para mejorar los métodos estándar de extracción de datos, como el análisis de conglomerados, ya que las medidas de similitud (des) a menudo se pueden transformar en redes ponderadas; [5] ver capítulo 6 en [4].
WGCNA proporciona estadísticas de conservación de módulos potentes que pueden usarse para cuantificar si se pueden encontrar en otra condición. Además, las estadísticas de conservación de módulos permiten estudiar las diferencias entre la estructura modular de las redes. [6]
Las redes ponderadas y las redes de correlación a menudo se pueden aproximar mediante redes "factorizables". [4] [7] Tales aproximaciones a menudo son difíciles de lograr para redes dispersas y no ponderadas. Por lo tanto, las redes ponderadas (de correlación) permiten una parametrización parsimoniosa (en términos de módulos y membresía de módulos) (capítulos 2, 6 en [1]) y [8].

Método

Primero, uno define una medida de similitud de coexpresión de genes que se usa para definir la red. Denotamos la medida de similitud de coexpresión de genes de un par de genes i y j por

s_{ij}

. Muchos estudios de coexpresión utilizan el valor absoluto de la correlación como una medida de similitud de coexpresión sin signo,

s_{{ij}}^{{unsigned}}=|cor(x_{i},x_{j})|

donde los perfiles de expresión génica

x_{i}

x_{{j}}

consisten en la expresión de los genes i y j a través de múltiples muestras. Sin embargo, el uso del valor absoluto de la correlación puede ofuscar información biológicamente relevante, ya que no se hace distinción entre la represión de genes y la activación. En contraste, en las redes firmadas, la similitud entre los genes refleja el signo de la correlación de sus perfiles de expresión. Para definir una medida de coexpresión firmada entre los perfiles de expresión génica

x_{i}

x_{{j}}

, se puede usar una transformación simple de correlación:

s_{{ij}}^{{signed}}=0.5+0.5cor(x_{i},x_{j})

Como la medida no firmada sijunsigned

s_{{ij}}^{{unsigned}}

, la similitud firmada

s_{{ij}}^{{signed}}

toma un valor entre 0 y 1. Tenga en cuenta que la similitud no firmada entre dos genes expresados de manera opuesta (

cor(x_{i},x_{j})=-1

es igual a 1 mientras que es igual a 0 para la similitud signada. De manera similar, mientras que la medida de coexpresión sin firmar de dos genes con correlación cero permanece en cero, la similitud con signo es igual a 0.5.

A continuación, se usa una matriz de adyacencia (red),

A=[a_{{ij}}]

, se utiliza para cuantificar la fuerza con que los genes están conectados entre sí. A se define mediante el umbral de la matriz de similitud de coexpresión

S=[s_{{ij}}]

. El umbral 'duro' (dicotomización) la medida de similitud S da como resultado una red de coexpresión de genes no ponderada. Específicamente, una adyacencia de red no ponderada se define como 1 si

s_{{ij}}>\tau

y 0 en caso contrario. Debido a que el umbral difícil codifica las conexiones genéticas de forma binaria, puede ser sensible a la elección del umbral y resultar en la pérdida de información de coexpresión. [3] La naturaleza continua de la información de coexpresión se puede preservar empleando un umbral suave, que da como resultado una red ponderada. Específicamente, WGCNA utiliza la siguiente función de potencia para evaluar la fuerza de su conexión:

{\textstyle a_{{ij}}=(s_{{ij}})^{\beta }}

,

donde la potencia β es el parámetro de umbral suave. Los valores predeterminados β = 6 y β = 12 se utilizan para redes sin firma y firmadas, respectivamente. Alternativamente, se puede elegir β utilizando el criterio de topología sin escala que equivale a elegir el valor más pequeño de β, de manera que se alcance la topología libre de escala aproximada. [3]

Dado que

log(a_{{ij}})=\beta log(s_{{ij}})

, la adyacencia de red ponderada está relacionada linealmente con la similitud de coexpresión en una escala logarítmica. Tenga en cuenta que un β de alta potencia transforma altas similitudes en adyacencias altas, mientras que empuja similitudes bajas hacia 0. Dado que este procedimiento de umbral suave aplicado a una matriz de correlación de pares conduce a una matriz de adyacencia ponderada, el análisis que sigue es Se denomina análisis de red de coexpresión de genes ponderados.

Un paso importante en el análisis centrado en el módulo es agrupar genes en módulos de red utilizando una medida de proximidad de red. En términos generales, un par de genes tiene una alta proximidad si está estrechamente interconectado. Por convención, la proximidad máxima entre dos genes es 1 y la proximidad mínima es 0. Normalmente, el WGCNA usa la medida de superposición topológica (TOM) como proximidad. [9] [10] que también se puede definir para redes ponderadas. [3] El TOM combina la adyacencia de dos genes y las fortalezas de conexión que estos dos genes comparten con otros genes de "terceros". El TOM es una medida altamente robusta de interconexión de red (proximidad). Esta proximidad se utiliza como entrada del agrupamiento jerárquico de enlaces promedio. Los módulos se definen como ramas del árbol de agrupamiento resultante utilizando el enfoque de corte dinámico de ramas. [11] A continuación, los genes dentro de un módulo dado se resumen con el módulo eigengene, que se puede considerar como el mejor resumen del modo estandarizado.El módulo eigengene de un módulo dado se define como el primer componente principal de los perfiles de expresión estandarizados. Los eigengenes definen biomarcadores robustos. [12] Para encontrar módulos que se relacionan con un rasgo clínico de interés, los módulos de eigengenes se correlacionan con el rasgo clínico de interés, lo que da lugar a una medida de significación de eigengene. Los eigengenes se pueden usar como características en modelos predictivos más complejos, incluidos los árboles de decisión y las redes bayesianas. [12] También se pueden construir redes de coexpresión entre módulos de eigengenes (redes de eigengene), es decir, redes cuyos nodos son módulos. [13] Para identificar los genes centrales intramodulares dentro de un módulo dado, se pueden usar dos tipos de medidas de conectividad. El primero, denominado

kME_{i}=cor(x_{i},ME)

, es definido en función de la correlación de cada gen con el respectivo módulo eigengene. El segundo, denominado kIN, se define como una suma de adyacencias con respecto a los genes del módulo. En la práctica, estas dos medidas son equivalentes. [4] Para probar si un módulo se conserva en otro conjunto de datos, se pueden usar varias estadísticas de red, por ejemplo.

Zsummary

. [6]

Aplicaciones

WGCNA se ha utilizado ampliamente para analizar datos de expresión génica (es decir, datos de transcripción), por ej. para encontrar genes hub intramodulares. [2] [14]

A menudo se usa como un paso de reducción de datos en aplicaciones de sistemas genéticos donde los módulos están representados por "módulos eigengenes", por ejemplo [15] [16] Los eigengenes del módulo pueden usarse para correlacionar módulos con rasgos clínicos. Las redes Eigengene son redes de coexpresión entre módulos eigengenes (es decir, redes cuyos nodos son módulos). WGCNA se usa ampliamente en aplicaciones neurocientíficas, por ejemplo [17] [18] y para analizar datos genómicos, incluidos datos de micromatrices, [19] datos de RNA-Seq de células individuales [20] [21] datos de metilación del DNA, [22] datos de miRNA, conteos de péptidos [23] y datos de microbiota (secuenciación del gen 16S rRNA). 24] Otras aplicaciones incluyen datos de imágenes del cerebro, por ejemplo, datos funcionales de resonancia magnética. [25]

Paquete de software R

El paquete de software WGCNA R [26] proporciona funciones para llevar a cabo todos los aspectos del análisis de redes ponderadas (construcción de módulos, selección de genes centrales, estadísticas de conservación de módulos, análisis de redes diferenciales, estadísticas de redes). El paquete WGCNA está disponible en Comprehensive R Archive Network (CRAN), el repositorio estándar para paquetes del complemento de R.

Referencias

Horvath S (2011). Weighted Network Analysis: Application in Genomics and Systems Biology. New York, NY: Springer. ISBN 978-1-4419-8818-8.
Langfelder P, Mischel PS, Horvath S, Ravasi T (17 April 2013). "When Is Hub Gene Selection Better than Standard Meta-Analysis?". PLoS ONE. 8 (4): e61505. Bibcode:2013PLoSO...861505L. doi:10.1371/journal.pone.0061505. PMC 3629234. PMID 23613865.
Zhang B, Horvath S (2005). "A general framework for weighted gene co-expression network analysis" (PDF). Statistical Applications in Genetics and Molecular Biology. 4: 17. CiteSeerX 10.1.1.471.9599. doi:10.2202/1544-6115.1128. PMID 16646834.
Horvath S, Dong J (2008). "Geometric Interpretation of Gene Coexpression Network Analysis". PLoS Computational Biology. 4 (8): e1000117. Bibcode:2008PLSCB...4E0117H. doi:10.1371/journal.pcbi.1000117. PMC 2446438. PMID 18704157.
Oldham MC, Langfelder P, Horvath S (12 June 2012). "Network methods for describing sample relationships in genomic datasets: application to Huntington's disease". BMC Systems Biology. 6: 63. doi:10.1186/1752-0509-6-63. PMC 3441531. PMID 22691535.
Langfelder P, Luo R, Oldham MC, Horvath S (20 January 2011). "Is my network module preserved and reproducible?". PLoS Computational Biology. 7 (1): e1001057. Bibcode:2011PLSCB...7E1057L. doi:10.1371/journal.pcbi.1001057. PMC 3024255. PMID 21283776.
Dong J, Horvath S (4 June 2007). "Understanding network concepts in modules". BMC Systems Biology. 1: 24. doi:10.1186/1752-0509-1-24. PMC 3238286. PMID 17547772.
Ranola JM, Langfelder P, Lange K, Horvath S (14 March 2013). "Cluster and propensity based approximation of a network". BMC Systems Biology. 7: 21. doi:10.1186/1752-0509-7-21. PMC 3663730. PMID 23497424.
Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabasi AL (2002). "Hierarchical organization of modularity in metabolic networks". Science. 297 (5586): 1551–1555. arXiv:cond-mat/0209244. Bibcode:2002Sci...297.1551R. doi:10.1126/science.1073374. PMID 12202830.
Yip AM, Horvath S (24 January 2007). "Gene network interconnectedness and the generalized topological overlap measure" (PDF). BMC Bioinformatics. 8: 22. doi:10.1186/1471-2105-8-22. PMC 1797055. PMID 17250769.
Langfelder P, Zhang B, Horvath S (2007). "Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut library for R". Bioinformatics. 24 (5): 719–20. doi:10.1093/bioinformatics/btm563. PMID 18024473.
Foroushani A, Agrahari R, Docking R, Chang L, Duns G, Hudoba M, Karsan A, Zare H (16 March 2017). "Large-scale gene network analysis reveals the significance of extracellular matrix pathway and homeobox genes in acute myeloid leukemia: an introduction to the Pigengene package and its applications". BMC Medical Genomics. 10 (1): 16. doi:10.1186/s12920-017-0253-6. PMC 5353782. PMID 28298217.
Langfelder P, Horvath S (2007). "Eigengene networks for studying the relationships between co-expression modules". BMC Systems Biology. 2007 (1): 54. doi:10.1186/1752-0509-1-54. PMC 2267703. PMID 18031580.
Horvath S, Zhang B, Carlson M, Lu KV, Zhu S, Felciano RM, Laurance MF, Zhao W, Shu Q, Lee Y, Scheck AC, Liau LM, Wu H, Geschwind DH, Febbo PG, Kornblum HI, Cloughesy TF, Nelson SF, Mischel PS (2006). "Analysis of Oncogenic Signaling Networks in Glioblastoma Identifies ASPM as a Novel Molecular Target". PNAS. 103 (46): 17402–17407. Bibcode:2006PNAS..10317402H. doi:10.1073/pnas.0608396103. PMC 1635024. PMID 17090670.
Chen Y, Zhu J, Lum PY, Yang X, Pinto S, MacNeil DJ, Zhang C, Lamb J, Edwards S, Sieberts SK, Leonardson A, Castellini LW, Wang S, Champy MF, Zhang B, Emilsson V, Doss S, Ghazalpour A, Horvath S, Drake TA, Lusis AJ, Schadt EE (27 March 2008). "Variations in DNA elucidate molecular networks that cause disease". Nature. 452 (7186): 429–35. Bibcode:2008Natur.452..429C. doi:10.1038/nature06757. PMC 2841398. PMID 18344982.
Plaisier CL, Horvath S, Huertas-Vazquez A, Cruz-Bautista I, Herrera MF, Tusie-Luna T, Aguilar-Salinas C, Pajukanta P, Storey JD (11 September 2009). "A Systems Genetics Approach Implicates USF1, FADS3, and Other Causal Candidate Genes for Familial Combined Hyperlipidemia". PLoS Genetics. 5 (9): e1000642. doi:10.1371/journal.pgen.1000642. PMC 2730565. PMID 19750004.
Voineagu I, Wang X, Johnston P, Lowe JK, Tian Y, Horvath S, Mill J, Cantor RM, Blencowe BJ, Geschwind DH (25 May 2011). "Transcriptomic analysis of autistic brain reveals convergent molecular pathology". Nature. 474 (7351): 380–4. doi:10.1038/nature10110. PMC 3607626. PMID 21614001.
Hawrylycz MJ, Lein ES, Guillozet-Bongaarts AL, Shen EH, Ng L, Miller JA, van de Lagemaat LN, Smith KA, Ebbert A, Riley ZL, Abajian C, Beckmann CF, Bernard A, Bertagnolli D, Boe AF, Cartagena PM, Chakravarty MM, Chapin M, Chong J, Dalley RA, David Daly B, Dang C, Datta S, Dee N, Dolbeare TA, Faber V, Feng D, Fowler DR, Goldy J, Gregor BW, Haradon Z, Haynor DR, Hohmann JG, Horvath S, Howard RE, Jeromin A, Jochim JM, Kinnunen M, Lau C, Lazarz ET, Lee C, Lemon TA, Li L, Li Y, Morris JA, Overly CC, Parker PD, Parry SE, Reding M, Royall JJ, Schulkin J, Sequeira PA, Slaughterbeck CR, Smith SC, Sodt AJ, Sunkin SM, Swanson BE, Vawter MP, Williams D, Wohnoutka P, Zielke HR, Geschwind DH, Hof PR, Smith SM, Koch C, Grant S, Jones AR (20 September 2012). "An anatomically comprehensive atlas of the adult human brain transcriptome". Nature. 489 (7416): 391–399. Bibcode:2012Natur.489..391H. doi:10.1038/nature11405. PMC 4243026. PMID 22996553.
Kadarmideen HN, Watson-Haigh NS, Andronicos NM (2011). "Systems biology of ovine intestinal parasite resistance: disease gene modules and biomarkers". Molecular BioSystems. 7 (1): 235–246. doi:10.1039/C0MB00190B. PMID 21072409.
Kogelman LJ, Cirera S, Zhernakova DV, Fredholm M, Franke L, Kadarmideen HN (30 September 2014). "Identification of co-expression gene networks, regulatory genes and pathways for obesity based on adipose tissue RNA Sequencing in a porcine model". BMC Medical Genomics. 7 (1): 57. doi:10.1186/1755-8794-7-57. PMC 4183073. PMID 25270054.
Xue Z, Huang K, Cai C, Cai L, Jiang CY, Feng Y, Liu Z, Zeng Q, Cheng L, Sun YE, Liu JY, Horvath S, Fan G (29 August 2013). "Genetic programs in human and mouse early embryos revealed by single-cell RNA sequencing". Nature. 500 (7464): 593–7. Bibcode:2013Natur.500..593X. doi:10.1038/nature12364. PMC 4950944. PMID 23892778.
Horvath S, Zhang Y, Langfelder P, Kahn RS, Boks MP, van Eijk K, van den Berg LH, Ophoff RA (3 October 2012). "Aging effects on DNA methylation modules in human brain and blood tissue". Genome Biology. 13 (10): R97. doi:10.1186/gb-2012-13-10-r97. PMC 4053733. PMID 23034122.
Shirasaki DI, Greiner ER, Al-Ramahi I, Gray M, Boontheung P, Geschwind DH, Botas J, Coppola G, Horvath S, Loo JA, Yang XW (12 July 2012). "Network organization of the huntingtin proteomic interactome in mammalian brain". Neuron. 75 (1): 41–57. doi:10.1016/j.neuron.2012.05.024. PMC 3432264. PMID 22794259.
Tong M, Li X, Wegener Parfrey L, Roth B, Ippoliti A, Wei B, Borneman J, McGovern DP, Frank DN, Li E, Horvath S, Knight R, Braun J (2013). "A modular organization of the human intestinal mucosal microbiota and its association with inflammatory bowel disease". PLoS One. 8 (11): e80702. Bibcode:2013PLoSO...880702T. doi:10.1371/journal.pone.0080702. PMC 3834335. PMID 24260458.
Mumford JA, Horvath S, Oldham MC, Langfelder P, Geschwind DH, Poldrack RA (1 October 2010). "Detecting network modules in fMRI time series: a weighted network analysis approach". NeuroImage. 52 (4): 1465–76. doi:10.1016/j.neuroimage.2010.05.047. PMC 3632300. PMID 20553896.
Langfelder P, Horvath S (29 December 2008). "WGCNA: an R package for weighted correlation network analysis". BMC Bioinformatics. 9: 559. doi:10.1186/1471-2105-9-559. PMC 2631488. PMID 19114008.

jueves, 1 de marzo de 2018

Entrevista a Aaron Clauset: Aprendizaje automático, economía y genes

Ciencia de redes: el campo oculto detrás del aprendizaje automático, la economía y la genética de la que nunca habrás oído hablar (probablemente): una entrevista con el Dr. Aaron Clauset [Parte 1]

Por Amy Hodler, Gerente del Programa de Analítica
Blog Neo4j

Recientemente tuve la oportunidad de combinar trabajo y placer y reunirme con el Dr. Aaron Clauset, un experto en ciencia de redes, ciencia de datos y sistemas complejos. En 2016, Clauset ganó el Premio Erdos-Renyi en Network Science, pero es posible que esté más familiarizado con su investigación anterior sobre leyes eléctricas, predicción de enlaces y modularidad.

El Dr. Clauset dirige el grupo de investigación que desarrolló la referencia del conjunto de datos ICON (si está buscando datos de red para evaluar, marque esto ahora) y ha publicado recientemente investigaciones que arrojan luz sobre posibles conceptos erróneos sobre estructuras de red. Cuando apareció un viaje de negocios de última hora a Denver, hice el viaje a Boulder, donde Clauset es profesor asistente de ciencias de la computación en la Universidad de Colorado en Boulder.

El Dr. Aaron Clauset es Profesor Asistente de Ciencias de la Computación en la Universidad de Colorado en Boulder y en el Instituto BioFrontiers. También es parte de la facultad externa en el Instituto Santa Fe (para estudios de complejidad).

Entre el almuerzo y la próxima clase de Clauset, hablamos sobre la investigación reciente de su grupo y la dirección general de la ciencia de la red, y me fui con una superposición de desilusión y entusiasmo. El Laboratorio Clauset ha estado trabajando para ampliar la diversidad y el rigor de estudiar sistemas complejos y, al hacerlo, pueden desmantelar algunas creencias que datan de los años 90. (Debería haber sabido que no sería simple, estamos hablando de sistemas complejos después de todo).

Esto le importa a la comunidad gráfica de Neo4j porque cualquier persona que analice las redes, especialmente si buscan atributos globales, necesita comprender la estructura y la dinámica subyacente. A continuación se encuentra un resumen de nuestra discusión.

¿En qué tipo de trabajo se enfoca su equipo?

Clauset: Mi grupo de investigación en CU Boulder actualmente incluye cinco Ph.D. estudiantes, junto con algunos maestros y varios estudiantes universitarios. Nuestra investigación se centra tanto en el desarrollo de nuevos métodos computacionales para la comprensión de conjuntos de datos complicados y desordenados, como en la aplicación de estos métodos para resolver problemas científicos reales, principalmente en entornos biológicos y sociales.

En el grupo, todos están involucrados en la investigación de alguna manera. Por ejemplo, el sitio web ICON (índice de redes complejas) fue construido por un par de estudiantes de licenciatura para aprender conceptos de redes y explorar herramientas.

Las redes son una de nuestras áreas de trabajo clave. Las redes son en realidad solo una representación, una herramienta para comprender sistemas complejos. Representamos cómo funciona un sistema social al pensar en las interacciones entre pares de personas. Al analizar la estructura de esta representación, podemos responder preguntas sobre cómo funciona el sistema o cómo se comportan las personas dentro de él. En este sentido, la ciencia de la red es un conjunto de herramientas técnicas que se pueden aplicar a casi cualquier dominio.

Las redes también actúan como un puente para comprender cómo las interacciones y dinámicas microscópicas pueden conducir a regularidades globales o macroscópicas. Pueden hacer un puente entre lo micro y lo macro porque representan exactamente qué cosas interactúan entre sí. Solía ser común suponer que todo interactúa con todo, y sabemos que eso no es verdad; en genética, no todos los pares de personas y no todos los pares de genes interactúan entre sí.

Tomado de “Hierarchical structure and the prediction of missing links in networks“
Un esfuerzo extremadamente importante en la ciencia de redes es descubrir cómo la estructura de una red da forma a la dinámica de todo el sistema. En los últimos 15 años hemos aprendido que para muchos sistemas complejos, la red es increíblemente importante para configurar lo que les sucede a los individuos dentro de la red y cómo evoluciona todo el sistema.

El trabajo de mi grupo se centra en caracterizar la estructura de estas redes para que podamos comprender mejor cómo la estructura finalmente da forma a la función.

¿Hay puntos en común entre los diferentes tipos de redes?

Clauset: A fines de la década de 1990 y principios de la década de 2000, mucha energía en la conducción de la ciencia de redes provino de los físicos, que aportaron nuevas herramientas matemáticas, modelos y muchos datos nuevos. Una idea que popularizaron fue la hipótesis de que los patrones "universales" ocurrieron en redes de todo tipo: redes sociales, biológicas, tecnológicas, de información e incluso económicas, y que fueron impulsadas por un pequeño número de procesos fundamentales.

Este tipo de idea era bastante normal en una parte de la física. Por ejemplo, hay un modelo matemático universal de cómo funciona un imán que hace predicciones notablemente precisas sobre imanes reales de todo tipo.

El sueño de las redes era mostrar que lo mismo se podía hacer por ellos: que todos los diferentes tipos de redes podían explicarse mediante un pequeño conjunto de principios o procesos matemáticos básicos, o que caían en un pequeño número de categorías estructurales generales. Es una idea bastante poderosa e inspiró tanto un trabajo multidisciplinario realmente bueno como varias afirmaciones altamente provocativas.

La validez de algunas de las afirmaciones más audaces ha sido difícil de evaluar empíricamente porque requirió el uso de un conjunto grande y diverso de redes del mundo real para probar la "universalidad" empírica del patrón. Reunir un conjunto de datos de este tipo es parte de lo que nos llevó a armar el índice de redes complejas, lo que llamamos el índice ICON.

Aunque todavía estamos expandiéndolo, mi grupo ya ha comenzado a revisar muchas de las afirmaciones iniciales sobre patrones universales en redes, incluida la idea de que "todas las redes están libres de escalas", o que solo las redes sociales tienen una alta densidad triangular, o que las redes se agrupan en "superfamilias" basadas en el patrón de su estructura local. Sorprendentemente, muchas afirmaciones sobre la estructura de las redes se han repetido una y otra vez en la literatura, pero no han sido escrutadas cuidadosamente con datos empíricos.

Resulta que muchos de estos patrones universales se desmoronan cuando se puede mirar a través de una gran variedad de redes. El reciente artículo de Kansuke Ikehara [Characterizing the structural diversity of complex networks across domains] plantea una pregunta simple: si etiqueto una gran cantidad de redes de dónde provienen (por ejemplo, una red de transporte / carretera, una red social / en línea o una red metabólica / biológica) ¿puede utilizar el aprendizaje automático para descubrir qué características distinguen a estas clases de redes?

La diversidad estructural de las redes complejas. Si hay algunas "familias" de estructuras de red, entonces ningún algoritmo debería ser capaz de aprender a distinguir las diferentes redes dentro de una familia. En cambio, lo que encontramos fue que prácticamente todas las clases de redes se distinguían fácilmente de las demás clases.

Las redes sociales se agrupan en una parte del espacio de características, las redes biológicas generalmente están bien separadas de aquellas, etc., y esto es cierto para cada clase de red que examinamos. El claro mensaje para llevar a casa es que hay mucha más diversidad en las estructuras de red de lo que pensamos hace 20 años, y por lo tanto, mucho más trabajo por hacer para comprender de dónde viene esta diversidad.

La investigación de Ikehara reveló la diversidad estructural oculta de las redes y sugiere que puede haber menos patrones universales de lo que alguna vez se pensó. Al mismo tiempo, algunos grupos de redes están más cerca unos de otros en términos de su estructura.

Por ejemplo, encontramos que las redes de distribución de agua exhiben firmas estructurales similares a las redes miceliales fúngicas, lo que sugiere que pueden estar formadas por procesos subyacentes similares o problemas de optimización. De esta forma, el aprendizaje automático puede ayudarnos a identificar semejanzas estructurales y, por lo tanto, a ayudarnos a descubrir, de una manera basada en datos, dónde es más probable que encontremos una explicación mecánica común.

¿Cómo está evolucionando la ciencia de la red?

Clauset: En muchos sentidos, la ciencia de redes hoy se está diversificando y expandiendo. Esta expansión permite una gran especialización, pero hay una compensación. Ahora las personas pueden tomar métodos de red y aplicarlos en preguntas realmente específicas sobre sistemas realmente específicos.

Esto es enormemente productivo y un logro emocionante para la ciencia de redes. Pero, el crecimiento del trabajo disciplinario alrededor de las redes también significa que hay relativamente menos trabajo que cruza los límites disciplinarios. Sin espacios compartidos donde personas de diferentes dominios se reúnan para hablar sobre sus avances, las personas que trabajan en un tipo de problema tienen menos probabilidades de exponerse a ideas potencialmente notables en un área diferente.

Claro, muchas ideas sobre economía no se aplicarán a las redes biológicas, pero algunas lo harán, y si los economistas y los biólogos nunca se comunican entre sí, nunca lo sabremos. Si no hay un terreno común, habrá una gran cantidad de reinvención y retrasos, incluso años para que los métodos en un dominio pasen a otro.

Es por eso que creo que es muy importante estudiar y reunirse para debatir sobre las redes en general. Este tipo de fervor interdisciplinario es otra cosa que los físicos y los informáticos ayudaron a poner en marcha hace unos 20 años; eran principalmente físicos y científicos informáticos que transmitían "también podemos hacer sociología, política y ecología".

Esa actitud ciertamente molestó a algunas personas, especialmente a los sociólogos que ya habían estado haciendo redes durante 80 años, pero también generó un enorme y amplio interés en las redes de prácticamente todas las ciencias. Ahora, las diferentes áreas disciplinarias de la ciencia de las redes crecen tan rápido que, de alguna manera, el centro -encrucijada donde las ideas pueden saltar entre los campos- se está reduciendo de manera efectiva.

¿Cómo puede la ciencia de redes fomentar una mayor colaboración entre dominios?

Clauset: Tener un evento real que sirva como una encrucijada entre dominios donde las personas pueden presentarse e interactuar es esencial. En muchos sentidos, la Conferencia Internacional sobre Ciencia de Redes está tratando de hacer eso, pero se esfuerza por sacar a los investigadores de sus dominios y colocarlos en el medio, ya que las diferentes disciplinas tienen diferentes preguntas generales. Creo que siempre que algunos expertos en dominios de diferentes campos lleguen a la encrucijada para hablar e interactuar, las buenas ideas eventualmente se extenderán.

Continuar con este esfuerzo interdisciplinario será una parte clave para continuar el avance de la ciencia de redes. Pero no todos los esfuerzos deben ser interdisciplinarios. De hecho, las disciplinas son esenciales para ayudar a enfocar nuestra atención colectiva.

No estoy seguro de cuál es el equilibrio correcto entre el trabajo disciplinario y el interdisciplinario, pero para mí las ideas interdisciplinarias son las más interesantes. Si el trabajo sobre estos no está financiado y respaldado a niveles decentes, seguramente no abordaremos muchas de las ideas más importantes de la sociedad porque son las que abarcan diferentes disciplinas.

Por ejemplo, la ciberseguridad no es solo un problema técnico, ya que los humanos tienen un terrible historial de escritura de software libre de errores. La seguridad real requiere componentes legales, componentes sociales, componentes éticos, componentes económicos y probablemente más para desarrollar una solución duradera.

De hecho, si elige cualquier problema que afecte a una porción decente de la población, entonces seguramente se trate de un problema interdisciplinario que requerirá un enfoque interdisciplinario para comprender y resolver.

Conclusión

Como puede ver, tuvimos una gran discusión sobre cómo están cambiando algunas de las ideas preconcebidas sobre las redes. La próxima semana, en la segunda parte de esta serie, resumiré nuestra inmersión más profunda en algunos de los avances y temas emergentes en la ciencia de redes.

viernes, 12 de enero de 2018

Apareamiento selectivo y nivel de ingresos: Un lazo fuerte en Gran Bretaña

El problema de clase de Gran Bretaña se reduce a "apareamiento selectivo"

Lianna Brinded || Quartz

Gran Bretaña está obsesionada con la clase social. Ya sea que se trate de los trabajos que tenemos, las palabras que usamos, la educación que recibimos, las creencias políticas, o incluso los programas de televisión que vemos, estar preocupados con la clase es tan británico como beber té y comer pescado con papas fritas.

Si bien el sistema de clases es complejo, un diferenciador clave es el capital económico; y la falta de igualdad de ingresos le da a Gran Bretaña uno de los peores problemas de movilidad social en el mundo.

Pero los británicos tienden a exacerbar el problema de la desigualdad del ingreso de las clases sociales con el "apareamiento selectivo": elegir tener hijos con alguien que tenga rasgos similares. Si bien los estudios muestran que los humanos lo hacen al observar los marcadores genéticos, un informe publicado hoy (30 de diciembre) por el think tank independiente Resolution Foundation señaló (pdf y ver al final de la nota) que en el Reino Unido "la gente tiende a juntarse con aquellos que tienen expectativas de herencia similares a el suyo ".

Por supuesto, esto podría ser una situación de gallina y huevo. Si naces en cierta clase en Gran Bretaña, es menos probable que te muevas dentro de la sociedad y, por lo tanto, estés expuesto a más socios potenciales en otros grupos. Pero por lo general, al estar en contacto con otras personas de posición social similar, terminas perjudicando la movilidad social al fortalecer el status quo.

"El apareamiento selectivo probablemente amplifique estas brechas absolutas en las transferencias de riqueza futuras de los individuos a nivel de los hogares", dijo el informe. "Los adultos menores de 50 años que están en pareja y no esperan heredarse tienen socios con una herencia futura promedio esperada de £ 25,000 (U$D 33,759). Por el contrario, aquellos que esperan heredar más de £ 500,000 en el futuro tienen socios con una herencia futura media esperada de £ 190,000 ".

The Resolution Foundation también señala que las fortunas pasadas a la generación más joven se reducen principalmente a la propiedad de la vivienda. Cuanto más pobre es la familia, es menos probable que sean propietarios de su hogar, e incluso si poseen propiedades, es poco probable que valga tanto como sus contrapartes más ricas. El grupo de expertos dice que el 46% de las personas entre 20 y 35 años que no poseen una casa no tienen riqueza de propiedad de los padres, lo que significa que es más probable que nunca hereden una o pasen una a sus propios hijos.

(Análisis de Resolution Foundation de ONS, Wealth and Assets Survey)

Tal vez las narraciones románticas de la cultura pop sobre personas que se enamoran de alguien "del lado equivocado de la vía", como en espectáculos populares como Downton Abbey (foto inicial), sean tan convincentes en Gran Bretaña precisamente porque esas relaciones son tan poco probables estadísticamente.

The Resolution Foundation también analizó cuáles son las implicaciones para las herencias y los dones en los niveles de vida generacionales. Descubrió que estos tipos de transferencias de riqueza ayudarán significativamente a los jóvenes de la generación del milenio (nacidos entre 1981 y 2000) en los próximos años, incluso más que las generaciones anteriores. Esto se debe a que las tasas de propiedad de la vivienda de los padres de la generación del milenio (nacidos durante el baby boom entre 1946 y 1965) son del 75% y "el valor real de las fincas pasando por la muerte se ha más que duplicado en los últimos 20 años".

Sin embargo, como se señala en el informe, los hijos de padres ricos recibirán mayores herencias, mientras que los muy pobres recibirán casi nada. Si la historia se repite, sus hijos se juntarán con otros con antecedentes económicos similares, y la brecha de igualdad de ingresos se ampliará aún más, como lo ha hecho durante generaciones.

Apareamiento selectivo

Lire plus de publications sur Calaméo

martes, 10 de enero de 2017

Extracto: Ramas genéticas en el árbol de la vida

La eterna búsqueda de reescribir el árbol de la vida
Por Carrie Arnold - Nova Next

El fondo del océano es uno de los lugares más misteriosos del planeta, pero la microbióloga Karen Lloyd de la Universidad de Tennessee, Knoxville, quiso ir más allá de eso. En 2010 fue postdoctoral en la Universidad de Aarhus en Dinamarca y Lloyd quiso ver qué microbios vivían a más de 400 pies bajo el fondo marino.

Al igual que casi todos los microbiólogos que hacen este tipo de censo, se basó en 16S rRNA secuenciación para determinar quién estaba allí. Desarrollado por el microbiólogo Carl Woese a finales de los años setenta, la técnica busca variaciones en el gen 16S rRNA, común a todos los organismos (es clave para convertir el ADN en proteína, uno de los procesos más fundamentales de la vida). Cuando Lloyd comparó lo que había visto bajo el microscopio con lo que sus datos de secuenciación decían, sin embargo, sabía que sus resultados de ADN estaban perdiendo una gran parte de la vida oculta bajo el océano.

......

Estudiando a los incultos

Típicamente, para estudiar microbios, los científicos los han cultivado en una cultura pura de un solo individuo. Aunque son útiles para estudiar estos organismos en el laboratorio, la mayoría de los microbios viven en comunidades complejas de muchos individuos de diferentes especies. A partir de principios de la década de 2000, las tecnologías de secuenciación genética habían avanzado hasta el punto en que los investigadores podían estudiar el complejo conjunto de genomas microbianos sin necesariamente necesitar cultivar cada organismo individual. Conocido como metagenómica, el campo comenzó con los científicos centrados en los genes que se encontraron en la naturaleza, lo que sugeriría cómo cada especie o cepa de microbios podría sobrevivir en diferentes entornos.

Así como Woyke estaba duplicando la secuenciación de una sola célula, Banfield comenzó a usar la metagenómica para obtener una imagen más matizada y detallada de la ecología microbiana. Los problemas a los que se enfrentaba, aunque muy diferentes a los de Woyke, no eran menos molestos. Al igual que Woyke, Banfield se centró en entornos extremos: respiraderos hidrotermales acre en el fondo del océano que eructó una vil mezcla de ácido sulfúrico y humo; Un acuífero que fluye a través de relaves de minas tóxicas en Rifle, Colorado; Una salina en el perpetuo desierto de Atacama, en Chile; Y el agua encontrada en la mina de la montaña del hierro en California norteña que es algo del más ácido encontró dondequiera en la tierra. También como Woyke, Banfield sabía que la identificación de la gama completa de microbios que viven en estos entornos infernales significaría alejarse del uso del conjunto estándar de cebadores de rRNA 16S. El tema principal que Banfield y sus colegas enfrentaron fue averiguar cómo ensamblar la mezcla de material genético que aislaron de sus muestras en genomas discretos.

Una red de conectividad calculada por Banfield y sus colaboradores muestra cómo las diferentes proteínas ilustran las relaciones entre los diferentes microbios.

La solución no era una nueva técnica de laboratorio, sino una forma diferente de procesar los datos. Los investigadores obtienen su información metagenómica dibujando una muestra de un entorno particular, aislando el ADN y secuenciándolo. El proceso de secuenciación rompe cada genoma en trozos más pequeños de ADN que las computadoras luego vuelven a montar. Reacondicionar un solo genoma no es nada diferente de ensamblar un rompecabezas, dice Laura Hug, microbióloga de la Universidad de Waterloo en Ontario, Canadá, y ex postdoc en el laboratorio de Banfield.

Cuando se enfrentan a un solo rompecabezas, la gente suele elaborar una estrategia, como ensamblar todas las esquinas y bordes, agrupar las piezas restantes en diferentes colores y ponerlas lentamente juntas. Es una tarea difícil con un único genoma, pero es aún más difícil en la metagenómica. "En metagenomics, usted puede tener cientos o incluso miles de rompecabezas, muchos de ellos pueden ser todos azules, y no tienes idea de cómo se ve la imagen final. Las computadoras tienen que averiguar qué piezas azules van juntas e intentar extraer un rompecabezas completo y preciso de este revoltijo ", dice Hug. No es sorprendente que los primeros días de la metagenómica estuvieran llenos de genomas incompletos y mal montados.

El avance de Banfield ayudó a domar la tarea. Ella y su equipo desarrollaron un mejor método para binning, el nombre formal para el proceso de computadora que clasifica a través de la pila de piezas de rompecabezas de ADN y las organiza en un producto final. Como su laboratorio hizo mejoras, fueron capaces de estudiar un creciente rango de ambientes en busca de microbios raros y extraños. El progreso fue rápido. En la década de 1980, la mayoría de las bacterias y arqueas que los científicos sabían acerca de encajar en 12 principales phyla. Para 2014, los científicos habían aumentado ese número a más de 50. Pero en un único documento de Nature en 2015, Banfield y sus colegas añadieron 35 phyla adicionales de bacterias al árbol de la vida.

El último árbol de la vida fue producido cuando Banfield y sus colegas agregaron otros 35 grupos principales, conocidos como phyla.

Debido a que los investigadores no sabían esencialmente nada acerca de estas bacterias, los denominaron "radiación candidata de los phyla", o CPR, el equivalente bacteriano de la DPANN de Woyke. Al igual que las arqueas, estas bacterias se agruparon debido a sus similitudes entre sí y sus diferencias marcadas con otras bacterias. Banfield y sus colegas estimaron que los organismos CPR pueden abarcar más del 15% de todas las especies bacterianas.

"Esto no era como descubrir una nueva especie de mamífero", dice Hug. "Fue como descubrir que los mamíferos existieron en absoluto, y que están a nuestro alrededor y no lo sabíamos".

Nueve meses después, en abril de 2016, Hug, Banfield y sus colegas utilizaron los últimos estudios para construir un nuevo árbol de vida. Su resultado reafirmó el árbol original de Woese de 1978, mostrando a los seres humanos y, de hecho, a la mayoría de las plantas y animales, como simples ramas. Este nuevo árbol, sin embargo, era mucho más lleno, con mucho más ramas y ramas y una más rica variedad de follaje. Gracias en gran parte a los esfuerzos de Banfield y Woyke, nuestra comprensión de la vida ya no es un árbol recién nacido, sino un árbol joven que madura rápidamente y se está convirtiendo en un adulto plenamente arraigado.

miércoles, 31 de agosto de 2016

Modularidad en redes genéticas de proteínas

Significado biológico de estructuras modulares en las redes de proteínas
Categoría: Ingeniería Genética

Personas de Investigación: Jianzhi Zhang y Zhang Jianzhi

Lugar: Edificio 2019 Kraus de Ciencias Naturales, Universidad del Norte 830, Ann Arbor, MI 48109 a 1048, t: 734.615.4917 // f: 734.763.0544, Estados Unidos

Detalles

Importancia biológica de estructuras modulares en las redes de proteínas

Es fácil observar que muchas redes de forma natural se dividen en comunidades o módulos, donde los enlaces dentro de los módulos son más fuertes y más denso que esos módulos en todo - como la forma en que las personas de la misma edad tienden a interactuar más entre sí que con personas de diferentes edades grupos. Se cree ampliamente que las redes dentro de las células son modulares, de la misma manera. Dres Zhi Wang y Zhang Jianzhi, de la Universidad de Michigan, ahora investigan estas propiedades modulares y concluyen que puede ser sólo un subproducto de la evolución al azar, y no es funcional en absoluto.

Se cree que los módulos de redes celulares que se formen de una manera que refleja la relativa independencia y la coherencia de las distintas unidades funcionales en una célula - cada módulo tiene una función. Esta investigación, publicada en la revista de acceso abierto PLoS Computational Biology, sugiere ahora que los módulos estructurales en la red de interacción proteína-proteína de levadura pueden haberse originado como un subproducto evolutivo sin mucha importancia biológica.

Hay poca evidencia de que los módulos estructurales descritas previamente se corresponde en absoluto a las unidades funcionales. Parece que los análisis anteriores pueden haber creado incluso algunos de estos módulos a través de las técnicas usadas para investigar las propiedades de la proteína. Refutar los estudios anteriores, los autores muestran ahora mediante simulación por ordenador que pueden surgir estructuras modulares durante el crecimiento de la red a través de un modelo simple de la duplicación de genes, sin preferencia de selección natural para la modularidad.

Resumen del autor

Muchas redes complejas se dividen de forma natural en las comunidades o módulos, en los enlaces dentro de los módulos son mucho más densos que los del otro lado módulos. Por ejemplo, los individuos humanos que pertenecen a los mismos grupos étnicos interactúan más entre ellos que los de diferentes grupos étnicos. Las funciones celulares también se organizan de una manera altamente modular, donde cada módulo es un objeto discreto compuesto de un grupo de componentes estrechamente vinculados y realiza una tarea relativamente independiente. Es interesante preguntarse si esta modularidad en la función celular surge de la modularidad en redes de interacción molecular, tales como la red de regulación transcripcional y redes (IPP) de interacción de proteínas. Analizamos la red de levadura PPI y demostrar que sí es significativamente más modular que las redes reconectados al azar. Sin embargo, encontramos poca evidencia de que los módulos estructurales corresponden a las unidades funcionales. También somos capaces de observar cualquier conservación evolutiva entre la levadura, moscas, y módulos de nematodos PPI. A continuación, muestran mediante simulación por ordenador que pueden surgir estructuras modulares durante el crecimiento de la red a través de un modelo simple de la duplicación de genes, sin que la selección natural para la modularidad. Por lo tanto, parece que los módulos estructurales de la red PPI pueden haberse originado como un subproducto evolutivo sin mucha importancia biológica.

Acerca de Investigadores:
Jianzhi Zhang y Zhang Â jianzhi
Departamento de Ecología y Biología Evolutiva,
Universidad de Michigan,
Ann Arbor,
Michigan,
Estados Unidos de América

Financiado-
Este trabajo fue apoyado en parte por subvenciones de investigación de los Institutos Nacionales de Salud y la Universidad de Michigan para JZ.

1. Un ejemplo de una red de pequeño mundo con una estructura modular (A) y su red aleatoriamente recableada (B)

2. La modularidad del levadura PIC y Redes PEC comparadas con la de sus redes de recableado al azar, y la similitud de composiciones de módulos entre PIC y Redes PEC edn comparación con redes recableadas al azar

3. Red PPI Representaciones de complejos de proteínas

4. La falta de correspondencia evidente entre los módulos estructurales y unidades funcionales

sábado, 31 de octubre de 2015

Redes genéticas de frío y sequía muy diferentes

En las redes de genes, todo es ubicación, ubicación, ubicación

Crédito de la imagen: Los genes implicados en adaptaciones extremas de clima Arabidopsis thaliana ocupan de muy diferentes lugares en la red: los genes de clima frío (izquierda) están densamente agrupadas y altamente conectados en el centro; genes de sequía (derecha) se encuentran cerca de los puntos finales. (Scarpino)

Desde el aspecto hasta la resistencia, las adaptaciones de la naturaleza se retrotraen a las redes moleculares complejas de los seres vivos. Mejorar nuestra comprensión de cómo los genes dan lugar a adaptaciones externas puede depender de tres conceptos de la ciencia de las redes - Ubicación, ubicación, ubicación.
Tomemos el ejemplo de los humildes malezas invierno Arabidopsis thaliana, la primera especie de la planta en ser secuenciada genéticamente. Intentos experimentales anteriores para encontrar los orígenes genéticos de frío y el proyecto de la tolerancia de la planta se presentaron resultados idiosincrásicos.

En 2014, un grupo de trabajo del Santa Fe Institute co-organizado por Sam Scarpino, Jesse Lasky, David Des Marais, y Rafael Guerrero ayudó a dar sentido a los datos utilizando algoritmos de redes para analizar la red de activación genética de Arabidopsis - las vías químicas laberínticas de la expresión génica.
Resulta que los genes implicados en adaptaciones extremas de clima de la maleza ocupan muy diferentes lugares en la red: los genes fríos están densamente agrupadas y altamente conectados en el centro, y por lo tanto influyen en gran medida los genes más lejos a lo largo de las vías de expresión. Los genes de sequía, por el contrario, se encuentran cerca de los puntos finales.
En pocas palabras, "es la biología lo que es lo más importante", dice Scarpino, explicando que el conocimiento de la distribución de genes en una red molecular, y no sólo las estadísticas de la expresión génica, es crucial en la comprensión de las adaptaciones.
Con lo establecido, se sientan las bases para explicar el papel de las redes moleculares en la adaptación. El grupo de trabajo de Molecular Networks and Evolution Across Biological Scales Evolution (Redes Moleculares y Evolución Biológica entre Escalas de Evolución) se reunió de nuevo el mes pasado para desarrollar un marco teórico general, entonces probarlo utilizando experimentos de trasplante recíprocas de Arabidopsis y la hierba silvestre Brachypodium.

Santa Fe Institute

Páginas