miércoles, 8 de marzo de 2017

Clusteres en redes complejas de proteínas

Una red compleja de proteínas de la Drosophila melanogaster


K.G. Guruharsha1, Jean-François Rual, Bo Zhai1, ,Julian Mintseris, Pujita Vaidya, Namita Vaidya, Chapman Beekman, Christina Wong, David Y. Rhee, Odise Cenaj, Emily McKillip,

http://dx.doi.org/10.1016/j.cell.2011.08.047

Science Direct


Resumen

Determinar la composición de complejos de proteínas es un paso esencial hacia la comprensión de la célula como un sistema integrado. Usando la purificación de coafinidad acoplado a un análisis de espectrometría de masas, examinamos asociaciones de proteínas que implican casi 5.000 proteínas de Drosophila marcadas con epítopo FLAG-HA. El riguroso análisis de estos datos, basado en un marco estadístico diseñado para definir interacciones individuales proteína-proteína, condujo a la generación de un mapa de interacción de proteínas de Drosophila (DPiM) que abarca 556 complejos de proteínas. La alta calidad del DPiM y su utilidad como paradigma para los proteomas metazoarios son evidentes a partir de la recuperación de muchos complejos conocidos, el enriquecimiento significativo para los atributos funcionales compartidos y la validación en células humanas. El DPiM define nuevos miembros potenciales para varios importantes complejos de proteínas y asigna enlaces funcionales a 586 genes de codificación de proteínas que carecen de anotación experimental anterior. El DPiM representa, según nuestro conocimiento, el mapa de complejos de proteínas metazoarias más grande y proporciona un valioso recurso para el análisis de la evolución del complejo proteico.



Figura 2.
DPiM
Representación gráfica de la DPiM que comprende 10.969 de alta confianza de interacciones co-complejas de pertenencia (a 0,05% FDR), con 2.297 proteínas. Las interacciones de proteínas se muestran como líneas grises con grosor proporcional al HGSCore para la interacción en el DPiM. El mapa define 556 clusters, 377 de los cuales están interconectados, lo que representa casi el 80% de las proteínas en la red. Los restantes 179 grupos no están conectados a miembros de otros complejos. Representados con diferentes colores son 153 grupos enriquecidos para GO términos, KEGG vías, o Pfam / InterPro dominios. Las proteínas en otros grupos que no están enriquecidos se muestran como círculos grises. Se indican complejos seleccionados con función molecular / papel biológico conocidos.


Implicaciones biológicas de los complejos de proteínas en el DPiM
(A) Mapa de calor bidimensional que muestra el número de péptidos identificados para cada subunidad de proteasoma. Cada columna corresponde a proteínas copurificadas en un experimento de cebo de proteasoma particular. Se agregaron columnas grises (marcadas con asteriscos) si no existía un cebo. Ambos ejes están dispuestos de acuerdo con la clasificación de subunidad de proteasoma, es decir, núcleo (β y α) o regulador (base y tapa). Siete subunidades específicas de los testículos están resaltadas en azul. "P" se refiere a Pomp.
(B) El grupo de proteasomas en el DPiM con subunidades conformadas de acuerdo con los dominios Pfam / InterPro; Los círculos representan nodos sin enriquecimiento de dominio. El grosor de cada línea gris es proporcional al HGSCore de interacción. Se muestran evidencias físicas (líneas rojas) y genéticas (líneas verdes) adicionales de la literatura, con un grosor de línea proporcional al número de fuentes.
(C) Los clústeres # 7 y # 162, el complejo SNAP / SNARE, están conectados por Syb a varios miembros del grupo # 22, el complejo de Flotillin.
(D) El grupo # 117 incluye proteínas pertenecientes a la vía de señalización Hedgehog. La proteína Pka-R1 tiene interacciones con HGSCores por debajo del umbral (líneas punteadas).
(E) Cluster # 42, el complejo Prefoldin, en el que todos los seis miembros predichos están conectados, junto con tres proteínas adicionales, ninguno de los cuales está bien estudiado.
(F) Cluster # 26, el complejo PP1 tiene múltiples interacciones genéticas y físicas descritas en la literatura. Se muestran las subunidades conocidas PP1α87B, PP1α13C, PP1α96A y PP1β9C (flechas azules) y la subunidad específica de testículo Pp1-Y1 (flecha roja).
(G) Cluster # 60, el complejo MCM (helicasa), tiene los seis miembros conocidos junto con CG3430 (conectado a Mcm3 y Mcm5).
(H) Cluster # 47, el complejo de Augmin, involucrado en la organización del huso mitótico, es un complejo autónomo en la red DPiM.



Figura S3.
Complejos con miembros que comparten términos GO y funciones celulares, relacionados con la figura 4
Ejemplos seleccionados de complejos de DPiM con diferentes subunidades coloreadas de acuerdo con los conglomerados definidos en el mapa. Las proteínas mostradas en gris no forman parte del cluster computado. El diseño de cada complejo está guiado por la fuerza de interacción. El grosor de la línea gris que conecta las subunidades es proporcional al HGSCore de interacción en DPiM. También se muestran pruebas físicas adicionales (líneas rojas) y evidencia genética (líneas verdes) de la literatura, con un espesor lineal proporcional al número de fuentes que lo sustentan; Similar a la figura 4 del texto principal.


Figura S4.
Interacciones Intercomplex en DPiM, Relacionadas con la Figura 5
Los nodos son proporcionales al tamaño del clúster y los bordes proporcionales a la suma de HGSCores inter-clúster. Solamente los bordes donde la suma es mayor que el doble del mínimo DPiM HGSCore se conservan para mayor claridad. Donde existe enriquecimiento GO plazo (múltiples hipótesis de prueba ajustada p <0,01), los nodos se etiquetan con el término más significativo; De lo contrario, se mostrará el número del clúster. El gráfico circular para cada nodo se compone de 3 cuñas: fracción de genes que concuerdan con el término GO más enriquecido (rosa); Fracción de genes que tienen alguna anotación de término GO pero que no coincide con el término GO más enriquecido significativamente en el grupo (cian) y fracción de genes que carecen de cualquier anotación de término GO (amarillo); Relacionado con la figura 5 del texto


Figura 5.
Modularidad de la subred de Spliceosome
(A) Representación esquemática de la interacción escalonada de snRNPs con pre-mRNA y otras proteínas en el proceso de empalme intrones, como se describe en la literatura.
(B) La subred spliceosome en el DPiM consta de 12 clusters que están bien conectados. Los ~ 80 nodos en esta subred constituyen una porción muy sustancial de la ruta spliceosome como se define en KEGG (vía: dme03040) y Herold et al. (2009). Los principales subcomplejos spliceosome se colorean de acuerdo con la anotación funcional (igual que en A para la comparación), y las proteínas se forman de acuerdo con el enriquecimiento de dominio Pfam. Las interacciones de proteínas se muestran como líneas grises con espesores proporcionales a HGSCore, y aquellas con puntuaciones por debajo del corte estadístico se muestran como líneas punteadas. Otras proteínas que no están clasificadas como componentes spliceosome en KEGG o en otro lugar, pero conectados a estos complejos en la red DPiM son incoloros. La mayoría de estas proteínas no especulares tienen una anotación "mRNA binding". La modularidad de esta maquinaria molecular multisubunit se conserva en el DPiM en forma de subredes que se agrupan entre sí. Las flechas de color y las puntas de flecha denotan los complejos mencionados en el texto.


Figura 6.
Ejemplos de la evolución del complejo proteico
Comparación de cuatro complejos definidos en mosca por el DPiM (paneles centrales) con levadura (paneles de la izquierda) y complejos humanos (paneles de la derecha). Las líneas grises muestran interacciones físicas que tienen puntajes ponderados, y las líneas rojas muestran interacciones implícitas en los conjuntos de datos curados. Para la comparación, los orthologs de InParanoid en las tres especies se representan con colores idénticos. Las proteínas que no tienen homólogos en otras especies se muestran en blanco. Los miembros complejos para los que existe evidencia en conjuntos de datos de alto rendimiento y curado (levadura) o ambas bases de datos REACTOME y CORUM (humano) se distinguen por nodos más gruesos.
(A - C) El complejo eIF3 (grupo # 24). La mosca y los complejos humanos comparten siete proteínas interconectadas (dentro de la región de puntos verdes), que no están presentes en la levadura. Cinco proteínas se conservan en las tres especies (dentro de la región de puntos azules).
(D-F) El complejo de señasoma en la levadura está compuesto de proteínas que comparten poca similitud de secuencias con homólogos metazoarios. El signosoma eucariótico está compuesto de ocho subunidades (CSN1-8) como se ve en el complejo humano (F), pero CSN1a, CSN1b, y CSN8 no son parte del signosoma de mosca en células S2R +.
(G-I) La función ESCRT-I se conserva de levadura a seres humanos, pero sólo VPS28 y STP22 en levadura y sus respectivas moscas y ortólogos humanos son fácilmente evidentes. Un análisis adicional sugiere una relación distante entre MVB12 en la levadura y Drosophila complejo miembro CG7192, una proteína de función desconocida (flechas). La levadura SRN2 también comparte el dominio Mod_r con CG1115 y VPS37C (asteriscos).
(J) El complejo UTP-B de levadura implicado en el procesamiento de ARN tiene seis miembros bien conectados.
(K) En DPiM sólo cuatro miembros están conectados, pero CG7246 y l (2) kO7824 no están incluidos en el cluster DPiM # 160.
(L) No hay evidencia que sugiera interacción física entre los miembros complejos en humanos.
Véase también la Tabla S7.



No hay comentarios:

Publicar un comentario