Este blog reúne material del curso de posgrado "Análisis de redes sociales" dictado en la Universidad Nacional del Sur (Argentina).
martes, 23 de agosto de 2016
domingo, 21 de agosto de 2016
Cliques en redes de proteínas
Complejos de proteínas y módulos funcionales en las redes moleculares
Victor Spirin y Leonid A. Mirny *
PNAS
Editado por Lawrence A. Shepp, Rutgers, la Universidad Estatal de Nueva Jersey en New Brunswick, Piscataway, NJ, y aprobada en 5 de agosto de 2003 (recibido por opinión 22 abril de 2003)
Las proteínas, ácidos nucleicos, y pequeñas moléculas forman una densa red de interacciones moleculares en una célula. Las moléculas son nodos de esta red, y las interacciones entre ellos se encuentran los enlaces. La arquitectura de las redes moleculares puede revelar importantes principios de organización y función celular, de manera similar a la forma en que la estructura de proteínas nos dice acerca de la función y la organización de una proteína. Análisis computacional de las redes moleculares ha ocupado principalmente de grado nodal [Wagner, A. y Fell, D. A. (2001) Proc. R. Soc. London Ser. B 268, 1803-1810; Jeong, H., Tombor, B., Albert, R., Oltvai, ZN y Barabási, AL (2000), Nature 407, 651-654] o correlación grado [Maslov, S. & Sneppen, K. (2002), Science 296 , 910-913], y por lo tanto se centró en las propiedades individuales / de dos cuerpos de estas redes. Aquí, mediante el análisis de la estructura multicuerpo de la red de interacciones proteína-proteína, descubrimos módulos moleculares que están conectados densamente dentro de sí mismos pero escasamente conectados con el resto de la red. La comparación con los datos experimentales y la anotación funcional de genes mostró dos tipos de módulos: (i) complejos de proteínas (maquinaria de empalme, factores de transcripción, etc.) y (ii) unidades funcionales dinámicos (cascadas de señalización, la regulación del ciclo celular, etc.). módulos descubiertos son estadísticamente muy significativa, como se desprende de la comparación con los grafos aleatorios, y son robustos al ruido en los datos. Nuestros resultados proporcionan un fuerte apoyo al principio de la modularidad de red introducida por Hartwell et al. [Hartwell, L. H., Hopfield, J. J., Leibler, S. y Murray, A. W. (1999) Nature 402, C47-C52], lo que sugiere que los módulos que se encuentran constituyen los "bloques de construcción" de las redes moleculares.
Los experimentos a gran escala y la integración de los datos publicados (1) han proporcionado mapas de varias redes biológicas tales como las redes metabólicas (2, 3), proteína-proteína (4, 5) y la proteína-DNA (6, 7), etc. Aunque incompleta y, tal vez, inexacta (8-11), estos mapas se convirtió en un punto focal de una búsqueda de los principios generales que rigen la organización de las redes moleculares (12-16). características estadísticas importantes de tales redes incluyen la distribución de ley de potencia (P (k) ~ k-γ) (por ejemplo,. refs 16 y 17) o una distribución similar del grado del nodo k (es decir, el número de enlaces de un nodo) ; la propiedad del mundo pequeño (11, 13, 16) (es decir, un alto coeficiente de agrupación y un pequeño camino más corto entre cada par de nodos); anticorrelación en el nodo de grado de nodos conectados (15) (es decir, altamente interactuar nodos tienden a ser conectado a los de bajo interactuar); y otras propiedades.
Estas propiedades hacen evidentes cuando cientos o miles de moléculas y sus interacciones se estudian juntos. motivos recientemente descubiertos (7, 18) que constan de tres a cuatro nodos constituyen el otro extremo del espectro. características a gran escala son generalmente atribuidos a los procesos evolutivos masivos que dan forma a la red (6, 14), mientras que muchos motivos pequeña escala representan la contribución y los bucles de alimentación directa en la regulación celular (18, 19). Sin embargo, los procesos biológicos más importantes, tales como la transducción de señales, regulación de la celda de destino, la transcripción y la traducción implican más de cuatro, pero mucho menos de cientos de proteínas. La mayoría de los procesos pertinentes de las redes biológicas corresponden a la mesoescala (5-25 genes / proteínas). propiedades meso-escala de las redes biológicas han sido en su mayoría difícil de alcanzar debido a las dificultades de cálculo en la enumeración de las subredes de tamaño medio (por ejemplo, una red de 1.000 nodos contiene 1 × 1023 posibles conjuntos de 10 nodos).
A continuación, presentamos una exploración a fondo de las redes moleculares en el nivel meso-escala. Nos centramos en las interacciones multicuerpo y realizaron búsquedas de conjuntos de proteínas que tienen muchas más interacciones entre ellos que con el resto de la red (clusters). Hemos desarrollado varios algoritmos para encontrar este tipo de agrupaciones en una red arbitraria. Se analizó una red de levadura de interacciones proteína-proteína (20) y encontramos> 50 grupos de proteínas conocidas y previamente no. Se analizaron anotación funcional de estos grupos y se encontró que la mayoría de grupos identificados corresponden a cualquiera de los dos tipos de módulos celulares: los complejos de proteínas o módulos funcionales (ver Discusión). complejos de proteínas son grupos de proteínas que interactúan entre sí al mismo tiempo y lugar, formando una sola máquina multimolecular. Los ejemplos de complejos de proteínas identificadas incluyen varios complejos grandes factor de transcripción, el complejo promotor de la anafase, el empalme de ARN y la maquinaria de poliadenilación, complejos de exportación de proteínas y de transporte, etc. módulos funcionales, en contraste, se componen de proteínas que participan en un proceso celular particular, mientras que la unión entre sí en un momento diferente y colocar (diferentes condiciones o fases del ciclo celular, en diferentes compartimentos celulares, etc). Ejemplos de módulos funcionales identificados incluyen el módulo de CDK / ciclina responsable de la progresión del ciclo celular, la ruta de respuesta de la levadura de feromonas, cascadas de señalización MAP, etc. Los complejos y módulos descubiertos tienen una alta significación estadística y anotación funcional consistente (si está disponible), y combinar muy bien al obtenido experimentalmente complejos de proteínas (21, 22). Es importante destacar que, al basarse en interacciones multicuerpo, nuestro método es robusto a las interacciones falsos positivos presentes en la red.
La red de interacciones de proteínas (20) se representa como un grafo no dirigido con proteínas como nodos y las interacciones proteína como enlaces no dirigidos. La idea clave de nuestro análisis fue identificar subgrafos altamente conectados (clusters) que tienen más interacciones dentro de sí mismos y menos con el resto del grafo. Un subgrafo totalmente conectado, o camarilla, que no es una parte de cualquier otra clique es un ejemplo de un grupo de este tipo. En general, no requieren agrupaciones para ser totalmente conectada; En su lugar, la densidad de las conexiones de la agrupación se midió por el parámetro Q = 2 m / (n (n - 1)), donde n es el número de proteínas en el clúster y m es el número de interacciones entre ellos. Hemos desarrollado algoritmos que pueden identificar grupos de suficientemente alta Q en un grafo arbitrario. Tenga en cuenta que, a pesar de alguna similitud, el problema de subgraphs densas no es idéntico al problema de los objetos de agrupación en un espacio métrico y no puede ser resuelto por técnicas de agrupamiento tradicionales.
El segundo método utiliza una técnica de agrupación que trabaja sobre puntos no incluidos en un espacio métrico. Un potente algoritmo de este tipo es la agrupación superparamagnético (SPC) (23). En pocas palabras, este enfoque asigna un "giro" a cada nodo en el grafo. Cada giro puede ser en varias (más de dos) estados. Giros pertenecientes a los nodos conectados interactuar y tener la energía más baja cuando se encuentran en el mismo estado. El sistema (conocido como el modelo de Potts) está sujeta a equilibrio a temperatura distinta de cero, haciendo giros fluctúan. El concepto detrás de este método es que los giros que pertenecen a un grupo altamente conectado fluctúan de una manera correlacionada. Mediante la detección de giros correlacionados, el algoritmo puede identificar nodos que pertenecen a un área altamente conectado del grafo. Domany y compañeros de trabajo presentó un sistema de este tipo para los puntos de la agrupación en un espacio arbitrario (23) y con éxito se aplican a una variedad de problemas de agrupamiento (24, 25). Aquí, hemos aplicado SPC para identificar grupos en un grafo.
En el tercer método, formulamos el problema de encontrar conjuntos altamente conectadas de nodos como un problema de optimización: encontrar un conjunto de n nodos que maximiza la función Q (m, n) = 2 m / (n (n - 1)), donde m es el número de interacciones entre n nodos. El parámetro (0 ≤ Q ≤ 1) caracteriza la densidad de un clúster. Para un conjunto de nodos totalmente conectado, Q = 1, y para un conjunto no conectadas entre sí, Q = 0. El Monte Carlo procedimiento de optimización (MC) comienza con un conjunto conexo de n nodos seleccionados al azar en el grafo y los ingresos por "movimiento" nodos seleccionados a lo largo de los enlaces del grafo para maximizar se mueve Q. se aceptan de acuerdo a los criterios de Metropolis. También hemos desarrollado un algoritmo que minimiza la suma de las distancias más cortas entre los nodos seleccionados. Ambos algoritmos son muy eficientes y convergen rápido para identificar un grupo muy conectado. Ambos algoritmos requieren que el tamaño del conglomerado buscado como un parámetro de entrada. Aunque la tasa de convergencia de MC depende de la temperatura efectiva, el algoritmo converge rápidamente a una amplia gama de temperaturas (Fig. 6, que se publica como información de apoyo en el sitio web de PNAS). Comparación de algoritmos MC y SPC han mostrado un mejor comportamiento de MC para los clústeres que comparten nodos comunes y para los grafos de alta densidad, mientras SPC tiene una ventaja identificar los grupos que tienen muy pocas conexiones con el resto del grafo (Fig. 7, la cual es publicada como información de apoyo en el sitio web de PNAS).
Los grupos encontrados se sometieron después a una limpieza más profunda, la fusión y la selección de acuerdo con los criterios de significación estadística (véase el texto de apoyo para más detalles).
Significancia estadística. Para estimar la significación estadística de un clúster que tiene n las proteínas y las interacciones m entre ellos, uno tendría que calcular el número esperado de estas agrupaciones E (n, m) en un grafo al azar comparable (es decir, grafo al azar que satisfaga ciertas restricciones, es decir, , fijar nodo de grado). Debido a la explosión combinatoria de posibles subgrafos, el cálculo directo de E (n, m) en los grafos aleatorios es computacionalmente inviable para n> 4. Hemos desarrollado dos procedimientos estadísticos que estimar el valor esperado E (n, m) y la probabilidad P (n, m ) para evaluar la significación estadística de los grupos identificados. Aunque Q es una buena medida de la densidad de las interacciones en un manojo, a su significación estadística depende mucho del tamaño de clúster, n. Un grupo de tres proteínas con Q = 1 es probable que se encuentre en un grafo de azar, mientras que un conjunto de 10 proteínas con Q = 0.26 puede ser muy poco probable en el mismo grafo aleatorio. Introdujimos dos medidas de significación estadística que se basan en la probabilidad de encontrar un clúster en un grafo de azar comparable (15, 18, 26, 27). Para calcular la significación estadística, se generó por primera vez 1.000 grafos aleatorios en los que se conserva el número de interacciones de cada proteína. A continuación, para cada grupo de n proteínas y m interacciones, se calculó el valor P como la probabilidad de tener más de m conexiones entre las mismas proteínas en los grafos correspondientes al azar. Un valor de p calculado de esta manera da la probabilidad de que tengan m (o más) las interacciones entre un grupo particular de proteínas, dado el número de interacciones que cada una de estas proteínas tiene. Aunque esta probabilidad puede ser muy pequeño, el número de posibles grupos Ωn comparables de proteínas n es enorme. Para tener esto en cuenta que computa el valor E = E PΩn como el número esperado de n grupos de proteínas que tienen m (o más) las interacciones. El número de posibles grupos comparables se estima
donde N es el número total de nodos en los grafos y N (d> DC) es el número de nodos con mayor grado que la CC. Hemos establecido la CC sea el grado medio en el grupo de interés. De esta manera, el valor E tiene en cuenta tanto el número de proteínas en los grupos y el número de interacciones cada uno de ellos tiene.
Huelga decir que todos los valores de P y E son aproximados y su cálculo directo es prohibitivamente costoso computacionalmente. Por último, mediante la aplicación de los algoritmos de búsqueda de los grafos aleatorios, también estima que el valor Pevd como la probabilidad de encontrar cualquier conjunto de n nodos con m o más conexiones. Debido a que nuestros algoritmos buscan maximizar m, el valor Pevd obedece a la distribución de valor extremo Fisher-Tippett (EVD) Pevd (m) = exp (-exp (-α (m - u))). Parámetros alpha y se obtuvieron u de esta distribución por 1000 MC se ejecuta en cada uno de 1.000 grafos aleatorios, generados como se describe anteriormente. Hemos observado escalado lineal simple de α-1 = A1N + a2 y u = U1N + u2, que permite un fácil cálculo de Pevd para grupos de cualquier tamaño. Por lo tanto, mediante el establecimiento de Pevd <Pcutoff, se puede obtener Q de corte (n) para grupos de cualquier tamaño n, tal que un clúster con Q> Q (n) de corte se consideró estadísticamente significativa (ver Apoyo de texto y la Fig. 8 para detalles). Para nuestro análisis de los complejos y los módulos, se seleccionaron los grupos altamente significativas con E <0,1, P <1 × 10-4, y Pevd <1 × 10-4. Higo. 1B muestra la comparación de la cantidad de complejos que se encuentran de un tamaño dado y Q frente al número de complejos de este tamaño y Q esperado en un grafo aleatorio.
Fig. 1.
La significación estadística de los complejos y módulos. (A) Número de camarillas completos (Q = 1) en función del tamaño de la camarilla enumerado en la red de interacciones entre proteínas (rojo) y en los grafo reconectados al azar (azul, un promedio de> 1.000 grafos). El recuadro muestra la misma parcela en escala logarítmica normal. Tenga en cuenta el enriquecimiento espectacular en el número de camarillas en el grafo de la proteína-interacción. La mayoría de estas camarillas son partes de los complejos y los módulos más grandes. (B) Distribución de Q de clusters encontrados por el procedimiento de búsqueda de MC en los grafos reconectados al azar (barras azules). La línea azul muestra aproximación de esta distribución por el Fisher-Tippett distribución de valor extremo (EVD) con dos parámetros de ajuste. Las barras rojas muestran los complejos que se encuentran en la red original de las interacciones proteína. Los tamaños de los subgrafos son n = 8, 10, y 16. Nota que los complejos reales tienen muchas más interacciones que los complejos más estrechos que se encuentran en los grafos reconectados al azar.
Un método similar utilizado por Milo et al. (18) para identificar pequeños motivos de la red requiere la enumeración exacta de los motivos en los grafos aleatorios. Tal enumeración es computacionalmente imposible que los grupos y los módulos más grandes. Nuestro enfoque, en contraste, no implica tal enumeración y por lo tanto se puede ampliar a grupos de cualquier tamaño.
También usamos importancia muestreo MC para estimar E (n, m). Tomamos muestras de un conjunto de n proteínas en E azar y obtenido (m | n) de distribución. Para realizar un muestreo más eficiente, tomamos muestras de proteínas con la probabilidad proporcional a su grado, es decir, la probabilidad de escoger una proteína i: Pi = di / Σi = 1 ... N di. Se encontró | (n m) estimada mediante el uso de muestreo de importancia para ser lineal con log (m) y puede ser extrapolado a una mayor precisión m E. Este método se utilizó para estimar el número de camarillas en el grafo aleatorio (Fig. 1 A, azul).
La construcción de algoritmos rápidos para determinar las propiedades estructurales de los grafos es un reto clásico en la matemática discreta y la informática teórica. Tales problemas son fáciles de estado e ilustran, pero a menudo son demostrablemente difícil en el sentido de ser NP-duro (problemas NP-duros son aquellos para los que no hay algoritmos conocidos pueden encontrar una solución en tiempo polinomial en el tamaño del problema, aunque hay algoritmos que pueden verificar una solución propuesta en ese momento). El problema de encontrar la mayor camarilla, o incluso de aproximar su tamaño, es NP-duro (28). En este caso, el objetivo fue encontrar camarillas que no esté totalmente conectados, un problema aún más difícil. Aunque los algoritmos estocásticos que desarrollamos no se puede garantizar para encontrar todas las soluciones, que son eficientes cuando se aplica a los grafos relativamente escasos, tales como una red de interacciones entre proteínas.
Se han utilizado dos métodos para estudiar más a fondo la modularidad de la red y encontrar grupos multiproteicos altamente conectados: la técnica de optimización MC y el algoritmo SPC como el desarrollado por Domany y compañeros de trabajo (23, 24). Estos métodos son capaces de encontrar grupos que están muy conectados, pero no necesariamente conectadas totalmente (Q <1). El uso de estas técnicas, se identificaron> 50 grupos de proteínas de tamaños de 4 a 35. grafos aleatorios comparables, por el contrario, contenida muy pocas, si alguna, estas agrupaciones. Higo. 1B presenta distribuciones de densidad de Q de los grupos del mismo tamaño que se encuentran en los grafos aleatorios (barras azules) y en la red de proteínas (barras rojas). Esta distribución de los grafos aleatorios puede encajar bien por el Fisher-Tippett (29) de distribución de valor extremo (EVD) (también conocida como la distribución de Gumbel) (Fig. 1B, línea azul), lo que nos permite estimar la significación estadística de la proteína clusters (ver Métodos). Sorprendentemente, las agrupaciones en la red de proteínas tienen muchas más interacciones que sus contrapartes en los grafos aleatorios: la probabilidad de encontrar grupos comparables en los grafos aleatorios es inferior a 1 × 10-4 (Pevd <1 × 10-4). Estos resultados demuestran que, además de numerosos camarillas, la red de proteínas contiene muchos cúmulos densos significativamente de las proteínas que interactúan. Higo. 2 muestra tres grupos altamente conectados y el fragmento de red que les rodea, que ilustra la dificultad de encontrar tales grupos. Estos grupos proporcionan una fuerte evidencia adicional que respalde la arquitectura modular de redes biológicas.
Fig. 2.
Fragmento de la red de proteínas. Los nodos y las interacciones en grupos descubiertos se muestran en negrita. Los nodos se colorean por categorías funcionales en MIPS (20): rojo, regulación de la transcripción; azul, el ciclo celular / control de la celda de destino; verde, el procesamiento del ARN; y el amarillo, el transporte de proteínas. Complejos se muestran en la SAGA / complejo TFIID (rojo), el promotor de la anafase complejo (azul), y el complejo Trapp (amarillo).
¿Cuál es el papel biológico de estas agrupaciones altamente conectados? Para responder a esta pregunta, se analizó la anotación funcional de los genes disponibles de Saccharomyces cerevisiae (20, 30). Hemos encontrado que los genes pertenecientes a un mismo módulo o complejo tienen una función biológica consistente, proporcionado por el centro de Munich Información de Secuencias de Proteínas (MIPS) tablas funcionales de anotación (www.mips.biochem.mpg.de) (20). Higo. 2 presenta ejemplos de complejos descubiertos, con las proteínas de color de acuerdo a sus clasificaciones funcionales. Higo. 3 da ejemplos de dos módulos funcionales: la regulación del ciclo celular y la cascada de MAP quinasa. Gene anotación nos permitió asignar funciones a los complejos identificados. La mayoría de los complejos y los módulos identificados pertenecen a las siguientes cuatro clases funcionales: regulación de la transcripción, del ciclo celular / control de la celda de destino, de procesamiento del ARN, y proteínas de transporte.
Fig. 3.
Ejemplos de módulos funcionales descubiertos. (A) Un módulo implicado en la regulación del ciclo celular. Este módulo consta de ciclinas (CLB1-4 y Cln2) y quinasas dependientes de ciclina (Cks1 y Cdc28) y una proteína nuclear de importación (NIP29). Aunque tienen muchas interacciones, estas proteínas no están presentes en la célula al mismo tiempo. vía de transducción de (B) de la señal de la feromona en la red de interacciones proteína-proteína. Este módulo incluye (MAP quinasa quinasa quinasas) varios MAPK (mitogen-activated proteína quinasa) y MAPKK, así como otras proteínas implicadas en la transducción de señales. Estas proteínas no forman un solo complejo; más bien, en que interactúan en un orden específico.
El mayor complejo totalmente conectado tiene 14 proteínas, todos los cuales son componentes del factor de transcripción SAGA / TFIID. La extensión de 17 miembros de este complejo incluye algunos otros factores de transcripción. Otros complejos de transcripción que se encuentran en la red incluyen el complejo de cuatro miembros de HAP de proteínas de unión a CCAAT, el mediador de siete miembros de regulador de la transcripción (MED), y el complejo NO transcripción. El siguiente a la mayor complejo totalmente conectado consta de 11 proteínas: cuatro son las proteínas de control de la división celular Cdc16, Cdc23, Cdc26 y Cdc27, y los otros siete son subunidades del complejo. En conjunto, estas 11 proteínas constituyen el complejo promotor de la anafase, un componente esencial de la regulación del ciclo celular. Otro complejo implicado en la regulación del ciclo celular es un complejo ubiquitinación de seis miembros (Cdc34, Cdc53, CDC4, MET30, SKP1 y GRR1) conocido por servir de andamiaje Cdc53p y responsable de la transición a la fase S. Los complejos descubiertos incluyen varias máquinas de procesamiento de ARN: (i) un complejo de 12 miembros de varios factores de empalme LSM asociados con el, factor de TopoII asociada mRNA-decapping enzima DCP1, y dos pequeñas 40S subunidades ribosomales; (Ii) un complejo de 14 miembros de los factores de CFI / CFII / PFI y poli polimerasa (A); (Iii) un rRNA de procesamiento complejo (exosome); (Iv) un complejo de cuatro miembros de las subunidades de la endonucleasa de ARNt-empalme; y (v) un complejo de tres factores de empalme de pre-ARNm, unidos a una proteína desconocida que es homóloga a un autoantígeno asociado a un tumor de mama humano (véase el texto de apoyo).
Los módulos tienen más diverso, aunque sigue siendo muy consistente, anotación funcional de los genes. Es importante distinguir entre complejos de proteínas y módulos funcionales, porque tienen diferentes significados biológicos. Un complejo de proteínas es una máquina molecular que consta de varias proteínas (ácidos nucleicos y otras moléculas) que se unen entre sí en el mismo lugar y tiempo (por ejemplo, factores de transcripción, histonas, polimerasas, etc.). Por el contrario, un módulo funcional (31) se compone de un par de proteínas (y otras moléculas) que controlan o realizan una función celular particular a través de interacciones entre ellos. Estas proteínas no necesariamente interactúan en el mismo lugar y hora, o forman un complejo macromolecular (por ejemplo, vía de señalización, la regulación del ciclo celular, etc.). En muchos casos, es difícil hacer esta distinción. Debido a las interacciones de proteínas analizadas por parejas no tienen información temporal y espacial, nuestro método descubre con éxito ambos complejos y módulos, pero no distinguir entre los dos.
La Figura 3 presenta dos módulos identificados: un módulo de ocho miembros dependientes de ciclina quinasas, las ciclinas y sus inhibidores que regulan el ciclo celular (32) (Figura 2 A)., Y la cascada de transducción de señales de feromonas que los andamios en la proteína STE5 (33) ( la Fig. 2B). Otros módulos que se encuentran incluyen un módulo de seis miembros de las proteínas implicadas en la aparición del brote y el establecimiento de polaridad (34, 35) (CDC24, CDC42, FAR1, STE20, BEM1, y RSR1); un módulo de seis miembros de CDC, septins, y las proteínas quinasas Ser / Thr implicadas en el control mitótico; etc (una lista completa de los complejos y módulos con la anotación funcional se proporciona en el texto de apoyo).
La comparación de la predicho con los complejos de derivados experimentalmente (20-22) mostró muy buen acuerdo, tanto en términos de la cobertura y la especificidad de nuestras predicciones. Comparamos complejos con los complejos que se encuentran por (i) la purificación por afinidad en tándem (TAP) y espectrometría de masas (21), catalogada en Cellzome (http://yeast.cellzome.com) identificaron; (Ii) complejos que han encontrado los de alto rendimiento de proteínas de identificación por espectrometría de masas complejo (HMS-PCI) (22), catalogada en la base de datos Biomolecular Interaction red (www.bind.ca); y (iii) otros complejos recogidos de la literatura por los expertos humanos, catalogado en la base de datos MIPS (20). En primer lugar, nos encontramos complejos experimentales que son consistentes con la red estudiado de las interacciones proteína-proteína, es decir, que corresponden a densas regiones de la red. Sólo 29 de los complejos experimentales cumplieron con los criterios estrictos de Q> 0,2 y Pevd <1 × 10-4, y 69 complejos experimentales satisfecho los criterios más débiles de Q> 0,3 y Pevd <0,1. Este resultado no fue una sorpresa, ya que las interacciones de proteínas conocidas representan una pequeña fracción de las interacciones presentes en una célula (9, 10).
A continuación, se comparó la experimentación con los complejos computacionalmente derivados. Para cada complejo computacionalmente derivados, encontramos un complejo experimental mejor coincidencia de al minimizar la probabilidad de una superposición aleatoria entre los dos, usando la siguiente ecuación:
donde N es el número total de nodos en la red, n1 y n2 son los tamaños de dos complejos, y k es el número de nodos que tienen en común. La Fig. 4 presenta la superposición k / n1 entre los que se encuentran los complejos y derivados experimentalmente. De hecho, todos los 29 de los complejos experimentales estrictamente consistentes y la mayor parte de los 69 los débilmente coherentes se encontraron con éxito con 100% de solapamiento. Unos pocos que faltaban o sólo se recuperó parcialmente son más pequeños y más escasa (Fig. 4 recuadro). También se encontró que de los 50 grupos computacionalmente> descubiertos,> 80% corresponde al menos un complejo experimental. Sugerimos que el resto constituye complejos o módulos previamente no.
Fig. 4.
La comparación de los complejos y módulos descubiertos con complejos derivados experimentalmente (BIND) y Cellzome y complejos catalogados en MIPS. complejos descubiertos están ordenados por la superposición con el complejo experimental de mejor coincidencia (ver Métodos y texto de apoyo). El solapamiento se define como el número de proteínas comunes, dividido por el número de proteínas en el complejo experimental mejor de coincidencia. Los primeros 31 complejos coincidir exactamente, y otro 11 tienen solapamiento por encima del 65%. El recuadro muestra la superposición como una función del tamaño del complejo descubierto. Tenga en cuenta que los complejos descubiertos de todos los tamaños partido muy bien con los complejos experimentales conocidos. complejos descubiertos que no coinciden con los experimentales constituyen nuestras predicciones (véase la discusión para más detalles).
Nuestro estudio hace cuatro tipos de predicciones: complejos de proteínas previamente no, previamente miembros no caracterizados en complejos conocidos, miembros de las proteínas no en complejos conocidos y módulos funcionales. Predecimos 8 posibles complejos previamente no, 7 módulos funcionales, 4 proteínas no en diferentes complejos, y 13 complejos con la posible adhesión adicional. Por ejemplo, nos encontramos con una de seis miembros, complejo altamente significativa con Q = 0,73, p = 1 × 10-17, y Pevd = 1 × 10-5 que no aparece entre los complejos de proteínas conocidas. Sólo una proteína de los seis en que complejo se ha caracterizado, como una proteína de membrana YIP1 Golgi (36); los otros no tienen ninguna anotación, aunque comparten alguna homología con proteínas de membrana. El mejor ejemplo de los miembros previamente no conocidos en los complejos es un complejo de 13 proteínas, 11 de los cuales forman el complejo de empalme Lsm, junto con dos pequeñas 40S ribosomal subunidades que al parecer son los nuevos miembros. Estas y otras predicciones de los complejos de proteínas previamente no (véase el texto de apoyo) pueden ser verificados por coimmunoprecipitation o técnicas similares.
Una ventaja importante de análisis computacional es que permite la detección de dichos módulos mediante la integración de las interacciones moleculares por pares que se producen en diferentes momentos y lugares. El uso de técnicas computacionales solo, sin embargo, no podemos discriminar entre complejos y módulos o entre interacciones transitorias y simultáneas, sino que debe apuntar hacia estudios experimentales posibles módulos funcionales. Por ejemplo, la composición predicha de las dos proteínas ribosómicas en el complejo de corte y empalme Lsm puede ser transitoria, condicional, o simultánea con el resto del complejo Lsm. Estas ambigüedades deben resolverse experimentalmente.
Las estrategias de cálculo como el nuestro necesariamente se basan en datos experimentales con sus limitaciones y errores instrumentales. Un aspecto importante (y lamentable) de alto rendimiento de datos experimentales, es una alta tasa de falsos positivos. Para investigar el grado en que los falsos positivos pueden hacer fracasar el proceso de búsqueda y afectar a grupos identificados (18), que reconectados al azar, eliminado o añadido 10-50% de las interacciones en la red. Se realizaron búsquedas de las agrupaciones en las redes perturbadas y grupos identificados en comparación con los originales. Higo. 5 presenta la fracción de grupos originales que han sido recuperados en las redes perturbadas.
Fig. 5.
La fracción de grupos recupera en la red perturbada al azar, como una función de la fracción de enlaces alterados. curvas negras corresponden al caso en que los enlaces se reconectado al azar; rojo, extraídos al azar (verdaderos negativos); y verdes, añadidos al azar (falsos positivos). El clúster original se dice que a su devolución cuando la red perturbada tiene un clúster que comparte al menos el 50% de los nodos con el original. Cada perturbación se repitió 10 veces. Véase también la Fig. 9, que se publica como información de apoyo en el sitio web de PNAS.
Es importante destacar que el ruido en la forma de eliminación o adición de enlaces tiene menos efecto de deterioro del cableado al azar. Alrededor del 75% de los grupos todavía se pueden encontrar cuando el 10% de los enlaces están recableado. Más de 80% de los grupos sostener adición o eliminación de 20% de los enlaces. La robustez de las agrupaciones descubiertos a ruido en los datos surge de la utilización de múltiples interacciones para identificar un clúster. robustez similar se ha demostrado por motivos más pequeños (18).
Naturalmente, nuestra técnica no logra identificar complejos y módulos para los que el número de interacciones conocidas dentro de la agrupación es insuficiente. Encontramos varios complejos y módulos que tienen anotación funcional consistente, pero no son lo suficientemente densa como para ser estadísticamente significativos racimos densos. Omitimos estas agrupaciones de mayor análisis. Del mismo modo, muchos grupitos de tres proteínas (total = 1.444) tienen anotación funcional consistente, pero deben ser considerados con cautela, ya que se espera un gráfico al azar para tener ≈500 tales camarillas (que corresponde a la tasa de falsos positivos del 38%).
Otras técnicas para analizar la estructura de las redes biológicas y sociales se han desarrollado recientemente. Milo et al. (18) estudiaron los pequeños (de tres a cuatro miembros) los motivos que son frecuentes en una red dirigida. Shenn-Orr et al. (7) identificado tres tipos de estructuras frecuentes en la red de transcripción de Escherichia coli. En contraste con estos enfoques, que buscábamos (i) grupos más grandes (4-20) y (ii) grupos que tienen muchas más interacciones dentro que con el resto de la red. Además, no estábamos interesados en la frecuencia de estos grupos en la red, sino más bien con la densidad de las interacciones en los racimos. Este enfoque nos ha permitido destapar grandes complejos y únicos en la red de interacción de proteínas (como el complejo promotor de la anafase). Otra técnica, desarrollado por Girvan y Newman (37), los intentos para descomponer la red entera en componentes débilmente conectadas. Si bien es un enfoque muy prometedor, puede no ser capaz de encontrar regiones pequeñas, altamente conectados incrustadas en una red altamente estructurado, la situación evidente en la red de interacciones de proteínas. Los enfoques de Milo et al., Girvan y Newman, y este estudio son altamente complementarias entre sí porque se dirigen a diferentes preguntas y redes de estudio en diferentes resoluciones.
La red analizados (20) incluye interacciones obtenidos por dos tipos de estudios: experimentos proteómicos a gran escala (de dos híbridos) y los estudios tradicionales, basados en hipótesis de interacciones de proteínas (es decir, a pequeña escala de dos híbridos, coprecipitación, etc.) . proteínas por espectrometría de masas de alto rendimiento de identificación compleja (HMS-PCI) y la purificación por afinidad en tándem (TAP) complejos derivados no eran parte de la base de datos en el momento de la descarga. Curiosamente, la mayoría de los complejos y módulos descubiertos vienen de los estudios tradicionales, en lugar de a partir de experimentos a gran escala. Este hallazgo indica sesgo antropomórfico significativa en el conjunto de interacciones conocidas. También sugiere que aunque los estudios de proteómica a gran escala proporcionan una gran cantidad de datos de interacción de proteínas, la escasez de los datos (y su contaminación con falsos positivos) hace que este tipo de estudios menos valiosas para la identificación de los módulos funcionales. Nuestros resultados sugieren que la integración a gran escala de los datos de dos híbridos con otros tipos de interacciones puede ayudar a superar esta limitación. Nuestra estrategia computacional tiene gran promesa como una herramienta para la integración de diversos tipos de datos en la búsqueda de nuevos módulos funcionales, ya que puede manejar diferentes tipos ( "colores") de las interacciones, incluyendo genética (por ejemplo, syn-letalidad), en proteínas de ADN, y localización de datos. Integración de redes de interacciones físicas con gráficos de las relaciones evolutivas (38) nos puede ayudar a comprender el origen de la modularidad celular.
Hemos demostrado que una técnica computacional puede identificar complejos y módulos de todos los tamaños, incluyendo complejos de transitorios y complejos de baja estequiometría, la superación de las limitaciones de purificación experimental de complejos de proteínas (21, 22). A pesar de que nuestra técnica se basa en las interacciones obtenidos experimentalmente, la naturaleza multicuerpo de complejos descubiertos hace que nuestros algoritmos robustos a la alta tasa de falsos positivos en los datos experimentales. Nuestros resultados sugieren varias hipótesis biológicas comprobables y revelan una modularidad de escala intermedia esencial y la estructura de las redes moleculares multicuerpo.
Victor Spirin y Leonid A. Mirny *
PNAS
Editado por Lawrence A. Shepp, Rutgers, la Universidad Estatal de Nueva Jersey en New Brunswick, Piscataway, NJ, y aprobada en 5 de agosto de 2003 (recibido por opinión 22 abril de 2003)
Resumen
Las proteínas, ácidos nucleicos, y pequeñas moléculas forman una densa red de interacciones moleculares en una célula. Las moléculas son nodos de esta red, y las interacciones entre ellos se encuentran los enlaces. La arquitectura de las redes moleculares puede revelar importantes principios de organización y función celular, de manera similar a la forma en que la estructura de proteínas nos dice acerca de la función y la organización de una proteína. Análisis computacional de las redes moleculares ha ocupado principalmente de grado nodal [Wagner, A. y Fell, D. A. (2001) Proc. R. Soc. London Ser. B 268, 1803-1810; Jeong, H., Tombor, B., Albert, R., Oltvai, ZN y Barabási, AL (2000), Nature 407, 651-654] o correlación grado [Maslov, S. & Sneppen, K. (2002), Science 296 , 910-913], y por lo tanto se centró en las propiedades individuales / de dos cuerpos de estas redes. Aquí, mediante el análisis de la estructura multicuerpo de la red de interacciones proteína-proteína, descubrimos módulos moleculares que están conectados densamente dentro de sí mismos pero escasamente conectados con el resto de la red. La comparación con los datos experimentales y la anotación funcional de genes mostró dos tipos de módulos: (i) complejos de proteínas (maquinaria de empalme, factores de transcripción, etc.) y (ii) unidades funcionales dinámicos (cascadas de señalización, la regulación del ciclo celular, etc.). módulos descubiertos son estadísticamente muy significativa, como se desprende de la comparación con los grafos aleatorios, y son robustos al ruido en los datos. Nuestros resultados proporcionan un fuerte apoyo al principio de la modularidad de red introducida por Hartwell et al. [Hartwell, L. H., Hopfield, J. J., Leibler, S. y Murray, A. W. (1999) Nature 402, C47-C52], lo que sugiere que los módulos que se encuentran constituyen los "bloques de construcción" de las redes moleculares.
Los experimentos a gran escala y la integración de los datos publicados (1) han proporcionado mapas de varias redes biológicas tales como las redes metabólicas (2, 3), proteína-proteína (4, 5) y la proteína-DNA (6, 7), etc. Aunque incompleta y, tal vez, inexacta (8-11), estos mapas se convirtió en un punto focal de una búsqueda de los principios generales que rigen la organización de las redes moleculares (12-16). características estadísticas importantes de tales redes incluyen la distribución de ley de potencia (P (k) ~ k-γ) (por ejemplo,. refs 16 y 17) o una distribución similar del grado del nodo k (es decir, el número de enlaces de un nodo) ; la propiedad del mundo pequeño (11, 13, 16) (es decir, un alto coeficiente de agrupación y un pequeño camino más corto entre cada par de nodos); anticorrelación en el nodo de grado de nodos conectados (15) (es decir, altamente interactuar nodos tienden a ser conectado a los de bajo interactuar); y otras propiedades.
Estas propiedades hacen evidentes cuando cientos o miles de moléculas y sus interacciones se estudian juntos. motivos recientemente descubiertos (7, 18) que constan de tres a cuatro nodos constituyen el otro extremo del espectro. características a gran escala son generalmente atribuidos a los procesos evolutivos masivos que dan forma a la red (6, 14), mientras que muchos motivos pequeña escala representan la contribución y los bucles de alimentación directa en la regulación celular (18, 19). Sin embargo, los procesos biológicos más importantes, tales como la transducción de señales, regulación de la celda de destino, la transcripción y la traducción implican más de cuatro, pero mucho menos de cientos de proteínas. La mayoría de los procesos pertinentes de las redes biológicas corresponden a la mesoescala (5-25 genes / proteínas). propiedades meso-escala de las redes biológicas han sido en su mayoría difícil de alcanzar debido a las dificultades de cálculo en la enumeración de las subredes de tamaño medio (por ejemplo, una red de 1.000 nodos contiene 1 × 1023 posibles conjuntos de 10 nodos).
A continuación, presentamos una exploración a fondo de las redes moleculares en el nivel meso-escala. Nos centramos en las interacciones multicuerpo y realizaron búsquedas de conjuntos de proteínas que tienen muchas más interacciones entre ellos que con el resto de la red (clusters). Hemos desarrollado varios algoritmos para encontrar este tipo de agrupaciones en una red arbitraria. Se analizó una red de levadura de interacciones proteína-proteína (20) y encontramos> 50 grupos de proteínas conocidas y previamente no. Se analizaron anotación funcional de estos grupos y se encontró que la mayoría de grupos identificados corresponden a cualquiera de los dos tipos de módulos celulares: los complejos de proteínas o módulos funcionales (ver Discusión). complejos de proteínas son grupos de proteínas que interactúan entre sí al mismo tiempo y lugar, formando una sola máquina multimolecular. Los ejemplos de complejos de proteínas identificadas incluyen varios complejos grandes factor de transcripción, el complejo promotor de la anafase, el empalme de ARN y la maquinaria de poliadenilación, complejos de exportación de proteínas y de transporte, etc. módulos funcionales, en contraste, se componen de proteínas que participan en un proceso celular particular, mientras que la unión entre sí en un momento diferente y colocar (diferentes condiciones o fases del ciclo celular, en diferentes compartimentos celulares, etc). Ejemplos de módulos funcionales identificados incluyen el módulo de CDK / ciclina responsable de la progresión del ciclo celular, la ruta de respuesta de la levadura de feromonas, cascadas de señalización MAP, etc. Los complejos y módulos descubiertos tienen una alta significación estadística y anotación funcional consistente (si está disponible), y combinar muy bien al obtenido experimentalmente complejos de proteínas (21, 22). Es importante destacar que, al basarse en interacciones multicuerpo, nuestro método es robusto a las interacciones falsos positivos presentes en la red.
La red de interacciones de proteínas (20) se representa como un grafo no dirigido con proteínas como nodos y las interacciones proteína como enlaces no dirigidos. La idea clave de nuestro análisis fue identificar subgrafos altamente conectados (clusters) que tienen más interacciones dentro de sí mismos y menos con el resto del grafo. Un subgrafo totalmente conectado, o camarilla, que no es una parte de cualquier otra clique es un ejemplo de un grupo de este tipo. En general, no requieren agrupaciones para ser totalmente conectada; En su lugar, la densidad de las conexiones de la agrupación se midió por el parámetro Q = 2 m / (n (n - 1)), donde n es el número de proteínas en el clúster y m es el número de interacciones entre ellos. Hemos desarrollado algoritmos que pueden identificar grupos de suficientemente alta Q en un grafo arbitrario. Tenga en cuenta que, a pesar de alguna similitud, el problema de subgraphs densas no es idéntico al problema de los objetos de agrupación en un espacio métrico y no puede ser resuelto por técnicas de agrupamiento tradicionales.
Métodos
Identificación de los conjuntos muy conectados. Nuestro primer enfoque fue identificar todos los subgrafos totalmente conectados (camarillas o cliques) por enumeración completa. Debido a que el grafo es muy escasa, esto se podría hacer rápidamente. De hecho, para encontrar grupos de tamaño n se necesita para enumerar solamente los grupos de tamaño n - 1 (para más detalles, véase el texto de apoyo, que se publica como información de apoyo en el sitio web de PNAS, www.pnas.org). Empezamos con n = 3 y continuó hasta no se encontraron más camarillas en el grafo. La camarilla más grande encontrado contiene 14 nodos.El segundo método utiliza una técnica de agrupación que trabaja sobre puntos no incluidos en un espacio métrico. Un potente algoritmo de este tipo es la agrupación superparamagnético (SPC) (23). En pocas palabras, este enfoque asigna un "giro" a cada nodo en el grafo. Cada giro puede ser en varias (más de dos) estados. Giros pertenecientes a los nodos conectados interactuar y tener la energía más baja cuando se encuentran en el mismo estado. El sistema (conocido como el modelo de Potts) está sujeta a equilibrio a temperatura distinta de cero, haciendo giros fluctúan. El concepto detrás de este método es que los giros que pertenecen a un grupo altamente conectado fluctúan de una manera correlacionada. Mediante la detección de giros correlacionados, el algoritmo puede identificar nodos que pertenecen a un área altamente conectado del grafo. Domany y compañeros de trabajo presentó un sistema de este tipo para los puntos de la agrupación en un espacio arbitrario (23) y con éxito se aplican a una variedad de problemas de agrupamiento (24, 25). Aquí, hemos aplicado SPC para identificar grupos en un grafo.
En el tercer método, formulamos el problema de encontrar conjuntos altamente conectadas de nodos como un problema de optimización: encontrar un conjunto de n nodos que maximiza la función Q (m, n) = 2 m / (n (n - 1)), donde m es el número de interacciones entre n nodos. El parámetro (0 ≤ Q ≤ 1) caracteriza la densidad de un clúster. Para un conjunto de nodos totalmente conectado, Q = 1, y para un conjunto no conectadas entre sí, Q = 0. El Monte Carlo procedimiento de optimización (MC) comienza con un conjunto conexo de n nodos seleccionados al azar en el grafo y los ingresos por "movimiento" nodos seleccionados a lo largo de los enlaces del grafo para maximizar se mueve Q. se aceptan de acuerdo a los criterios de Metropolis. También hemos desarrollado un algoritmo que minimiza la suma de las distancias más cortas entre los nodos seleccionados. Ambos algoritmos son muy eficientes y convergen rápido para identificar un grupo muy conectado. Ambos algoritmos requieren que el tamaño del conglomerado buscado como un parámetro de entrada. Aunque la tasa de convergencia de MC depende de la temperatura efectiva, el algoritmo converge rápidamente a una amplia gama de temperaturas (Fig. 6, que se publica como información de apoyo en el sitio web de PNAS). Comparación de algoritmos MC y SPC han mostrado un mejor comportamiento de MC para los clústeres que comparten nodos comunes y para los grafos de alta densidad, mientras SPC tiene una ventaja identificar los grupos que tienen muy pocas conexiones con el resto del grafo (Fig. 7, la cual es publicada como información de apoyo en el sitio web de PNAS).
Los grupos encontrados se sometieron después a una limpieza más profunda, la fusión y la selección de acuerdo con los criterios de significación estadística (véase el texto de apoyo para más detalles).
Significancia estadística. Para estimar la significación estadística de un clúster que tiene n las proteínas y las interacciones m entre ellos, uno tendría que calcular el número esperado de estas agrupaciones E (n, m) en un grafo al azar comparable (es decir, grafo al azar que satisfaga ciertas restricciones, es decir, , fijar nodo de grado). Debido a la explosión combinatoria de posibles subgrafos, el cálculo directo de E (n, m) en los grafos aleatorios es computacionalmente inviable para n> 4. Hemos desarrollado dos procedimientos estadísticos que estimar el valor esperado E (n, m) y la probabilidad P (n, m ) para evaluar la significación estadística de los grupos identificados. Aunque Q es una buena medida de la densidad de las interacciones en un manojo, a su significación estadística depende mucho del tamaño de clúster, n. Un grupo de tres proteínas con Q = 1 es probable que se encuentre en un grafo de azar, mientras que un conjunto de 10 proteínas con Q = 0.26 puede ser muy poco probable en el mismo grafo aleatorio. Introdujimos dos medidas de significación estadística que se basan en la probabilidad de encontrar un clúster en un grafo de azar comparable (15, 18, 26, 27). Para calcular la significación estadística, se generó por primera vez 1.000 grafos aleatorios en los que se conserva el número de interacciones de cada proteína. A continuación, para cada grupo de n proteínas y m interacciones, se calculó el valor P como la probabilidad de tener más de m conexiones entre las mismas proteínas en los grafos correspondientes al azar. Un valor de p calculado de esta manera da la probabilidad de que tengan m (o más) las interacciones entre un grupo particular de proteínas, dado el número de interacciones que cada una de estas proteínas tiene. Aunque esta probabilidad puede ser muy pequeño, el número de posibles grupos Ωn comparables de proteínas n es enorme. Para tener esto en cuenta que computa el valor E = E PΩn como el número esperado de n grupos de proteínas que tienen m (o más) las interacciones. El número de posibles grupos comparables se estima
donde N es el número total de nodos en los grafos y N (d> DC) es el número de nodos con mayor grado que la CC. Hemos establecido la CC sea el grado medio en el grupo de interés. De esta manera, el valor E tiene en cuenta tanto el número de proteínas en los grupos y el número de interacciones cada uno de ellos tiene.
Huelga decir que todos los valores de P y E son aproximados y su cálculo directo es prohibitivamente costoso computacionalmente. Por último, mediante la aplicación de los algoritmos de búsqueda de los grafos aleatorios, también estima que el valor Pevd como la probabilidad de encontrar cualquier conjunto de n nodos con m o más conexiones. Debido a que nuestros algoritmos buscan maximizar m, el valor Pevd obedece a la distribución de valor extremo Fisher-Tippett (EVD) Pevd (m) = exp (-exp (-α (m - u))). Parámetros alpha y se obtuvieron u de esta distribución por 1000 MC se ejecuta en cada uno de 1.000 grafos aleatorios, generados como se describe anteriormente. Hemos observado escalado lineal simple de α-1 = A1N + a2 y u = U1N + u2, que permite un fácil cálculo de Pevd para grupos de cualquier tamaño. Por lo tanto, mediante el establecimiento de Pevd <Pcutoff, se puede obtener Q de corte (n) para grupos de cualquier tamaño n, tal que un clúster con Q> Q (n) de corte se consideró estadísticamente significativa (ver Apoyo de texto y la Fig. 8 para detalles). Para nuestro análisis de los complejos y los módulos, se seleccionaron los grupos altamente significativas con E <0,1, P <1 × 10-4, y Pevd <1 × 10-4. Higo. 1B muestra la comparación de la cantidad de complejos que se encuentran de un tamaño dado y Q frente al número de complejos de este tamaño y Q esperado en un grafo aleatorio.
Fig. 1.
La significación estadística de los complejos y módulos. (A) Número de camarillas completos (Q = 1) en función del tamaño de la camarilla enumerado en la red de interacciones entre proteínas (rojo) y en los grafo reconectados al azar (azul, un promedio de> 1.000 grafos). El recuadro muestra la misma parcela en escala logarítmica normal. Tenga en cuenta el enriquecimiento espectacular en el número de camarillas en el grafo de la proteína-interacción. La mayoría de estas camarillas son partes de los complejos y los módulos más grandes. (B) Distribución de Q de clusters encontrados por el procedimiento de búsqueda de MC en los grafos reconectados al azar (barras azules). La línea azul muestra aproximación de esta distribución por el Fisher-Tippett distribución de valor extremo (EVD) con dos parámetros de ajuste. Las barras rojas muestran los complejos que se encuentran en la red original de las interacciones proteína. Los tamaños de los subgrafos son n = 8, 10, y 16. Nota que los complejos reales tienen muchas más interacciones que los complejos más estrechos que se encuentran en los grafos reconectados al azar.
Un método similar utilizado por Milo et al. (18) para identificar pequeños motivos de la red requiere la enumeración exacta de los motivos en los grafos aleatorios. Tal enumeración es computacionalmente imposible que los grupos y los módulos más grandes. Nuestro enfoque, en contraste, no implica tal enumeración y por lo tanto se puede ampliar a grupos de cualquier tamaño.
También usamos importancia muestreo MC para estimar E (n, m). Tomamos muestras de un conjunto de n proteínas en E azar y obtenido (m | n) de distribución. Para realizar un muestreo más eficiente, tomamos muestras de proteínas con la probabilidad proporcional a su grado, es decir, la probabilidad de escoger una proteína i: Pi = di / Σi = 1 ... N di. Se encontró | (n m) estimada mediante el uso de muestreo de importancia para ser lineal con log (m) y puede ser extrapolado a una mayor precisión m E. Este método se utilizó para estimar el número de camarillas en el grafo aleatorio (Fig. 1 A, azul).
Resultados
Para el estudio de la estructura a gran escala de la red de interacción de proteínas, lo primero que enumeramos todos los grupos de tamaño 3 y más grande. La escasez relativa del grafo (N = 3.992 nodos y M = 6.500 enlaces) permitió la enumeración exacta de las camarillas. Para la comparación, se construyeron 1.000 grafos aleatorios del mismo tamaño y grado de distribución (véase más adelante) y los utilizó para calcular el número esperado de camarillas. El grafo de las interacciones proteína es conocida por ser un grafo muy especial con una distribución de ley potencial de grados de los nodos. Para descartar la posibilidad de que una estructura de este tipo cliquish es un resultado de la arquitectura de ley de potencia, construimos nuestros grafos aleatorios usando el procedimiento de Maslov-Sneppen (15), que conserva el número de enlaces de cada nodo. En otras palabras, los grupos de proteínas obtenidos se controlan para el número de interacciones que cada proteína tiene. Higo. 1 A presenta estos resultados, demostrando un enriquecimiento abrumadora en camarillas de todos los tamaños en el grafo de la proteína en comparación con los grafos aleatorios. La comparación de los números observados y esperados de camarillas también muestra que la gran mayoría de camarillas (97% para n = 4, 99,8% para n = 5, etc.) de tamaño 4 y mayor son, de hecho, estadísticamente significativa. La alta densidad de las interacciones en las camarillas y su significación estadística muestran que estas camarillas no surgieron por casualidad, que señala en alguna función biológica que llevan. El enriquecimiento en el número de camarillas revela una modularidad esencial en la estructura de la red, lo que sugiere que muchas de estas interacciones de proteínas son responsables de la formación de complejos de proteínas y módulos funcionales. Para explorar más a fondo esta estructura modular de la red, se realizaron búsquedas en el grafo para los clústeres multiproteicos que no son camarillas (es decir, Q <1).La construcción de algoritmos rápidos para determinar las propiedades estructurales de los grafos es un reto clásico en la matemática discreta y la informática teórica. Tales problemas son fáciles de estado e ilustran, pero a menudo son demostrablemente difícil en el sentido de ser NP-duro (problemas NP-duros son aquellos para los que no hay algoritmos conocidos pueden encontrar una solución en tiempo polinomial en el tamaño del problema, aunque hay algoritmos que pueden verificar una solución propuesta en ese momento). El problema de encontrar la mayor camarilla, o incluso de aproximar su tamaño, es NP-duro (28). En este caso, el objetivo fue encontrar camarillas que no esté totalmente conectados, un problema aún más difícil. Aunque los algoritmos estocásticos que desarrollamos no se puede garantizar para encontrar todas las soluciones, que son eficientes cuando se aplica a los grafos relativamente escasos, tales como una red de interacciones entre proteínas.
Se han utilizado dos métodos para estudiar más a fondo la modularidad de la red y encontrar grupos multiproteicos altamente conectados: la técnica de optimización MC y el algoritmo SPC como el desarrollado por Domany y compañeros de trabajo (23, 24). Estos métodos son capaces de encontrar grupos que están muy conectados, pero no necesariamente conectadas totalmente (Q <1). El uso de estas técnicas, se identificaron> 50 grupos de proteínas de tamaños de 4 a 35. grafos aleatorios comparables, por el contrario, contenida muy pocas, si alguna, estas agrupaciones. Higo. 1B presenta distribuciones de densidad de Q de los grupos del mismo tamaño que se encuentran en los grafos aleatorios (barras azules) y en la red de proteínas (barras rojas). Esta distribución de los grafos aleatorios puede encajar bien por el Fisher-Tippett (29) de distribución de valor extremo (EVD) (también conocida como la distribución de Gumbel) (Fig. 1B, línea azul), lo que nos permite estimar la significación estadística de la proteína clusters (ver Métodos). Sorprendentemente, las agrupaciones en la red de proteínas tienen muchas más interacciones que sus contrapartes en los grafos aleatorios: la probabilidad de encontrar grupos comparables en los grafos aleatorios es inferior a 1 × 10-4 (Pevd <1 × 10-4). Estos resultados demuestran que, además de numerosos camarillas, la red de proteínas contiene muchos cúmulos densos significativamente de las proteínas que interactúan. Higo. 2 muestra tres grupos altamente conectados y el fragmento de red que les rodea, que ilustra la dificultad de encontrar tales grupos. Estos grupos proporcionan una fuerte evidencia adicional que respalde la arquitectura modular de redes biológicas.
Fig. 2.
Fragmento de la red de proteínas. Los nodos y las interacciones en grupos descubiertos se muestran en negrita. Los nodos se colorean por categorías funcionales en MIPS (20): rojo, regulación de la transcripción; azul, el ciclo celular / control de la celda de destino; verde, el procesamiento del ARN; y el amarillo, el transporte de proteínas. Complejos se muestran en la SAGA / complejo TFIID (rojo), el promotor de la anafase complejo (azul), y el complejo Trapp (amarillo).
¿Cuál es el papel biológico de estas agrupaciones altamente conectados? Para responder a esta pregunta, se analizó la anotación funcional de los genes disponibles de Saccharomyces cerevisiae (20, 30). Hemos encontrado que los genes pertenecientes a un mismo módulo o complejo tienen una función biológica consistente, proporcionado por el centro de Munich Información de Secuencias de Proteínas (MIPS) tablas funcionales de anotación (www.mips.biochem.mpg.de) (20). Higo. 2 presenta ejemplos de complejos descubiertos, con las proteínas de color de acuerdo a sus clasificaciones funcionales. Higo. 3 da ejemplos de dos módulos funcionales: la regulación del ciclo celular y la cascada de MAP quinasa. Gene anotación nos permitió asignar funciones a los complejos identificados. La mayoría de los complejos y los módulos identificados pertenecen a las siguientes cuatro clases funcionales: regulación de la transcripción, del ciclo celular / control de la celda de destino, de procesamiento del ARN, y proteínas de transporte.
Fig. 3.
Ejemplos de módulos funcionales descubiertos. (A) Un módulo implicado en la regulación del ciclo celular. Este módulo consta de ciclinas (CLB1-4 y Cln2) y quinasas dependientes de ciclina (Cks1 y Cdc28) y una proteína nuclear de importación (NIP29). Aunque tienen muchas interacciones, estas proteínas no están presentes en la célula al mismo tiempo. vía de transducción de (B) de la señal de la feromona en la red de interacciones proteína-proteína. Este módulo incluye (MAP quinasa quinasa quinasas) varios MAPK (mitogen-activated proteína quinasa) y MAPKK, así como otras proteínas implicadas en la transducción de señales. Estas proteínas no forman un solo complejo; más bien, en que interactúan en un orden específico.
El mayor complejo totalmente conectado tiene 14 proteínas, todos los cuales son componentes del factor de transcripción SAGA / TFIID. La extensión de 17 miembros de este complejo incluye algunos otros factores de transcripción. Otros complejos de transcripción que se encuentran en la red incluyen el complejo de cuatro miembros de HAP de proteínas de unión a CCAAT, el mediador de siete miembros de regulador de la transcripción (MED), y el complejo NO transcripción. El siguiente a la mayor complejo totalmente conectado consta de 11 proteínas: cuatro son las proteínas de control de la división celular Cdc16, Cdc23, Cdc26 y Cdc27, y los otros siete son subunidades del complejo. En conjunto, estas 11 proteínas constituyen el complejo promotor de la anafase, un componente esencial de la regulación del ciclo celular. Otro complejo implicado en la regulación del ciclo celular es un complejo ubiquitinación de seis miembros (Cdc34, Cdc53, CDC4, MET30, SKP1 y GRR1) conocido por servir de andamiaje Cdc53p y responsable de la transición a la fase S. Los complejos descubiertos incluyen varias máquinas de procesamiento de ARN: (i) un complejo de 12 miembros de varios factores de empalme LSM asociados con el, factor de TopoII asociada mRNA-decapping enzima DCP1, y dos pequeñas 40S subunidades ribosomales; (Ii) un complejo de 14 miembros de los factores de CFI / CFII / PFI y poli polimerasa (A); (Iii) un rRNA de procesamiento complejo (exosome); (Iv) un complejo de cuatro miembros de las subunidades de la endonucleasa de ARNt-empalme; y (v) un complejo de tres factores de empalme de pre-ARNm, unidos a una proteína desconocida que es homóloga a un autoantígeno asociado a un tumor de mama humano (véase el texto de apoyo).
Los módulos tienen más diverso, aunque sigue siendo muy consistente, anotación funcional de los genes. Es importante distinguir entre complejos de proteínas y módulos funcionales, porque tienen diferentes significados biológicos. Un complejo de proteínas es una máquina molecular que consta de varias proteínas (ácidos nucleicos y otras moléculas) que se unen entre sí en el mismo lugar y tiempo (por ejemplo, factores de transcripción, histonas, polimerasas, etc.). Por el contrario, un módulo funcional (31) se compone de un par de proteínas (y otras moléculas) que controlan o realizan una función celular particular a través de interacciones entre ellos. Estas proteínas no necesariamente interactúan en el mismo lugar y hora, o forman un complejo macromolecular (por ejemplo, vía de señalización, la regulación del ciclo celular, etc.). En muchos casos, es difícil hacer esta distinción. Debido a las interacciones de proteínas analizadas por parejas no tienen información temporal y espacial, nuestro método descubre con éxito ambos complejos y módulos, pero no distinguir entre los dos.
La Figura 3 presenta dos módulos identificados: un módulo de ocho miembros dependientes de ciclina quinasas, las ciclinas y sus inhibidores que regulan el ciclo celular (32) (Figura 2 A)., Y la cascada de transducción de señales de feromonas que los andamios en la proteína STE5 (33) ( la Fig. 2B). Otros módulos que se encuentran incluyen un módulo de seis miembros de las proteínas implicadas en la aparición del brote y el establecimiento de polaridad (34, 35) (CDC24, CDC42, FAR1, STE20, BEM1, y RSR1); un módulo de seis miembros de CDC, septins, y las proteínas quinasas Ser / Thr implicadas en el control mitótico; etc (una lista completa de los complejos y módulos con la anotación funcional se proporciona en el texto de apoyo).
La comparación de la predicho con los complejos de derivados experimentalmente (20-22) mostró muy buen acuerdo, tanto en términos de la cobertura y la especificidad de nuestras predicciones. Comparamos complejos con los complejos que se encuentran por (i) la purificación por afinidad en tándem (TAP) y espectrometría de masas (21), catalogada en Cellzome (http://yeast.cellzome.com) identificaron; (Ii) complejos que han encontrado los de alto rendimiento de proteínas de identificación por espectrometría de masas complejo (HMS-PCI) (22), catalogada en la base de datos Biomolecular Interaction red (www.bind.ca); y (iii) otros complejos recogidos de la literatura por los expertos humanos, catalogado en la base de datos MIPS (20). En primer lugar, nos encontramos complejos experimentales que son consistentes con la red estudiado de las interacciones proteína-proteína, es decir, que corresponden a densas regiones de la red. Sólo 29 de los complejos experimentales cumplieron con los criterios estrictos de Q> 0,2 y Pevd <1 × 10-4, y 69 complejos experimentales satisfecho los criterios más débiles de Q> 0,3 y Pevd <0,1. Este resultado no fue una sorpresa, ya que las interacciones de proteínas conocidas representan una pequeña fracción de las interacciones presentes en una célula (9, 10).
A continuación, se comparó la experimentación con los complejos computacionalmente derivados. Para cada complejo computacionalmente derivados, encontramos un complejo experimental mejor coincidencia de al minimizar la probabilidad de una superposición aleatoria entre los dos, usando la siguiente ecuación:
donde N es el número total de nodos en la red, n1 y n2 son los tamaños de dos complejos, y k es el número de nodos que tienen en común. La Fig. 4 presenta la superposición k / n1 entre los que se encuentran los complejos y derivados experimentalmente. De hecho, todos los 29 de los complejos experimentales estrictamente consistentes y la mayor parte de los 69 los débilmente coherentes se encontraron con éxito con 100% de solapamiento. Unos pocos que faltaban o sólo se recuperó parcialmente son más pequeños y más escasa (Fig. 4 recuadro). También se encontró que de los 50 grupos computacionalmente> descubiertos,> 80% corresponde al menos un complejo experimental. Sugerimos que el resto constituye complejos o módulos previamente no.
Fig. 4.
La comparación de los complejos y módulos descubiertos con complejos derivados experimentalmente (BIND) y Cellzome y complejos catalogados en MIPS. complejos descubiertos están ordenados por la superposición con el complejo experimental de mejor coincidencia (ver Métodos y texto de apoyo). El solapamiento se define como el número de proteínas comunes, dividido por el número de proteínas en el complejo experimental mejor de coincidencia. Los primeros 31 complejos coincidir exactamente, y otro 11 tienen solapamiento por encima del 65%. El recuadro muestra la superposición como una función del tamaño del complejo descubierto. Tenga en cuenta que los complejos descubiertos de todos los tamaños partido muy bien con los complejos experimentales conocidos. complejos descubiertos que no coinciden con los experimentales constituyen nuestras predicciones (véase la discusión para más detalles).
Nuestro estudio hace cuatro tipos de predicciones: complejos de proteínas previamente no, previamente miembros no caracterizados en complejos conocidos, miembros de las proteínas no en complejos conocidos y módulos funcionales. Predecimos 8 posibles complejos previamente no, 7 módulos funcionales, 4 proteínas no en diferentes complejos, y 13 complejos con la posible adhesión adicional. Por ejemplo, nos encontramos con una de seis miembros, complejo altamente significativa con Q = 0,73, p = 1 × 10-17, y Pevd = 1 × 10-5 que no aparece entre los complejos de proteínas conocidas. Sólo una proteína de los seis en que complejo se ha caracterizado, como una proteína de membrana YIP1 Golgi (36); los otros no tienen ninguna anotación, aunque comparten alguna homología con proteínas de membrana. El mejor ejemplo de los miembros previamente no conocidos en los complejos es un complejo de 13 proteínas, 11 de los cuales forman el complejo de empalme Lsm, junto con dos pequeñas 40S ribosomal subunidades que al parecer son los nuevos miembros. Estas y otras predicciones de los complejos de proteínas previamente no (véase el texto de apoyo) pueden ser verificados por coimmunoprecipitation o técnicas similares.
Discusión
Hemos demostrado la presencia de grupos altamente conectados de proteínas en una red de interacciones de proteínas. Estos resultados apoyan fuertemente la arquitectura modular sugerido de redes biológicas (31). Mediante el análisis de la función biológica de estos grupos, hemos distinguido dos tipos de agrupaciones: los complejos de proteínas y módulos funcionales dinámicos. Ambos complejos y módulos tienen más interacciones entre sus miembros que con el resto de la red. En un complejo, sin embargo, estas interacciones se realizan al mismo tiempo, con lo que las proteínas que participan juntos (tal vez en un orden diferente, y no simultáneamente). En un módulo más genérico, dinámica, interacciones no se realizan al mismo tiempo o el lugar (por ejemplo, las interacciones entre las CDK y ciclinas en el módulo de regulación del ciclo celular). Los módulos dinámicos son difícil de alcanzar para la purificación experimental porque no se ensamblan como un complejo en un solo punto en el tiempo.Una ventaja importante de análisis computacional es que permite la detección de dichos módulos mediante la integración de las interacciones moleculares por pares que se producen en diferentes momentos y lugares. El uso de técnicas computacionales solo, sin embargo, no podemos discriminar entre complejos y módulos o entre interacciones transitorias y simultáneas, sino que debe apuntar hacia estudios experimentales posibles módulos funcionales. Por ejemplo, la composición predicha de las dos proteínas ribosómicas en el complejo de corte y empalme Lsm puede ser transitoria, condicional, o simultánea con el resto del complejo Lsm. Estas ambigüedades deben resolverse experimentalmente.
Las estrategias de cálculo como el nuestro necesariamente se basan en datos experimentales con sus limitaciones y errores instrumentales. Un aspecto importante (y lamentable) de alto rendimiento de datos experimentales, es una alta tasa de falsos positivos. Para investigar el grado en que los falsos positivos pueden hacer fracasar el proceso de búsqueda y afectar a grupos identificados (18), que reconectados al azar, eliminado o añadido 10-50% de las interacciones en la red. Se realizaron búsquedas de las agrupaciones en las redes perturbadas y grupos identificados en comparación con los originales. Higo. 5 presenta la fracción de grupos originales que han sido recuperados en las redes perturbadas.
Fig. 5.
La fracción de grupos recupera en la red perturbada al azar, como una función de la fracción de enlaces alterados. curvas negras corresponden al caso en que los enlaces se reconectado al azar; rojo, extraídos al azar (verdaderos negativos); y verdes, añadidos al azar (falsos positivos). El clúster original se dice que a su devolución cuando la red perturbada tiene un clúster que comparte al menos el 50% de los nodos con el original. Cada perturbación se repitió 10 veces. Véase también la Fig. 9, que se publica como información de apoyo en el sitio web de PNAS.
Es importante destacar que el ruido en la forma de eliminación o adición de enlaces tiene menos efecto de deterioro del cableado al azar. Alrededor del 75% de los grupos todavía se pueden encontrar cuando el 10% de los enlaces están recableado. Más de 80% de los grupos sostener adición o eliminación de 20% de los enlaces. La robustez de las agrupaciones descubiertos a ruido en los datos surge de la utilización de múltiples interacciones para identificar un clúster. robustez similar se ha demostrado por motivos más pequeños (18).
Naturalmente, nuestra técnica no logra identificar complejos y módulos para los que el número de interacciones conocidas dentro de la agrupación es insuficiente. Encontramos varios complejos y módulos que tienen anotación funcional consistente, pero no son lo suficientemente densa como para ser estadísticamente significativos racimos densos. Omitimos estas agrupaciones de mayor análisis. Del mismo modo, muchos grupitos de tres proteínas (total = 1.444) tienen anotación funcional consistente, pero deben ser considerados con cautela, ya que se espera un gráfico al azar para tener ≈500 tales camarillas (que corresponde a la tasa de falsos positivos del 38%).
Otras técnicas para analizar la estructura de las redes biológicas y sociales se han desarrollado recientemente. Milo et al. (18) estudiaron los pequeños (de tres a cuatro miembros) los motivos que son frecuentes en una red dirigida. Shenn-Orr et al. (7) identificado tres tipos de estructuras frecuentes en la red de transcripción de Escherichia coli. En contraste con estos enfoques, que buscábamos (i) grupos más grandes (4-20) y (ii) grupos que tienen muchas más interacciones dentro que con el resto de la red. Además, no estábamos interesados en la frecuencia de estos grupos en la red, sino más bien con la densidad de las interacciones en los racimos. Este enfoque nos ha permitido destapar grandes complejos y únicos en la red de interacción de proteínas (como el complejo promotor de la anafase). Otra técnica, desarrollado por Girvan y Newman (37), los intentos para descomponer la red entera en componentes débilmente conectadas. Si bien es un enfoque muy prometedor, puede no ser capaz de encontrar regiones pequeñas, altamente conectados incrustadas en una red altamente estructurado, la situación evidente en la red de interacciones de proteínas. Los enfoques de Milo et al., Girvan y Newman, y este estudio son altamente complementarias entre sí porque se dirigen a diferentes preguntas y redes de estudio en diferentes resoluciones.
La red analizados (20) incluye interacciones obtenidos por dos tipos de estudios: experimentos proteómicos a gran escala (de dos híbridos) y los estudios tradicionales, basados en hipótesis de interacciones de proteínas (es decir, a pequeña escala de dos híbridos, coprecipitación, etc.) . proteínas por espectrometría de masas de alto rendimiento de identificación compleja (HMS-PCI) y la purificación por afinidad en tándem (TAP) complejos derivados no eran parte de la base de datos en el momento de la descarga. Curiosamente, la mayoría de los complejos y módulos descubiertos vienen de los estudios tradicionales, en lugar de a partir de experimentos a gran escala. Este hallazgo indica sesgo antropomórfico significativa en el conjunto de interacciones conocidas. También sugiere que aunque los estudios de proteómica a gran escala proporcionan una gran cantidad de datos de interacción de proteínas, la escasez de los datos (y su contaminación con falsos positivos) hace que este tipo de estudios menos valiosas para la identificación de los módulos funcionales. Nuestros resultados sugieren que la integración a gran escala de los datos de dos híbridos con otros tipos de interacciones puede ayudar a superar esta limitación. Nuestra estrategia computacional tiene gran promesa como una herramienta para la integración de diversos tipos de datos en la búsqueda de nuevos módulos funcionales, ya que puede manejar diferentes tipos ( "colores") de las interacciones, incluyendo genética (por ejemplo, syn-letalidad), en proteínas de ADN, y localización de datos. Integración de redes de interacciones físicas con gráficos de las relaciones evolutivas (38) nos puede ayudar a comprender el origen de la modularidad celular.
Hemos demostrado que una técnica computacional puede identificar complejos y módulos de todos los tamaños, incluyendo complejos de transitorios y complejos de baja estequiometría, la superación de las limitaciones de purificación experimental de complejos de proteínas (21, 22). A pesar de que nuestra técnica se basa en las interacciones obtenidos experimentalmente, la naturaleza multicuerpo de complejos descubiertos hace que nuestros algoritmos robustos a la alta tasa de falsos positivos en los datos experimentales. Nuestros resultados sugieren varias hipótesis biológicas comprobables y revelan una modularidad de escala intermedia esencial y la estructura de las redes moleculares multicuerpo.
Referencias
- Ideker, T., Thorsson, V., Ranish, J. A., Christmas, R., Buhler, J., Eng, J. K., Bumgarner, R., Goodlett, D. R., Aebersold, R. & Hood, L. (2001) Science 292, 929 Abstract/FREE Full Text
- Kanehisa, M., Goto, S., Kawashima, S. & Nakaya, A. (2002) Nucleic Acids Res. 30, 42 Abstract/FREE Full Text
- Karp, P. D., Riley, M., Paley, S. M. & Pellegrini-Toole, A. (2002) Nucleic Acids Res. 30, 59 Abstract/FREE Full Text
- Uetz, P., Giot, L., Cagney, G., Mansfield, T. A., Judson, R. S., Knight, J. R., Lockshon, D., Narayan, V., Srinivasan, M., Pochart, P., et al. (2000) Nature 403, 623 CrossRefMedlineWeb of Science
- Ito, T., Chiba, T., Ozawa, R., Yoshida, M., Hattori, M. & Sakaki, Y. (2001) Proc. Natl. Acad. Sci. USA98, 4569 Abstract/FREE Full Text
- Lee, T. I., Rinaldi, N. J., Robert, F., Odom, D. T., Bar-Joseph, Z., Gerber, G. K., Hannett, N. M., Harbison, C. T., Thompson, C. M., Simon, I., et al. (2002) Science 298, 799 Abstract/FREE Full Text
- Shen-Orr, S. S., Milo, R., Mangan, S. & Alon, U. (2002) Nat. Genet. 31, 64 CrossRefMedlineWeb of Science
- Deng, M., Sun, F. & Chen, T. (2003) Pac. Symp. Biocomput., 140 Medline
- Gerstein, M., Lan, N. & Jansen, R. (2002) Science 295, 284 Abstract/FREE Full Text
- von Mering, C., Krause, R., Snel, B., Cornell, M., Oliver, S. G., Fields, S. & Bork, P. (2002) Nature 417, 399 MedlineWeb of Science
- Goldberg, D. S. & Roth, F. P. (2003) Proc. Natl. Acad. Sci. USA 100, 4372 Abstract/FREE Full Text
- Podani, J., Oltvai, Z. N., Jeong, H., Tombor, B., Barabasi, A. L. & Szathmary, E. (2001) Nat. Genet.29, 54 CrossRefMedlineWeb of Science
- Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N. & Barabasi, A. L. (2002) Science 297, 1551 Abstract/FREE Full Text
- Jeong, H., Tombor, B., Albert, R., Oltvai, Z. N. & Barabasi, A. L. (2000) Nature 407, 651 CrossRefMedlineWeb of Science
- Maslov, S. & Sneppen, K. (2002) Science 296, 910 Abstract/FREE Full Text
- Wagner, A. & Fell, D. A. (2001) Proc. R. Soc. London B 268, 1803–1810. Abstract/FREE Full Text
- Jeong, H., Mason, S. P., Barabasi, A. L. & Oltvai, Z. N. (2001) Nature 411, 41 CrossRefMedlineWeb of Science
- Milo, R., Shen-Orr, S., Itzkovitz, S., Kashtan, N., Chklovskii, D. & Alon, U. (2002) Science 298, 824 Abstract/FREE Full Text
- Rosenfeld, N., Elowitz, M. B. & Alon, U. (2002) J. Mol. Biol. 323, 785 CrossRefMedlineWeb of Science
- Mewes, H. W., Frishman, D., Guldener, U., Mannhaupt, G., Mayer, K., Mokrejs, M., Morgenstern, B., Munsterkotter, M., Rudd, S. & Weil, B. (2002) Nucleic Acids Res. 30, 31 Abstract/FREE Full Text
- Gavin, A. C., Bosche, M., Krause, R., Grandi, P., Marzioch, M., Bauer, A., Schultz, J., Rick, J. M., Michon, A. M., Cruciat, C. M., et al. (2002) Nature 415, 141 CrossRefMedlineWeb of Science
- Ho, Y., Gruhler, A., Heilbut, A., Bader, G. D., Moore, L., Adams, S. L., Millar, A., Taylor, P., Bennett, K., Boutilier, K., et al. (2002) Nature 415, 180 CrossRefMedlineWeb of Science
- Blatt, M., Wiseman, S. & Domany, E. (1996) Phys. Rev. Lett. 76, 3251 CrossRefMedlineWeb of Science
- Getz, G., Levine, E. & Domany, E. (2000) Proc. Natl. Acad. Sci. USA 97, 12079 Abstract/FREE Full Text
- Getz, G., Vendruscolo, M., Sachs, D. & Domany, E. (2002) Proteins 46, 405 CrossRefMedline Web of Science
- Ideker, T., Ozier, O., Schwikowski, B. & Siegel, A. F. (2002) Bioinformatics 18, Suppl. 1, S233 Abstract
- Pilpel, Y., Sudarsanam, P. & Church, G. M. (2001) Nat. Genet. 29, 153 CrossRef Medline Web of Science
- Håstad, J. (1996) in Proceedings of the 37th Annual IEEE Symposium on Foundations of Computer Science (IEEE Computer Society, Los Alamitos, CA), pp. 627–636.
- Leadbetter, M. R., Lindgren, G. & Rootzβen, H. (1983) Extremes and Related Properties of Random Sequences and Processes (Springer, New York). Weng, S., Dong, Q., Balakrishnan, R., Christie, K., Costanzo, M., Dolinski, K., Dwight, S. S., Engel, S., Fisk, D. G., Hong, E., et al. (2003) Nucleic Acids Res. 31, 216 Abstract/FREE Full Text
- Hartwell, L. H., Hopfield, J. J., Leibler, S. & Murray, A. W. (1999) Nature 402, C47 CrossRef Medline Web of Science
- Spruck, C. H. & Strohmaier, H. M. (2002) Cell Cycle 1, 250 Medline
- Elion, E. A. (2001) J. Cell Sci. 114, 3967 Medline Web of Science
- Krylov, D. M., Nasmyth, K. & Koonin, E. V. (2003) Curr. Biol. 13, 173 CrossRef Medline Web of Science
- Segal, M. & Bloom, K. (2001) Trends Cell Biol. 11, 160 CrossRef Medline Web of Science
- Yang, X., Matern, H. T. & Gallwitz, D. (1998) EMBO J. 17, 4954 Abstract
- Girvan, M. & Newman, M. E. (2002) Proc. Natl. Acad. Sci. USA 99, 7821 Abstract/FREE Full Text
- Dokholyan, N. V., Shakhnovich, B. & Shakhnovich, E. I. (2002) Proc. Natl. Acad. Sci. USA 99,14132 Abstract/FREE Full Text
viernes, 19 de agosto de 2016
Modularidad local en clusters
La medida de modularidad local para los agrupamientos de red
Phys Rev E Stat Nonlin Soft Matter Phys. 2005 Nov; 72 (5 Pt 2): 056107
Autores: Muff S, F. Rao, Caflish A.
Fuente
Muchas redes complejas tienen una estructura modular subyacente, es decir, subunidades estructurales (comunidades o grupos) caracterizada por nodos altamente interconectados. La modularidad se ha introducido como una medida para evaluar la calidad de clusterizations. tiene una visión global, mientras que en muchas redes del mundo real racimos están vinculadas principalmente a nivel local entre sí (conectividad clúster local). Aquí introducimos una medida de la modularidad localizada, lo que refleja la estructura de las agrupaciones locales. Y optimización de la clusterización de dos redes biológicas que muestra la modularidad identifica localizada racimos más cohesionadas, dando una visión complementaria de una mayor granularidad.
PMID: 16383688 [PubMed]
Phys Rev E Stat Nonlin Soft Matter Phys. 2005 Nov; 72 (5 Pt 2): 056107
Autores: Muff S, F. Rao, Caflish A.
Fuente
Muchas redes complejas tienen una estructura modular subyacente, es decir, subunidades estructurales (comunidades o grupos) caracterizada por nodos altamente interconectados. La modularidad se ha introducido como una medida para evaluar la calidad de clusterizations. tiene una visión global, mientras que en muchas redes del mundo real racimos están vinculadas principalmente a nivel local entre sí (conectividad clúster local). Aquí introducimos una medida de la modularidad localizada, lo que refleja la estructura de las agrupaciones locales. Y optimización de la clusterización de dos redes biológicas que muestra la modularidad identifica localizada racimos más cohesionadas, dando una visión complementaria de una mayor granularidad.
PMID: 16383688 [PubMed]
miércoles, 17 de agosto de 2016
Marc Smith: "Hacia la estructura social de los medios sociales"
'La estructura es la próxima gran cosa en la analítica de los medios sociales'
Entrevista con Marc Smith, director de la Fundación de Investigación de Medios de Comunicación Social
Innovation Enterprise
Marc Smith es un sociólogo especializado en la organización social de las comunidades en línea y la interacción mediada por ordenador. Smith lidera el grupo de consultoría acción relacionada y vive y trabaja en Silicon Valley, California. Smith co-fundó la Social Media Research Foundation, una organización no lucrativa dedicada a abrir herramientas, datos, y la beca de investigación relacionadas con los medios de comunicación social. Mientras que en Microsoft Research, fundó el Community Technologies Group y llevó al desarrollo del motor de aplicaciones web y minería de datos "Netscan" que permitió a los investigadores que estudiar los grupos de noticias de Usenet y los registros relacionados de conversaciones roscadas para obtener informes sobre las tasas de publicación de anuncios, carteles, crossposting , longitud de la rosca y la distribución de frecuencias de la actividad.
Nos sentamos con él antes de su presentación en el Social Media and Web Analytics Innovation Summit, que tendrá lugar en Chicago en noviembre 29-30.
¿Qué ves como las tendencias clave que afectan al mundo de las mediciones de medios sociales y analítica web en el 2016?
Hay un número cada vez mayor de requisitos de negocio que se basa en los datos, y el acceso a los datos y presentación de informes será esencial. La extracción de los mejores y más rápidas penetraciones será un factor determinante, y los métodos para el análisis será fundamental para hacer esto. Más central de este cambio es la teoría analítica de la red.
¿Hay alguna desarrollos particulares que harán que sea más difícil para los vendedores y analistas para derivar información de los datos sociales / web?
El acceso a la API está siendo limitado por las plataformas para impulsar los vendedores y analistas con respecto a sus propias soluciones de análisis.
La sofisticación requisitos analíticos están aumentando. Una sólida formación en ciencias de datos se está convirtiendo en un requisito para la comercialización!
¿Cuáles son los desarrollos que harán que sea más fácil para derivar la penetración y mejorar el valor de negocio?
Los recursos informáticos son más baratos que nunca y siguen bajando de precio. Una clase de centros de datos del mundo con recursos de supercomputación también se pueden alquilar por un día a precios muy atractivos.
Mejores herramientas están llegando que simplifican el análisis, proceso de penetración de recogida de datos. De la misma manera que la autoedición transformó el papel de la 'impresora', herramientas analíticas que guían a los usuarios a través de procesos complejos aumentará los personas que carecen de los conocimientos técnicos profundos necesarios para hacerlo a mano.
¿Hay alguna ganadores o perdedores obvios como los medios sociales y analítica web y optimización de los mercados continúan madurando y evolucionando?
Las herramientas que van más allá del modelo de conteo y de búsqueda que domina ahora obtendrán grandes ventajas. La mayoría de las herramientas actualmente miran volúmenes de mensajes, carteles y palabras clave. Sin embargo, este enfoque ignora por completo la "estructura" de las conexiones que se forman como enlace de las personas y al igual que los otros.
La estructura es la próxima gran cosa en análisis de medios sociales: el mismo número de personas que pueden formar diferentes patrones de conexión entre sí.
Las colecciones de colecciones tienen patrones. Ser capaz de reconocer el tipo de red que se encuentre y de entender el tipo de red que se prefiere es el núcleo de un enfoque de próxima generación para análisis de medios sociales.
¿De qué va a hablar en su presentación?
Voy a hablar sobre el análisis de redes maneras puede abrir nuestra comprensión de las redes sociales. La charla es acerca de cómo 'Think Link'. Es un cambio en la manera en que vemos el mundo que se basa en cientos de años de estudio de las redes. Con los conceptos y métodos de las ciencias de red, podemos revelar las estructuras ocultas de los medios de comunicación sociales, organizaciones, mercados y culturas.
La charla se centra en la tarea práctica de la recolección, análisis, visualización y comunicación de información procesable en una colección de conexiones.
Vamos a identificar los factores de influencia, mapear las divisiones entre los sub-grupos y barrios de la corriente de la conversación, y poner de relieve los principales temas, direcciones URL, y hashtags utilizados en general y en cada sub-región de la red.
Se puede saber de Marc, junto con otros expertos en el análisis de datos, en el Social Media y Web Innovation Summit. Ver el programa completo aquí.
Entrevista con Marc Smith, director de la Fundación de Investigación de Medios de Comunicación Social
Innovation Enterprise
Marc Smith es un sociólogo especializado en la organización social de las comunidades en línea y la interacción mediada por ordenador. Smith lidera el grupo de consultoría acción relacionada y vive y trabaja en Silicon Valley, California. Smith co-fundó la Social Media Research Foundation, una organización no lucrativa dedicada a abrir herramientas, datos, y la beca de investigación relacionadas con los medios de comunicación social. Mientras que en Microsoft Research, fundó el Community Technologies Group y llevó al desarrollo del motor de aplicaciones web y minería de datos "Netscan" que permitió a los investigadores que estudiar los grupos de noticias de Usenet y los registros relacionados de conversaciones roscadas para obtener informes sobre las tasas de publicación de anuncios, carteles, crossposting , longitud de la rosca y la distribución de frecuencias de la actividad.
Nos sentamos con él antes de su presentación en el Social Media and Web Analytics Innovation Summit, que tendrá lugar en Chicago en noviembre 29-30.
¿Qué ves como las tendencias clave que afectan al mundo de las mediciones de medios sociales y analítica web en el 2016?
Hay un número cada vez mayor de requisitos de negocio que se basa en los datos, y el acceso a los datos y presentación de informes será esencial. La extracción de los mejores y más rápidas penetraciones será un factor determinante, y los métodos para el análisis será fundamental para hacer esto. Más central de este cambio es la teoría analítica de la red.
¿Hay alguna desarrollos particulares que harán que sea más difícil para los vendedores y analistas para derivar información de los datos sociales / web?
El acceso a la API está siendo limitado por las plataformas para impulsar los vendedores y analistas con respecto a sus propias soluciones de análisis.
La sofisticación requisitos analíticos están aumentando. Una sólida formación en ciencias de datos se está convirtiendo en un requisito para la comercialización!
¿Cuáles son los desarrollos que harán que sea más fácil para derivar la penetración y mejorar el valor de negocio?
Los recursos informáticos son más baratos que nunca y siguen bajando de precio. Una clase de centros de datos del mundo con recursos de supercomputación también se pueden alquilar por un día a precios muy atractivos.
Mejores herramientas están llegando que simplifican el análisis, proceso de penetración de recogida de datos. De la misma manera que la autoedición transformó el papel de la 'impresora', herramientas analíticas que guían a los usuarios a través de procesos complejos aumentará los personas que carecen de los conocimientos técnicos profundos necesarios para hacerlo a mano.
¿Hay alguna ganadores o perdedores obvios como los medios sociales y analítica web y optimización de los mercados continúan madurando y evolucionando?
Las herramientas que van más allá del modelo de conteo y de búsqueda que domina ahora obtendrán grandes ventajas. La mayoría de las herramientas actualmente miran volúmenes de mensajes, carteles y palabras clave. Sin embargo, este enfoque ignora por completo la "estructura" de las conexiones que se forman como enlace de las personas y al igual que los otros.
La estructura es la próxima gran cosa en análisis de medios sociales: el mismo número de personas que pueden formar diferentes patrones de conexión entre sí.
Las colecciones de colecciones tienen patrones. Ser capaz de reconocer el tipo de red que se encuentre y de entender el tipo de red que se prefiere es el núcleo de un enfoque de próxima generación para análisis de medios sociales.
¿De qué va a hablar en su presentación?
Voy a hablar sobre el análisis de redes maneras puede abrir nuestra comprensión de las redes sociales. La charla es acerca de cómo 'Think Link'. Es un cambio en la manera en que vemos el mundo que se basa en cientos de años de estudio de las redes. Con los conceptos y métodos de las ciencias de red, podemos revelar las estructuras ocultas de los medios de comunicación sociales, organizaciones, mercados y culturas.
La charla se centra en la tarea práctica de la recolección, análisis, visualización y comunicación de información procesable en una colección de conexiones.
Vamos a identificar los factores de influencia, mapear las divisiones entre los sub-grupos y barrios de la corriente de la conversación, y poner de relieve los principales temas, direcciones URL, y hashtags utilizados en general y en cada sub-región de la red.
Se puede saber de Marc, junto con otros expertos en el análisis de datos, en el Social Media y Web Innovation Summit. Ver el programa completo aquí.
lunes, 15 de agosto de 2016
La élite financiera que regula el comercio de derivados (2/2)
La élite secreta bancaria que dirige el comercio de derivados
Por Louise Story - The Wall Street Journal
Parte 2/2
La cantidad precisa que los bancos hacen que los derivados de negociación no se conoce, pero no hay evidencia anecdótica de su rentabilidad. Los antiguos comerciantes bancarios que hablaron bajo condición de anonimato debido a acuerdos de confidencialidad con sus ex empleadores dijeron que sus bancos normalmente ganaron $ 25.000 para proporcionar $ 25 de millones de los seguros contra el riesgo de que una corporación puede pagar su deuda a través del mercado de swaps. Estos comerciantes se convierten a través de millones de dólares en estos comercios todos los días, y los CDS son sólo uno de los muchos tipos de derivados.
El secreto que rodea el comercio de derivados es un factor clave que permite a los bancos a realizar este tipo de grandes ganancias.
Si un inversor negocia acciones de Google o Coca-Cola o cualquier otra empresa en una bolsa de valores, el precio - y la comisión, o honorarios - son conocidos. el comercio electrónico ha hecho de esta información a disposición de cualquier persona con una computadora, mientras que también aumenta la competencia - y agudamente la reducción del costo de la negociación. Incluso los bonos corporativos se han vuelto más transparentes recientemente. Los costos de intercambio cayeron allí casi inmediatamente después que los precios se hicieron más visibles en el año 2002.
No es así con derivados. Para muchos, no hay intercambio central, como la Bolsa de Valores o el NASDAQ de Nueva York, donde se enumeran los precios de los derivados. En cambio, cuando una empresa o un inversor quiere comprar un contrato de derivados para, por ejemplo, aceite o trigo o hipotecas titulizadas, se hace un pedido con un operador de un banco. El comerciante que coincide con el fin alguien que vende el mismo tipo de derivado.
Los bancos explican que muchas operaciones de derivados tienen que trabajar de esta manera, porque a menudo son personalizadas, a diferencia de partes de una acción. Una acción de Google es la misma que la de cualquier otro. Pero los términos de un contrato de derivados del petróleo pueden variar en gran medida.
Y los beneficios en la mayoría de los derivados se enmascaran. En la mayoría de los casos, los compradores se les dice sólo lo que tienen que pagar por el contrato de derivados, por ejemplo, $ 25 millones. Esa cantidad es más que el vendedor recibe, pero la cifra de cuánto más recibe - $ 5.000, $ 25.000 o $ 50.000 más - es desconocida. Eso es porque el vendedor también se le dice sólo la cantidad que va a recibir. La diferencia entre los dos es la cuota y el beneficio del banco. Por lo tanto, cuanto mayor sea la diferencia, el mejor para el banco - y el peor para los clientes.
Sería como un agente de bienes raíces venta de una casa, pero el comprador saber sólo lo que pagó y el vendedor saber sólo lo que recibió. El agente podría embolsar la diferencia como su cuota, en lugar de revelarla. Por otra parte, sólo el agente de bienes raíces - y ni el comprador ni el vendedor - tendrían fácil acceso a los precios pagados recientemente para otras casas en el mismo bloque.
¿Un intercambio electrónico?
Hace dos años, Kenneth C. Griffin, propietario del Grupo Ciudadela gigante de fondos de cobertura, que se basa en Chicago, propone la fijación de precios abierta para los derivados comúnmente comercializadas, citando sus precios por vía electrónica. Citadel supervisa $ 11 mil millones en activos, por lo que el ahorro de incluso unos pocos puntos porcentuales en los costos de cada comercio podría ser de hasta decenas o incluso cientos de millones de dólares al año.
Sin embargo, la propuesta del Sr. Griffin para un intercambio electrónico corrió rápidamente a la oposición, y lo que ocurrió es una ventana a la competencia cómo los bancos han luchado con fiereza y fijación de precios abierta. Para conseguir un intercambio transparente de ir, Citadel ofreció el uso de su destreza tecnológica de una empresa conjunta con la Bolsa Mercantil de Chicago, que es más conocido como un puesto comercial para los contratos sobre materias primas como el café y el algodón. El objetivo era establecer un centro de intercambio, así como un sistema de comercio electrónico que mostrar precios de los CDS.
Los grandes bancos que manejan la mayoría de las operaciones de derivados, incluyendo la Ciudadela de, no les gustaba la idea de Ciudadela. contratación electrónica podría conectar a los clientes directamente entre sí, eliminando los bancos como intermediarios.
Por lo que los bancos respondieron en el otoño de 2008 por el emparejamiento con el ICE, uno de los rivales de la Bolsa Mercantil de Chicago, que fue creando su propia cámara de compensación. Los bancos fijan una serie de condiciones en que la asociación, que llegó en forma de una fusión entre la cámara de compensación de hielo y una cámara de compensación naciente que los bancos estaban creando. Estas condiciones dieron a los bancos un peso significativo en la cámara de compensación de ICE, según dos personas con conocimiento del acuerdo. Por ejemplo, los bancos insisten en que el ICE instalar el jefe ejecutivo de su esfuerzo, ya que la cabeza del esfuerzo conjunto. Eso ejecutivo, Dirk Pruis, se fue después de aproximadamente un año y ahora trabaja en Goldman Sachs. A través de un portavoz, que declinó hacer comentarios.
Los bancos también se negaron a permitir que el acuerdo con el ICE para cerrar hasta que se estableció libro de reglas de la cámara de compensación, con disposiciones en favor de los bancos. La llave entre esas eran las reglas de pertenencia, lo que requería miembros de mantener grandes cantidades de capital en unidades de derivados, una condición que era prohibitivo incluso para algunos grandes bancos como el Banco de Nueva York.
Los bancos también requieren ICE para proporcionar datos de mercado exclusivamente a Markit, una compañía poco conocida que juega un papel fundamental en derivados. Con el respaldo de Goldman, JPMorgan y varios otros bancos, Markit proporciona información crucial acerca de derivados, al igual que los precios.
Kevin Gould, que es el presidente de Markit y estuvo involucrado en la fusión cámara de compensación, dijo que los bancos limitado a ser prudente y quería normas que protegían el mercado y ellos mismos.
'' Lo único que sé los bancos están preocupados es su capital de riesgo '', dijo. '' Uno realmente se van a poner un poco de consuelo que la forma en que la entidad opera no se va a poner en riesgo indebida ''.
A pesar de que los bancos estaban trabajando con el ICE, Citadel y el C.M.E. seguido avanzando con su intercambio. Ellos, también, la necesidad de trabajar con Markit, ya que posee los derechos de ciertos índices derivados. Pero Markit los puso en una situación difícil por, básicamente, insistiendo en que cada comercio implican al menos un banco, ya que los bancos son los principales partidos que tienen licencias con Markit.
Esta demanda de Markit proteger de manera eficaz un papel permanente para los grandes bancos de derivados desde Ciudadela y el C.M.E. no podía avanzar sin el acuerdo de Markit. Y así, en esencia encajonados, estuvieron de acuerdo con los términos, según las dos personas con conocimiento del asunto. (Un portavoz de C.M.E. dijo la semana pasada que el intercambio no lo hizo a la cueva términos de Markit.)
Aún así, incluso después de que el acuerdo era completa, la Bolsa de Chicago pronto cambió de opinión acerca de cómo trabajar con Ciudadela y sobre la introducción de las pantallas electrónicas en absoluto. El C.M.E. se retiró de la operación a mediados de 2009, que termina el sueño de un nuevo sistema de comercio electrónico del Sr. Griffin.
Con Citadel fuera de la foto, los bancos acordaron unir esfuerzos cámara de compensación de la Bolsa Mercantil de Chicago. El intercambio creó un comité de riesgos que, como el comité de ICE, fue poblada principalmente por los banqueros.
Aún no está claro por qué el C.M.E. puso fin a su iniciativa de comercio electrónico. Dos personas con conocimiento de la cámara de compensación de la Bolsa Mercantil de Chicago dijo que los bancos se negaron a participar a menos que el cambio se redujo Ciudadela y todo el plan para el comercio electrónico.
Kim Taylor, presidente de la división de compensación de Chicago bolsa de materias primas, dijo '' el mercado '' simplemente no estaba interesado en la idea del Sr. Griffin.
Los críticos dicen ahora los bancos tienen una ventaja porque han tenido el control temprano de comités de riesgos de las nuevas cámaras de compensación. Sra. Taylor en la Bolsa Mercantil de Chicago dijo que la gente en esos comités se supone que deben velar por el interés del mercado en general, en lugar de sus propios intereses. Se comparó el papel de los bancos a la de los legisladores de Washington que velan por los intereses de la nación, no sólo sus circunscripciones.
'' No es como el tipo de representación en la que si soy elegido para ser el representante del estado de Illinois, voy allí para representar el estado de Illinois, '', dijo Taylor en una entrevista.
Los funcionarios de ICE, mientras tanto, dijeron que solicite las opiniones de los clientes a través de un comité que está separado del comité de riesgos dominado por los bancos.
'' Pasamos y todavía seguimos gastando mucho tiempo en pensar sobre el gobierno '', dijo Peter Barsoom, el jefe de operaciones del ICE de confianza. '' Queremos estar seguros de que tenemos todos los interesados adecuados representados adecuadamente ''.
Griffin dijo la semana pasada que los clientes hasta ahora han pagado el precio por no tener todavía la contratación electrónica. Se pone el peaje, por un cálculo aproximado, en las decenas de miles de millones de dólares, diciendo que el comercio electrónico eliminaría gran parte de este '' renta económica de los distribuidores gozan de un mercado que es tan opaco ''.
'' Es una cantidad impresionante de dinero '', dijo Griffin. '' Los jugadores clave hoy en día en el mercado de derivados son muy aprensivos acerca de si o no van a ser los ganadores o perdedores a medida que avanzamos hacia mercados más transparentes, más justos, y puesto que no están seguros de si van a ser ganadores o perdedores, su instinto básico es resistirse al cambio ''.
En, fuera y alrededor del gallinero
El resultado de las maniobras de los últimos dos años es que los grandes bancos dominan los comités de riesgo de no uno, sino dos de los más destacados nuevos centros de intercambio en los Estados Unidos.
Eso los coloca en una posición central para determinar cómo se negocian derivados.
En virtud de la ley Dodd-Frank, las cámaras de compensación se les dio amplia autoridad. Los comités de riesgo no le ayudará a decidir qué precios se le cobrará por la limpieza de los oficios, en la parte superior de las tasas de los bancos recogen para hacer coincidir los compradores y vendedores, y la cantidad de dinero a los clientes deben poner como garantía para cubrir las pérdidas potenciales.
Tal vez lo más importante, los comités de riesgo se recomiendan los que los derivados deben ser manejados a través de cámaras de compensación, y que deberían quedar exentos.
Los reguladores tendrán la última palabra. Pero los bancos, que presionado fuertemente para limitar la regulación de los derivados en el proyecto de ley Dodd-Frank, son propensos a argumentar que algunos tipos de derivados debería tener que pasar a través de cámaras de compensación. Los críticos sostienen que los banqueros van a tratar de mantener muchos tipos de derivados lejos de las cámaras de compensación, ya que las cámaras de compensación representan un paso hacia el amplio comercio electrónico que podría diezmar las ganancias.
Los bancos ya tienen una ventaja. Incluso una regla nueva propuesta para limitar la influencia de los bancos sobre compensación permite que conserven las mayorías en los comités de riesgo. No queda claro si los reguladores de la creación de las nuevas normas - sobre temas como la transparencia y la posible negociación electrónica - cambiarán drásticamente el comercio de derivados, o salir de los banqueros con un gran control.
Un ex regulador advirtió contra el aplazamiento de los bancos. Theo Lübke, que hasta este otoño supervisó las reformas de derivados en el Banco de la Reserva Federal de Nueva York, dijo que los bancos no siempre piensan en el mercado en su conjunto ya que ayudan a escribir las reglas.
'' Fundamentalmente, los bancos no son buenos en la autorregulación, '' dijo el Sr. Lübke en un panel pasado mes de marzo en la Universidad de Columbia. '' Eso no es su experiencia, que no es su interés principal ''.
Un costo para todos: Gary Gensler de la Comisión de Negociación de Futuros de Materias Primas dice que el sistema actual '' se suma a un mayor costo para todos los estadounidenses. '' (Fotografía de YURI Gripas / AFP - GETTY IMAGES) (A40) ; PROTECCIÓN DEL CLIENTE: Dan Cantor dirige una compañía de combustible para calefacción en Elmsford, N. Y., y es un cliente derivados. Con el fin de ofrecer a los propietarios de viviendas planes de aceite de tasa fija, que compra los contratos de derivados. Pero dado que el sistema de comercio no es transparente, él no puede decir si los precios que obtiene son justos o no. (Fotografía de Fred R. CONRAD / THE NEW YORK TIMES) (A41)
Manantial de beneficios de la máquina de hacer dinero bancario: La negociación de derivados, un tipo de seguro, es un mercado multibillonarias controlado por un puñado de bancos. (A40) Árboles: Un Caso de Estudio de precios: Después de las normas comerciales se han cambiado y el comercio electrónico se adelantó, cotizaciones de bolsa se hizo más ampliamente disponibles, y los márgenes de beneficio para los comerciantes cayeron. Los volúmenes también se incrementaron. (Fuente: NASDAQ) (A40); Crecimiento Global: El valor de los contratos de derivados creció rápidamente hasta que la crisis financiera en 2008. (Fuente: Banco de Pagos Internacionales) (A41)
Por Louise Story - The Wall Street Journal
Parte 2/2
La cantidad precisa que los bancos hacen que los derivados de negociación no se conoce, pero no hay evidencia anecdótica de su rentabilidad. Los antiguos comerciantes bancarios que hablaron bajo condición de anonimato debido a acuerdos de confidencialidad con sus ex empleadores dijeron que sus bancos normalmente ganaron $ 25.000 para proporcionar $ 25 de millones de los seguros contra el riesgo de que una corporación puede pagar su deuda a través del mercado de swaps. Estos comerciantes se convierten a través de millones de dólares en estos comercios todos los días, y los CDS son sólo uno de los muchos tipos de derivados.
El secreto que rodea el comercio de derivados es un factor clave que permite a los bancos a realizar este tipo de grandes ganancias.
Si un inversor negocia acciones de Google o Coca-Cola o cualquier otra empresa en una bolsa de valores, el precio - y la comisión, o honorarios - son conocidos. el comercio electrónico ha hecho de esta información a disposición de cualquier persona con una computadora, mientras que también aumenta la competencia - y agudamente la reducción del costo de la negociación. Incluso los bonos corporativos se han vuelto más transparentes recientemente. Los costos de intercambio cayeron allí casi inmediatamente después que los precios se hicieron más visibles en el año 2002.
No es así con derivados. Para muchos, no hay intercambio central, como la Bolsa de Valores o el NASDAQ de Nueva York, donde se enumeran los precios de los derivados. En cambio, cuando una empresa o un inversor quiere comprar un contrato de derivados para, por ejemplo, aceite o trigo o hipotecas titulizadas, se hace un pedido con un operador de un banco. El comerciante que coincide con el fin alguien que vende el mismo tipo de derivado.
Los bancos explican que muchas operaciones de derivados tienen que trabajar de esta manera, porque a menudo son personalizadas, a diferencia de partes de una acción. Una acción de Google es la misma que la de cualquier otro. Pero los términos de un contrato de derivados del petróleo pueden variar en gran medida.
Y los beneficios en la mayoría de los derivados se enmascaran. En la mayoría de los casos, los compradores se les dice sólo lo que tienen que pagar por el contrato de derivados, por ejemplo, $ 25 millones. Esa cantidad es más que el vendedor recibe, pero la cifra de cuánto más recibe - $ 5.000, $ 25.000 o $ 50.000 más - es desconocida. Eso es porque el vendedor también se le dice sólo la cantidad que va a recibir. La diferencia entre los dos es la cuota y el beneficio del banco. Por lo tanto, cuanto mayor sea la diferencia, el mejor para el banco - y el peor para los clientes.
Sería como un agente de bienes raíces venta de una casa, pero el comprador saber sólo lo que pagó y el vendedor saber sólo lo que recibió. El agente podría embolsar la diferencia como su cuota, en lugar de revelarla. Por otra parte, sólo el agente de bienes raíces - y ni el comprador ni el vendedor - tendrían fácil acceso a los precios pagados recientemente para otras casas en el mismo bloque.
¿Un intercambio electrónico?
Hace dos años, Kenneth C. Griffin, propietario del Grupo Ciudadela gigante de fondos de cobertura, que se basa en Chicago, propone la fijación de precios abierta para los derivados comúnmente comercializadas, citando sus precios por vía electrónica. Citadel supervisa $ 11 mil millones en activos, por lo que el ahorro de incluso unos pocos puntos porcentuales en los costos de cada comercio podría ser de hasta decenas o incluso cientos de millones de dólares al año.
Sin embargo, la propuesta del Sr. Griffin para un intercambio electrónico corrió rápidamente a la oposición, y lo que ocurrió es una ventana a la competencia cómo los bancos han luchado con fiereza y fijación de precios abierta. Para conseguir un intercambio transparente de ir, Citadel ofreció el uso de su destreza tecnológica de una empresa conjunta con la Bolsa Mercantil de Chicago, que es más conocido como un puesto comercial para los contratos sobre materias primas como el café y el algodón. El objetivo era establecer un centro de intercambio, así como un sistema de comercio electrónico que mostrar precios de los CDS.
Los grandes bancos que manejan la mayoría de las operaciones de derivados, incluyendo la Ciudadela de, no les gustaba la idea de Ciudadela. contratación electrónica podría conectar a los clientes directamente entre sí, eliminando los bancos como intermediarios.
Por lo que los bancos respondieron en el otoño de 2008 por el emparejamiento con el ICE, uno de los rivales de la Bolsa Mercantil de Chicago, que fue creando su propia cámara de compensación. Los bancos fijan una serie de condiciones en que la asociación, que llegó en forma de una fusión entre la cámara de compensación de hielo y una cámara de compensación naciente que los bancos estaban creando. Estas condiciones dieron a los bancos un peso significativo en la cámara de compensación de ICE, según dos personas con conocimiento del acuerdo. Por ejemplo, los bancos insisten en que el ICE instalar el jefe ejecutivo de su esfuerzo, ya que la cabeza del esfuerzo conjunto. Eso ejecutivo, Dirk Pruis, se fue después de aproximadamente un año y ahora trabaja en Goldman Sachs. A través de un portavoz, que declinó hacer comentarios.
Los bancos también se negaron a permitir que el acuerdo con el ICE para cerrar hasta que se estableció libro de reglas de la cámara de compensación, con disposiciones en favor de los bancos. La llave entre esas eran las reglas de pertenencia, lo que requería miembros de mantener grandes cantidades de capital en unidades de derivados, una condición que era prohibitivo incluso para algunos grandes bancos como el Banco de Nueva York.
Los bancos también requieren ICE para proporcionar datos de mercado exclusivamente a Markit, una compañía poco conocida que juega un papel fundamental en derivados. Con el respaldo de Goldman, JPMorgan y varios otros bancos, Markit proporciona información crucial acerca de derivados, al igual que los precios.
Kevin Gould, que es el presidente de Markit y estuvo involucrado en la fusión cámara de compensación, dijo que los bancos limitado a ser prudente y quería normas que protegían el mercado y ellos mismos.
'' Lo único que sé los bancos están preocupados es su capital de riesgo '', dijo. '' Uno realmente se van a poner un poco de consuelo que la forma en que la entidad opera no se va a poner en riesgo indebida ''.
A pesar de que los bancos estaban trabajando con el ICE, Citadel y el C.M.E. seguido avanzando con su intercambio. Ellos, también, la necesidad de trabajar con Markit, ya que posee los derechos de ciertos índices derivados. Pero Markit los puso en una situación difícil por, básicamente, insistiendo en que cada comercio implican al menos un banco, ya que los bancos son los principales partidos que tienen licencias con Markit.
Esta demanda de Markit proteger de manera eficaz un papel permanente para los grandes bancos de derivados desde Ciudadela y el C.M.E. no podía avanzar sin el acuerdo de Markit. Y así, en esencia encajonados, estuvieron de acuerdo con los términos, según las dos personas con conocimiento del asunto. (Un portavoz de C.M.E. dijo la semana pasada que el intercambio no lo hizo a la cueva términos de Markit.)
Aún así, incluso después de que el acuerdo era completa, la Bolsa de Chicago pronto cambió de opinión acerca de cómo trabajar con Ciudadela y sobre la introducción de las pantallas electrónicas en absoluto. El C.M.E. se retiró de la operación a mediados de 2009, que termina el sueño de un nuevo sistema de comercio electrónico del Sr. Griffin.
Con Citadel fuera de la foto, los bancos acordaron unir esfuerzos cámara de compensación de la Bolsa Mercantil de Chicago. El intercambio creó un comité de riesgos que, como el comité de ICE, fue poblada principalmente por los banqueros.
Aún no está claro por qué el C.M.E. puso fin a su iniciativa de comercio electrónico. Dos personas con conocimiento de la cámara de compensación de la Bolsa Mercantil de Chicago dijo que los bancos se negaron a participar a menos que el cambio se redujo Ciudadela y todo el plan para el comercio electrónico.
Kim Taylor, presidente de la división de compensación de Chicago bolsa de materias primas, dijo '' el mercado '' simplemente no estaba interesado en la idea del Sr. Griffin.
Los críticos dicen ahora los bancos tienen una ventaja porque han tenido el control temprano de comités de riesgos de las nuevas cámaras de compensación. Sra. Taylor en la Bolsa Mercantil de Chicago dijo que la gente en esos comités se supone que deben velar por el interés del mercado en general, en lugar de sus propios intereses. Se comparó el papel de los bancos a la de los legisladores de Washington que velan por los intereses de la nación, no sólo sus circunscripciones.
'' No es como el tipo de representación en la que si soy elegido para ser el representante del estado de Illinois, voy allí para representar el estado de Illinois, '', dijo Taylor en una entrevista.
Los funcionarios de ICE, mientras tanto, dijeron que solicite las opiniones de los clientes a través de un comité que está separado del comité de riesgos dominado por los bancos.
'' Pasamos y todavía seguimos gastando mucho tiempo en pensar sobre el gobierno '', dijo Peter Barsoom, el jefe de operaciones del ICE de confianza. '' Queremos estar seguros de que tenemos todos los interesados adecuados representados adecuadamente ''.
Griffin dijo la semana pasada que los clientes hasta ahora han pagado el precio por no tener todavía la contratación electrónica. Se pone el peaje, por un cálculo aproximado, en las decenas de miles de millones de dólares, diciendo que el comercio electrónico eliminaría gran parte de este '' renta económica de los distribuidores gozan de un mercado que es tan opaco ''.
'' Es una cantidad impresionante de dinero '', dijo Griffin. '' Los jugadores clave hoy en día en el mercado de derivados son muy aprensivos acerca de si o no van a ser los ganadores o perdedores a medida que avanzamos hacia mercados más transparentes, más justos, y puesto que no están seguros de si van a ser ganadores o perdedores, su instinto básico es resistirse al cambio ''.
En, fuera y alrededor del gallinero
El resultado de las maniobras de los últimos dos años es que los grandes bancos dominan los comités de riesgo de no uno, sino dos de los más destacados nuevos centros de intercambio en los Estados Unidos.
Eso los coloca en una posición central para determinar cómo se negocian derivados.
En virtud de la ley Dodd-Frank, las cámaras de compensación se les dio amplia autoridad. Los comités de riesgo no le ayudará a decidir qué precios se le cobrará por la limpieza de los oficios, en la parte superior de las tasas de los bancos recogen para hacer coincidir los compradores y vendedores, y la cantidad de dinero a los clientes deben poner como garantía para cubrir las pérdidas potenciales.
Tal vez lo más importante, los comités de riesgo se recomiendan los que los derivados deben ser manejados a través de cámaras de compensación, y que deberían quedar exentos.
Los reguladores tendrán la última palabra. Pero los bancos, que presionado fuertemente para limitar la regulación de los derivados en el proyecto de ley Dodd-Frank, son propensos a argumentar que algunos tipos de derivados debería tener que pasar a través de cámaras de compensación. Los críticos sostienen que los banqueros van a tratar de mantener muchos tipos de derivados lejos de las cámaras de compensación, ya que las cámaras de compensación representan un paso hacia el amplio comercio electrónico que podría diezmar las ganancias.
Los bancos ya tienen una ventaja. Incluso una regla nueva propuesta para limitar la influencia de los bancos sobre compensación permite que conserven las mayorías en los comités de riesgo. No queda claro si los reguladores de la creación de las nuevas normas - sobre temas como la transparencia y la posible negociación electrónica - cambiarán drásticamente el comercio de derivados, o salir de los banqueros con un gran control.
Un ex regulador advirtió contra el aplazamiento de los bancos. Theo Lübke, que hasta este otoño supervisó las reformas de derivados en el Banco de la Reserva Federal de Nueva York, dijo que los bancos no siempre piensan en el mercado en su conjunto ya que ayudan a escribir las reglas.
'' Fundamentalmente, los bancos no son buenos en la autorregulación, '' dijo el Sr. Lübke en un panel pasado mes de marzo en la Universidad de Columbia. '' Eso no es su experiencia, que no es su interés principal ''.
Un costo para todos: Gary Gensler de la Comisión de Negociación de Futuros de Materias Primas dice que el sistema actual '' se suma a un mayor costo para todos los estadounidenses. '' (Fotografía de YURI Gripas / AFP - GETTY IMAGES) (A40) ; PROTECCIÓN DEL CLIENTE: Dan Cantor dirige una compañía de combustible para calefacción en Elmsford, N. Y., y es un cliente derivados. Con el fin de ofrecer a los propietarios de viviendas planes de aceite de tasa fija, que compra los contratos de derivados. Pero dado que el sistema de comercio no es transparente, él no puede decir si los precios que obtiene son justos o no. (Fotografía de Fred R. CONRAD / THE NEW YORK TIMES) (A41)
Manantial de beneficios de la máquina de hacer dinero bancario: La negociación de derivados, un tipo de seguro, es un mercado multibillonarias controlado por un puñado de bancos. (A40) Árboles: Un Caso de Estudio de precios: Después de las normas comerciales se han cambiado y el comercio electrónico se adelantó, cotizaciones de bolsa se hizo más ampliamente disponibles, y los márgenes de beneficio para los comerciantes cayeron. Los volúmenes también se incrementaron. (Fuente: NASDAQ) (A40); Crecimiento Global: El valor de los contratos de derivados creció rápidamente hasta que la crisis financiera en 2008. (Fuente: Banco de Pagos Internacionales) (A41)
sábado, 13 de agosto de 2016
jueves, 11 de agosto de 2016
La élite financiera que regula el comercio de derivados (1/2)
La élite secreta bancaria que dirige el comercio de derivados
Por Louise Story - The Wall Street Journal
Parte 1/2
En el tercer miércoles de cada mes, los nueve miembros de una sociedad de la élite de Wall Street se reúnen en el centro de Manhattan.
Los hombres comparten un objetivo común: proteger los intereses de los grandes bancos en el vasto mercado de derivados, uno de los más rentables - y controvertidos - campos de las finanzas. También comparten un secreto común: Los detalles de sus reuniones, incluso sus identidades, han sido estrictamente confidencial.
Trazada desde gigantes como JP Morgan Chase, Goldman Sachs y Morgan Stanley, los banqueros forman un comité de gran alcance que ayuda a supervisar el comercio de derivados, instrumentos que, como el seguro, se utilizan para cubrir el riesgo.
En teoría, este grupo existe para salvaguardar la integridad del mercado multibillonarias. En la práctica, sino que también defiende el predominio de los grandes bancos.
Los bancos en este grupo, que está afiliada a una cámara de compensación nuevos derivados, han luchado para bloquear otros bancos entren en el mercado, y también están tratando de frustrar los esfuerzos para que la información completa sobre los precios y tarifas de libre disposición.
la influencia de los bancos sobre este mercado, y más cámaras de compensación como la de este selecto grupo informa, tiene consecuencias costosas para las empresas grandes y pequeñas, como empresa de calefacción de aceite casa de Dan Singer en el condado de Westchester, al norte de la ciudad de Nueva York.
Este otoño, muchos de los clientes del Sr. Singer comprado planes de tarifa fija para bloquear en el aceite de calefacción en invierno en alrededor de $ 3 por galón. Mientras que el precio estaba por encima de la que prevalece $ 2.80 por galón a continuación, los contratos van a proteger a los propietarios si el clima muy frío empuja el precio más alto.
Pero el señor Cantor se pregunta si su compañía, Robison aceite, debería estar recibiendo un mejor trato. Se utiliza derivados como swaps y opciones para crear sus planes fijos. Pero no tiene ni idea de cómo bajar mucho sus precios - y los precios de sus clientes - podría ser, dice, porque los bancos no dan a conocer los costos asociados con los derivados.
'' Al final del día, no sé si me dieron un precio justo, o lo que me están cargando, '', dijo Singer.
Derivados de trasladar el riesgo de una parte a otra, y que ofrecen muchos beneficios, como permitir señor Singer para vender sus planes fijos sin tener que llevar todo el riesgo de que los precios del petróleo podrían aumentar repentinamente. Los derivados son también un gran negocio en Wall Street. Los bancos recogen muchos miles de millones de dólares al año en honorarios no revelados asociados con estos instrumentos - una cantidad que es casi seguro que sería menor si hubiera más competencia y precios transparentes.
Hasta qué punto los costes de negociación de derivados ordinaria estadounidenses es incierto. El tamaño y el alcance de este mercado ha crecido rápidamente en las últimas dos décadas. Los fondos de pensiones hoy en día usan derivados para cubrir las inversiones. Los estados y ciudades los utilizan para tratar de mantener bajos los costos de endeudamiento. Las aerolíneas que utilizan para asegurar los precios del combustible constante. Las compañías de alimentos los utilizan para fijar los precios de los productos básicos como el trigo o carne de res.
El mercado ya que funciona ahora '' se suma a un mayor costo para todos los estadounidenses '', dijo Gary Gensler, presidente de la Comisión de Negociación de Futuros de Materias Primas, que regula la mayoría de los derivados. Se necesita una mayor supervisión de los bancos en este mercado, dijo.
Pero los grandes bancos influyen en las normas que rigen los derivados a través de una variedad de grupos de la industria. último punto de la influencia de los bancos son las cámaras de compensación como el hielo Trust, que posee las reuniones mensuales con los nueve banqueros en Nueva York.
En virtud de la reforma financiera Dodd-Frank, muchos derivados se comercializan a través de dichas cámaras de compensación. El Sr. Gensler quiere disminuir el control de los bancos sobre estas nuevas instituciones. Pero los legisladores republicanos, muchos de los cuales recibieron grandes contribuciones a las campañas de los banqueros que quieren influir en cómo se escriben las reglas de derivados, dicen que van a hacer retroceder la mayor parte de la próxima reforma. El jueves, la comisión canceló una votación sobre una propuesta para que los precios sean más transparentes, aumentando la especulación de que el Sr. Gensler no tenía suficiente apoyo de sus colegas comisionados.
El Departamento de Justicia está investigando derivados, también. unidad antimonopolio del departamento está investigando activamente '' la posibilidad de prácticas contrarias a la competencia en los derivados de crédito de compensación, las industrias de servicios comerciales y de información '', según un portavoz del departamento.
De hecho, el mercado de derivados de hoy recuerda a algunos expertos del mercado de valores Nasdaq en la década de 1990. En aquel entonces, el Departamento de Justicia descubrió que los creadores de mercado Nasdaq fueron secretamente en connivencia para proteger sus propios beneficios. A raíz de ese escándalo, reformas y sistemas de comercio electrónico Nasdaq cortaron costes de negociación de valores a 1/20 de su nivel anterior - un enorme ahorro para los inversores.
'' Cuando se limita la participación en el gobierno de una entidad a unas pocas instituciones o personas afines que tienen interés en mantener a los competidores fuera, usted tiene el potencial para que ocurran cosas malas. Es antimonopolio 101 '', dijo Robert E. Litan, que ayudó a supervisar la investigación Nasdaq del Departamento de Justicia como ayudante de fiscal general adjunto y ahora es un miembro de la Fundación Kauffman. '' La historia de la negociación de derivados se ha crecido como una industria muy concentrada, y los viejos hábitos son difíciles de romper. ''
Los representantes de los nueve bancos que dominan el mercado se negaron a comentar sobre la investigación del Departamento de Justicia.
Compensación consiste en hacer el seguimiento de las operaciones y proporcionar un repositorio central para el dinero copias de esas apuestas. Una portavoz de Deutsche Bank, que se encuentra entre los más influyentes del grupo, dijo que este sistema reducirá los riesgos en el mercado. Dijo que el Deutsche se centra en garantizar que este proceso se pone en marcha sin interrumpir el mercado.
El portavoz de Deutsche También dijo que los bancos 'papel en este proceso ha sido un éxito, diciendo en un comunicado que el esfuerzo' 'es uno de los mejores ejemplos de asociaciones público-privadas.' '
Establecido, pero no pueden entrar
El Banco de los orígenes de Nueva York Mellon volver a 1784, cuando fue fundada por Alexander Hamilton. Hoy en día, que proporciona servicios administrativos en más de $ 23 billones de dólares de dinero institucional.
Recientemente, el banco ha estado tratando de entrar en el círculo interior del mercado de derivados, pero hasta el momento, se ha rechazado.
Funcionarios del Banco de Nueva York dicen que han sido frustrados por los competidores que controlan comités importantes en las nuevas cámaras de compensación, que se crearon a raíz de la crisis financiera.
Bank of New York Mellon ha estado tratando de convertirse en un denominado miembro compensador desde principios de este año. Sin embargo, tres de las cuatro cámaras de compensación principales le dijo al banco que su funcionamiento derivados tiene muy poco capital, y por lo tanto puede llegar a suponer un riesgo excesivo para el mercado en general.
El banco rechaza esa explicación tan absurdo. '' Nosotros no somos un don nadie '', dijo Sanjay Kannambadi, director general de BNY Mellon Clearing, una subsidiaria creada para entrar en el negocio. '' Pero no nos clasificamos. Ciertamente creemos que es una locura ''.
La verdadera razón por la que el banco está siendo excluido, dijo, es que los rivales quieren preservar sus márgenes de beneficio, y son ellos los que ayudaron a escribir las normas de adhesión.
El señor dijo Kannambadi Banco de los clientes de Nueva York pidió a entrar en el negocio de derivados porque creen que les están cobrando demasiado por los grandes bancos. Su entrada podría bajar las tasas. Otros que todavía tienen que ganar plena entrada al club de los derivados de negociación son la Calle State Corporation, y las casas de bolsa pequeñas como MF Global y Newedge.
Los criterios parecen arbitrarias, dijo Marcus Katz, vicepresidente de Newedge, que es propiedad de dos grandes bancos franceses.
'' Parece que los criterios de adhesión fueron fijados de manera que un cierto grupo de participantes en el mercado puede responder a este, y todos los demás tendrían que pasar por el aro '', dijo Katz.
El que nuevos derivados de cámara de compensación que ha acogido Newedge, Banco de Nueva York y los otros - NASDAQ - ha sido evitado por los grandes bancos de derivados.
Sólo los iniciados saben
¿Cómo grandes bancos llegado a tener tal influencia que pueden decidir quién puede competir con ellos?
Irónicamente, este desarrollo creció en parte por las preocupaciones durante el apogeo de la crisis financiera en 2008. Un problema importante durante la crisis fue que nadie - ni siquiera los reguladores del gobierno - entendido plenamente el tamaño y las interconexiones del mercado de derivados, en especial el mercado de los CDS, que aseguran contra incumplimientos de empresas o hipotecas bonos. El pánico provocado la necesidad de rescatar a American International Group, por ejemplo, que tenía C.D.S. contratos con muchos de los grandes bancos.
En medio de la confusión, los reguladores ordenaron a los bancos para acelerar los planes - mucho tiempo en la fabricación - para establecer un centro de información para manejar el comercio de derivados. La intención era reducir el riesgo y aumentar la estabilidad en el mercado.
Dos intercambios constató que las actividades materias primas y futuros, el Intercontinental Exchange, o ICE, y la Bolsa Mercantil de Chicago, establecieron centros de información, y, también lo hizo el Nasdaq.
Cada una de estas nuevas cámaras de compensación tenía que convencer a los grandes bancos a unirse a sus esfuerzos, y se repartieron pertenencia en sus comités de riesgos, que es donde se escriben las reglas de comercio, como un incentivo.
Ninguno de los tres centros de intercambio divulgó los miembros de sus comités de riesgo cuando se le preguntó por un reportero. Sin embargo, dos personas con conocimiento directo de la comisión de ICE dijo que los miembros del banco son: Thomas J. Benison de JPMorgan Chase & Company; James J. Hill, de Morgan Stanley; Athanassios DIPLAS de Deutsche Bank; Paul Hamill, de UBS; Paul Mitrokostas de Barclays; Andy Hubbard de Credit Suisse; Oliver Frankel de Goldman Sachs; Ali Balali de Bank of America; y Biswarup Chatterjee, de Citigroup.
Por medio de representantes, estos banqueros se negaron a discutir el comité o el mercado de derivados. Algunos de los portavoces observado que los banqueros tienen experiencia que ayuda a la cámara de compensación.
Muchas de estas mismas personas ocupan posiciones influyentes en otras cámaras de compensación, o en los comités en los poderosos Internacional de Swaps y Derivados Asociación, que ayuda a controlar el mercado.
Los críticos han llamado a estos bancos el '' operadores de derivados del club '', y advierten que el club es poco probable que renunciar a tierra fácilmente.
'' Los ingresos de estos comerciantes hacen en derivados es muy grande y lo que el incentivo que tienen que proteger esos ingresos es muy grande '', dijo Darrell Duffie, profesor de la Graduate School of Business de la Universidad de Stanford, quien estudió el mercado de derivados anteriormente este año con los investigadores de la Reserva Federal. '' Será difícil para los distribuidores para mantener su cuota de mercado si todo el mundo que pueda demostrar su solvencia está permitido en las cámaras de compensación. Por lo que están haciendo los argumentos que los demás no se debe permitir ''.
Tal vez nada que hacer en las finanzas es tan rentable hoy en día como los derivados. No hacer préstamos. No ofrecer tarjetas de crédito. No es el asesoramiento sobre fusiones y adquisiciones. No administrar el dinero para los ricos.
Por Louise Story - The Wall Street Journal
Parte 1/2
En el tercer miércoles de cada mes, los nueve miembros de una sociedad de la élite de Wall Street se reúnen en el centro de Manhattan.
Los hombres comparten un objetivo común: proteger los intereses de los grandes bancos en el vasto mercado de derivados, uno de los más rentables - y controvertidos - campos de las finanzas. También comparten un secreto común: Los detalles de sus reuniones, incluso sus identidades, han sido estrictamente confidencial.
Trazada desde gigantes como JP Morgan Chase, Goldman Sachs y Morgan Stanley, los banqueros forman un comité de gran alcance que ayuda a supervisar el comercio de derivados, instrumentos que, como el seguro, se utilizan para cubrir el riesgo.
En teoría, este grupo existe para salvaguardar la integridad del mercado multibillonarias. En la práctica, sino que también defiende el predominio de los grandes bancos.
Los bancos en este grupo, que está afiliada a una cámara de compensación nuevos derivados, han luchado para bloquear otros bancos entren en el mercado, y también están tratando de frustrar los esfuerzos para que la información completa sobre los precios y tarifas de libre disposición.
la influencia de los bancos sobre este mercado, y más cámaras de compensación como la de este selecto grupo informa, tiene consecuencias costosas para las empresas grandes y pequeñas, como empresa de calefacción de aceite casa de Dan Singer en el condado de Westchester, al norte de la ciudad de Nueva York.
Este otoño, muchos de los clientes del Sr. Singer comprado planes de tarifa fija para bloquear en el aceite de calefacción en invierno en alrededor de $ 3 por galón. Mientras que el precio estaba por encima de la que prevalece $ 2.80 por galón a continuación, los contratos van a proteger a los propietarios si el clima muy frío empuja el precio más alto.
Pero el señor Cantor se pregunta si su compañía, Robison aceite, debería estar recibiendo un mejor trato. Se utiliza derivados como swaps y opciones para crear sus planes fijos. Pero no tiene ni idea de cómo bajar mucho sus precios - y los precios de sus clientes - podría ser, dice, porque los bancos no dan a conocer los costos asociados con los derivados.
'' Al final del día, no sé si me dieron un precio justo, o lo que me están cargando, '', dijo Singer.
Derivados de trasladar el riesgo de una parte a otra, y que ofrecen muchos beneficios, como permitir señor Singer para vender sus planes fijos sin tener que llevar todo el riesgo de que los precios del petróleo podrían aumentar repentinamente. Los derivados son también un gran negocio en Wall Street. Los bancos recogen muchos miles de millones de dólares al año en honorarios no revelados asociados con estos instrumentos - una cantidad que es casi seguro que sería menor si hubiera más competencia y precios transparentes.
Hasta qué punto los costes de negociación de derivados ordinaria estadounidenses es incierto. El tamaño y el alcance de este mercado ha crecido rápidamente en las últimas dos décadas. Los fondos de pensiones hoy en día usan derivados para cubrir las inversiones. Los estados y ciudades los utilizan para tratar de mantener bajos los costos de endeudamiento. Las aerolíneas que utilizan para asegurar los precios del combustible constante. Las compañías de alimentos los utilizan para fijar los precios de los productos básicos como el trigo o carne de res.
El mercado ya que funciona ahora '' se suma a un mayor costo para todos los estadounidenses '', dijo Gary Gensler, presidente de la Comisión de Negociación de Futuros de Materias Primas, que regula la mayoría de los derivados. Se necesita una mayor supervisión de los bancos en este mercado, dijo.
Pero los grandes bancos influyen en las normas que rigen los derivados a través de una variedad de grupos de la industria. último punto de la influencia de los bancos son las cámaras de compensación como el hielo Trust, que posee las reuniones mensuales con los nueve banqueros en Nueva York.
En virtud de la reforma financiera Dodd-Frank, muchos derivados se comercializan a través de dichas cámaras de compensación. El Sr. Gensler quiere disminuir el control de los bancos sobre estas nuevas instituciones. Pero los legisladores republicanos, muchos de los cuales recibieron grandes contribuciones a las campañas de los banqueros que quieren influir en cómo se escriben las reglas de derivados, dicen que van a hacer retroceder la mayor parte de la próxima reforma. El jueves, la comisión canceló una votación sobre una propuesta para que los precios sean más transparentes, aumentando la especulación de que el Sr. Gensler no tenía suficiente apoyo de sus colegas comisionados.
El Departamento de Justicia está investigando derivados, también. unidad antimonopolio del departamento está investigando activamente '' la posibilidad de prácticas contrarias a la competencia en los derivados de crédito de compensación, las industrias de servicios comerciales y de información '', según un portavoz del departamento.
De hecho, el mercado de derivados de hoy recuerda a algunos expertos del mercado de valores Nasdaq en la década de 1990. En aquel entonces, el Departamento de Justicia descubrió que los creadores de mercado Nasdaq fueron secretamente en connivencia para proteger sus propios beneficios. A raíz de ese escándalo, reformas y sistemas de comercio electrónico Nasdaq cortaron costes de negociación de valores a 1/20 de su nivel anterior - un enorme ahorro para los inversores.
'' Cuando se limita la participación en el gobierno de una entidad a unas pocas instituciones o personas afines que tienen interés en mantener a los competidores fuera, usted tiene el potencial para que ocurran cosas malas. Es antimonopolio 101 '', dijo Robert E. Litan, que ayudó a supervisar la investigación Nasdaq del Departamento de Justicia como ayudante de fiscal general adjunto y ahora es un miembro de la Fundación Kauffman. '' La historia de la negociación de derivados se ha crecido como una industria muy concentrada, y los viejos hábitos son difíciles de romper. ''
Los representantes de los nueve bancos que dominan el mercado se negaron a comentar sobre la investigación del Departamento de Justicia.
Compensación consiste en hacer el seguimiento de las operaciones y proporcionar un repositorio central para el dinero copias de esas apuestas. Una portavoz de Deutsche Bank, que se encuentra entre los más influyentes del grupo, dijo que este sistema reducirá los riesgos en el mercado. Dijo que el Deutsche se centra en garantizar que este proceso se pone en marcha sin interrumpir el mercado.
El portavoz de Deutsche También dijo que los bancos 'papel en este proceso ha sido un éxito, diciendo en un comunicado que el esfuerzo' 'es uno de los mejores ejemplos de asociaciones público-privadas.' '
Establecido, pero no pueden entrar
El Banco de los orígenes de Nueva York Mellon volver a 1784, cuando fue fundada por Alexander Hamilton. Hoy en día, que proporciona servicios administrativos en más de $ 23 billones de dólares de dinero institucional.
Recientemente, el banco ha estado tratando de entrar en el círculo interior del mercado de derivados, pero hasta el momento, se ha rechazado.
Funcionarios del Banco de Nueva York dicen que han sido frustrados por los competidores que controlan comités importantes en las nuevas cámaras de compensación, que se crearon a raíz de la crisis financiera.
Bank of New York Mellon ha estado tratando de convertirse en un denominado miembro compensador desde principios de este año. Sin embargo, tres de las cuatro cámaras de compensación principales le dijo al banco que su funcionamiento derivados tiene muy poco capital, y por lo tanto puede llegar a suponer un riesgo excesivo para el mercado en general.
El banco rechaza esa explicación tan absurdo. '' Nosotros no somos un don nadie '', dijo Sanjay Kannambadi, director general de BNY Mellon Clearing, una subsidiaria creada para entrar en el negocio. '' Pero no nos clasificamos. Ciertamente creemos que es una locura ''.
La verdadera razón por la que el banco está siendo excluido, dijo, es que los rivales quieren preservar sus márgenes de beneficio, y son ellos los que ayudaron a escribir las normas de adhesión.
El señor dijo Kannambadi Banco de los clientes de Nueva York pidió a entrar en el negocio de derivados porque creen que les están cobrando demasiado por los grandes bancos. Su entrada podría bajar las tasas. Otros que todavía tienen que ganar plena entrada al club de los derivados de negociación son la Calle State Corporation, y las casas de bolsa pequeñas como MF Global y Newedge.
Los criterios parecen arbitrarias, dijo Marcus Katz, vicepresidente de Newedge, que es propiedad de dos grandes bancos franceses.
'' Parece que los criterios de adhesión fueron fijados de manera que un cierto grupo de participantes en el mercado puede responder a este, y todos los demás tendrían que pasar por el aro '', dijo Katz.
El que nuevos derivados de cámara de compensación que ha acogido Newedge, Banco de Nueva York y los otros - NASDAQ - ha sido evitado por los grandes bancos de derivados.
Sólo los iniciados saben
¿Cómo grandes bancos llegado a tener tal influencia que pueden decidir quién puede competir con ellos?
Irónicamente, este desarrollo creció en parte por las preocupaciones durante el apogeo de la crisis financiera en 2008. Un problema importante durante la crisis fue que nadie - ni siquiera los reguladores del gobierno - entendido plenamente el tamaño y las interconexiones del mercado de derivados, en especial el mercado de los CDS, que aseguran contra incumplimientos de empresas o hipotecas bonos. El pánico provocado la necesidad de rescatar a American International Group, por ejemplo, que tenía C.D.S. contratos con muchos de los grandes bancos.
En medio de la confusión, los reguladores ordenaron a los bancos para acelerar los planes - mucho tiempo en la fabricación - para establecer un centro de información para manejar el comercio de derivados. La intención era reducir el riesgo y aumentar la estabilidad en el mercado.
Dos intercambios constató que las actividades materias primas y futuros, el Intercontinental Exchange, o ICE, y la Bolsa Mercantil de Chicago, establecieron centros de información, y, también lo hizo el Nasdaq.
Cada una de estas nuevas cámaras de compensación tenía que convencer a los grandes bancos a unirse a sus esfuerzos, y se repartieron pertenencia en sus comités de riesgos, que es donde se escriben las reglas de comercio, como un incentivo.
Ninguno de los tres centros de intercambio divulgó los miembros de sus comités de riesgo cuando se le preguntó por un reportero. Sin embargo, dos personas con conocimiento directo de la comisión de ICE dijo que los miembros del banco son: Thomas J. Benison de JPMorgan Chase & Company; James J. Hill, de Morgan Stanley; Athanassios DIPLAS de Deutsche Bank; Paul Hamill, de UBS; Paul Mitrokostas de Barclays; Andy Hubbard de Credit Suisse; Oliver Frankel de Goldman Sachs; Ali Balali de Bank of America; y Biswarup Chatterjee, de Citigroup.
Por medio de representantes, estos banqueros se negaron a discutir el comité o el mercado de derivados. Algunos de los portavoces observado que los banqueros tienen experiencia que ayuda a la cámara de compensación.
Muchas de estas mismas personas ocupan posiciones influyentes en otras cámaras de compensación, o en los comités en los poderosos Internacional de Swaps y Derivados Asociación, que ayuda a controlar el mercado.
Los críticos han llamado a estos bancos el '' operadores de derivados del club '', y advierten que el club es poco probable que renunciar a tierra fácilmente.
'' Los ingresos de estos comerciantes hacen en derivados es muy grande y lo que el incentivo que tienen que proteger esos ingresos es muy grande '', dijo Darrell Duffie, profesor de la Graduate School of Business de la Universidad de Stanford, quien estudió el mercado de derivados anteriormente este año con los investigadores de la Reserva Federal. '' Será difícil para los distribuidores para mantener su cuota de mercado si todo el mundo que pueda demostrar su solvencia está permitido en las cámaras de compensación. Por lo que están haciendo los argumentos que los demás no se debe permitir ''.
Tal vez nada que hacer en las finanzas es tan rentable hoy en día como los derivados. No hacer préstamos. No ofrecer tarjetas de crédito. No es el asesoramiento sobre fusiones y adquisiciones. No administrar el dinero para los ricos.
Suscribirse a:
Entradas (Atom)