Análisis de redes sociales

sábado, 12 de noviembre de 2016

La influencia de los bots en la elección americana

Cómo influyeron los bots políticos en esta elección

Casi el 20 por ciento de todos los tweets relacionados con las elecciones provienen de un ejército de influyentes robots.

Por Nanette Byrnes - MIT Technology Review

Si sus conversaciones políticas en las redes sociales parecen mecánicas y predecibles, podría ser porque está debatiendo con un robot.

Un estudio publicado el día antes de las elecciones encontró un estimado de 400.000 bots operando en Twitter que estaban twittando -y retweeted- a un ritmo notable, generando casi el 20 por ciento de todos los mensajes relacionados con las elecciones.

Además de ser numerosos, estos robots también son muy influyentes y capaces de distorsionar el debate en línea, según los autores Alessandro Bessi y Emilio Ferrara del Instituto de Ciencias de la Información de la Universidad del Sur de California.

Una cosa sigue siendo misteriosa: ¿quién los está creando? Eso es aún imposible de determinar, dijo Ferrara MIT Technology Review en una discusión sobre su estudio, llevado a cabo durante un mes este otoño, un período que incluyó los tres debates presidenciales. A continuación se muestra una transcripción editada.

En el estudio se mide la influencia de los bots, y encontrar que sea sorprendentemente alta. ŻPuedes explicar eso?

Medimos cuántas conexiones tiene una cuenta con otras cuentas y cuántos usuarios diferentes retweet esa cuenta. Lo que encontramos es que la gente no es muy buena para determinar si las fuentes de información a las que están expuestos son un humano o un bot. Los bots se están retweeted al mismo ritmo que los seres humanos. Dado que los bots son mucho más activos y producen [muchos más tweets] el subproducto es que están siendo retweeted mucho y se vuelven influyentes. Eso lleva a algunos problemas serios con retweeting-propagación de la desinformación, difusión de rumores, teorías de la conspiración, y así sucesivamente.

Este mapa del estudio muestra el volumen de tweets bots generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado, lo que indica que un estado, Georgia, es el mayor contribuyente.

Este mapa del estudio refleja el volumen de tweets humanos generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado. Muestra la conversación que es conducida por los estados más populosos, incluyendo California, Tejas, la Florida, Illinois, y Nueva York.

¿Espera que esto tenga un impacto en el resultado de las elecciones?

Es realmente difícil o incluso imposible hacer una interpretación de qué influencia tienen estas dinámicas en el resultado de la elección, la votación real y así sucesivamente. Una cosa en riesgo es la participación de votantes. Encontramos en algunos estados, en particular en el Sur y el Medio Oeste, hay mucho más bots que en cualquier otro estado. La gente podría pensar que hay un apoyo de base real allí, pero en realidad todo es generado por los bots.

Casi el 75 por ciento de los bots que encontró apoyaban al candidato republicano Donald Trump, y los mensajes en sus tweets eran diferentes.

Los bots que apoyan a Donald Trump están realmente produciendo una cantidad abrumadoramente grande de apoyo positivo para el candidato, mientras que en el caso de los partidarios de Hillary Clinton, más tweets son neutrales que positivos.

Los bots de medios sociales que se involucran en la política no es un fenómeno totalmente nuevo, pero usted encuentra que la hornada de este año es particularmente sofisticada.

Estos bots son más complejos, usando la inteligencia artificial para charlar con la gente. Pueden agregar el sentimiento en una discusión polarizada y quizás aún más polarizarlo.

Había sido más fácil identificar bots anteriores, pero ahora es increíblemente difícil para un humano hacer una determinación. Hice una prueba en mí mismo, y en algunas cuentas hay señales que son claras, como publicar 1.000 tweets por hora. En otros es más difícil. Parecen que se van a dormir [yendo fuera de línea por un período prolongado cada día]. Ellos tweet cinco, 10, 15 tweets en una fila, y luego ninguno durante una hora. Ellos clonan el comportamiento de las personas.

jueves, 10 de noviembre de 2016

Usando redes para escribir el resumen de literatura de la tesis doctoral

Barriendo Google Scholar para escribir su capítulo de literatura de doctorado
My Student Voices

Diagrama de red de autores clave en mi doctorado. Los enlaces representan citas y coautorías. Los colores son comunidades como lo indica la "modularidad". La clave indica algunas conjeturas aproximadas en lo que los autores de una comunidad tienen en común - en algunos casos hay un ajuste excelente (diseño participativo), en otros mucho menos (lila).

En un post anterior escribí sobre el diseño de un mejor sistema para la publicación académica. Un problema con el ecosistema de publicación comercial es que inhibe a quienes deseen desarrollar nuevas herramientas para navegar por el cada vez mayor cuerpo de investigación. (Por supuesto, también existe la clara injusticia de pedir a los contribuyentes que financien investigaciones que posteriormente no pueden leer).
Esta publicación trata de un prototipo de "red" para encontrar documentos usando datos de Google Scholar, con lo que se podría señalar lo que se podría hacer con datos más abiertos. Pude usar un programa supervisado buscando en Google Scholar para extraer mis datos, pero una versión escalable de esta herramienta requeriría datos abiertos.
También es rascar mi propia picazón: estoy en la etapa de mi doctorado donde necesito juntar todo. Necesito un capítulo de literatura que establezca el contexto teórico para mis cuatro estudios de caso, explicando lo que ya se ha escrito sobre mi tema y aclarando mis términos clave. En mi caso eso significa lo que se ha dicho sobre el tema del diseño participativo, la formulación de políticas, la acción colectiva y el análisis de redes sociales. (Mi título de trabajo es: ¿Cómo pueden los medios de comunicación social informar a la política del gobierno local?)
Hay cuatro áreas que conozco que juegan un papel en mi investigación:

Las ideas sociológicas sobre redes (Roland Burt y Mark Granovetter)
El trabajo de Elinor Ostrom sobre los bienes comunes
Diseño participativo
Ética / Política de Steven Lukes, Amartya Sen y John Rawls

¿Existen ya documentos que citen autores de todas estas áreas? ¿Puedo confirmar mi sospecha de que la literatura de diseño participativo casi nunca cita la ciencia política relevante, por ejemplo, la investigación de Steven Lukes sobre el poder o (otra de las ideas favoritas) de James Fishkin sobre la democracia deliberativa? Es hora de hacer algo de codificación ...

Construcción de un prototipo

Uso de Meteor (un paquete de JavaScript) Construí una aplicación web para recopilar datos de Google Scholar. Lo llamé Bibnet (código en github). El proceso comienza con un conjunto de términos de búsqueda que conozco los papeles de retorno que ya cito de Google Académico (lista de 55 términos de búsqueda aquí).
Con la lista de términos de búsqueda, Bibnet realiza dos pasos:

Bibnet registra cada artículo o libro que es devuelto por Google Académico (hasta 10 resultados por término) para cada uno de los términos de búsqueda. Esta información genera una lista de publicaciones en una base de datos. En la misma base de datos, también registra quién escribió cada publicación como una lista de autores.
Usando la "búsqueda dentro de las citas" de Google Scholar, verifica si alguno de los autores registrados en la base de datos ha citado alguna de las publicaciones.

Este proceso genera archivos que se pueden exportar a la herramienta de visualización Gephi.
De las 55 cadenas de búsqueda originales grabé 1120 autores, 1223 publicaciones y 1382 citas. (Lista legible de las citas)

Resultados

Para generar la imagen de abajo, exporté una lista de todos los autores y mostré enlaces entre ellos si habían coautorizado una publicación o si se habían citado. El tamaño de los nodos indica el número de enlaces entrantes, el grosor del borde indica el número de conexiones (citas y coauthoring) entre dos nodos.

La misma imagen que el encabezado, pero con los autores claves rodeados en rojo

Para que el gráfico sea legible, sólo muestro los nodos con más enlaces. Como se describe en el primer epígrafe, los colores representan algoritmicamente descubiertos 'comunidades' utilizando la función de Gefi- s de modularidad - grupos de autores que citan y coautorizan mucho. Estas comunidades son probablemente bastante dependiente del conjunto inicial de búsquedas, sin embargo, algunos de ellos tienen sentido intuitivo. La 'comunidad de diseño participativo', por ejemplo, está muy bien definida. La comunidad rosada son todos los autores que he estado viendo en el tema de la democracia deliberativa.
Por otra parte, S Lukes habría tenido más sentido para mí en la comunidad verde con RA Dahl, a quien su trabajo hace extensa referencia. De hecho, como indica la clave, no puedo decir lo que la comunidad de lilas indica con ningún grado de confianza - su existencia puede ser el resultado de mi muestreo selectivo de la red académica en general. La centralidad del grupo lila indica que son comúnmente referenciados por todos los otros grupos, y Arrow y Rawls son dos de los investigadores con mayor referencia en la red. Puede ser esta propiedad, más que una especialidad de sujeto, que los nodos de lila tienen en común.
Hay una serie de casos límite anómalos como este.

¿Cómo ayuda a escribir un capítulo de literatura?

Me siento más cómodo con el paisaje de mi investigación con la red como una visión general, y la intención de añadir nuevas referencias a medida que surgen. Algunas lecciones clave se destacaron:

Y Guo, un investigador que nunca he encontrado (y probablemente no habría hecho a través de mi enfoque normal) está haciendo una investigación similar a la mía y haciendo referencia a la misma mezcla ecléctica de fuentes.
Mi creencia anterior de que la comunidad de diseño participativo no hace referencia a Lukes ha resultado ser errónea. Mi opinión anterior se basaba en lo que yo pensaba que era una búsqueda sustancial, por lo que este fue un hallazgo sorprendente. Es difícil encontrar enlaces de citas usando un proceso manual cuando cualquier investigador de diseño participativo podría haber citado a Lukes.
La comunidad de diseño participativo es difícil de entender. Este enfoque me ha ayudado a concentrarme en Hillgren como un autor muy relevante, un autor que no conocía antes.
Estoy sorprendido (y complacido) de ver que Fishkin, que siempre parecía aislado para mí, está realmente bien integrado entre los autores que estoy haciendo referencia.
Estoy interesado en The making of the social world del filósofo John Searle como parte de mi investigación. Aunque el libro estaba en las búsquedas iniciales, y el trabajo de Searle es famoso y ampliamente referenciado, no apareció como un nodo bien conectado en mi red. Tal vez su investigación no es tan relevante como yo pensaba, o tal vez es una conexión que debe hacerse.
Bjorgvinsson es el nodo más grande de la red, lo que significa que tienen la mayoría de los enlaces entrantes. Sin embargo, su investigación no es de particular relevancia para la mía. 'Eyeballing' sugiere que Bjorgvinsson tiene muchas conexiones dentro del diseño participativo, pero poco alcance más amplio. Esta estructura de conectividad todavía nos dice algo sobre la comunidad, incluso si, como en este caso, puede que no sea algo que deba seguir.

Creo que un análisis más profundo podría revelar documentos menos citados que citan combinaciones interesantes de mis autores clave.
Este enfoque parece especialmente relevante para mi trabajo porque me estoy posicionando en relación con varias disciplinas. También parece importante en las humanidades más amplias, donde la búsqueda por palabra clave puede fallar al devolver resultados relevantes de otra disciplina con un vocabulario diferente.
Por último, debo reconocer en primer lugar que la red de citas no es la única manera de descubrir documentos, y también que Google Scholar es una fuente incompleta de datos en sí.

¿No es esto sólo un tipo avanzado de la dilación?

No le digas a mis supervisores.

martes, 8 de noviembre de 2016

Redes matrimoniales y el tabú del incesto

matrimonio consanguíneo
Mantenerlo en la familia

El matrimonio entre parientes cercanos es demasiado común

The Economist

MAHA SAAD ZAKI, profesor de genética clínica, lleva a Ahmed, Fátima y su familia a su habitación en el Centro Nacional de Investigación de Egipto. Al menos tres de sus seis hijos tienen una enfermedad neurológica rara que se manifiesta alrededor de los cuatro años, causando retraso mental, pérdida del uso de sus extremidades y, más tarde, muerte. La hija de nueve años de la pareja se desploma, temblando. Esta enfermedad congénita ha aparecido porque, además de ser marido y mujer, Ahmed y Fátima son también primos hermanos (sus nombres han sido cambiados).

Casos como estos son muy comunes en el Medio Oriente y el norte de África. Casarse con un pariente cercano incrementa notablemente la probabilidad de que ambos padres sean portadores de genes recesivos peligrosos, lo que puede causar enfermedad cuando un niño hereda una copia del gen de ambos padres, como ocurrirá en el 25% de los casos. La gama de estas enfermedades va desde las conocidas como la microcefalia (en la que los niños tienen cabezas inusualmente pequeñas), la fibrosis quística y la talasemia, un trastorno sanguíneo, hasta trastornos completamente nuevos. "El noventa por ciento de los casos que veo son causados por matrimonios consanguíneos", dice la Sra. Zaki.

Las estadísticas sobre la prevalencia de matrimonios entre parientes cercanos hoy en día son escasas. Una vez que la práctica común en las sociedades occidentales, las estimaciones sugieren que el Oriente Medio, junto con África, siguen teniendo los niveles más altos del mundo. En Egipto, alrededor del 40% de la población se casa con un primo; La última encuesta realizada en Jordania, en 1992, encontró que el 32% estaba casado con un primo hermano; Otro 17,3% estaban casados con parientes más distantes. Se cree que las tasas son aún más altas en países tribales como Irak y los estados del Golfo de Arabia Saudita, Yemen y Kuwait.

Hoy la primera razón por la que los hombres y las mujeres buscan casarse dentro de la familia es porque saben mucho de sus parientes: quiénes son, qué ganan, qué errores pasados. Y las familias grandes significan que tienen muchos de ellos. "La gente está buscando la ética y las costumbres", dice Atef al-Shitany, del Ministerio de Salud de Egipto. Atar el nudo dentro también asegura la propiedad permanece en la familia. En Egipto superior, una zona agrícola rural, las tarifas son las más altas de Egipto.

A diferencia de Occidente, no hay estigma social; todo lo contrario. Una mujer egipcia de 38 años, que tiene dos hijos con micro-síndrome (que causa cataratas, pequeños genitales y dificultades de aprendizaje) debido a su matrimonio con un primo, dice que los familiares la critican por permitir que su hija de 18 años Para comprometerse con un "extraño" -el prometido no es una relación.

Muchos piensan erróneamente que los primos maternos no son parientes de sangre. La creencia islámica prevalente refuerza el matrimonio mixto, aunque también sucede entre los cristianos. El Corán permite el matrimonio a cualquier persona, pero los padres, hermanos, tías y tíos, sobrinos y sobrinas. De hecho, Fátima, la hija de Muhammad, se casó con su primo, Ali Ibn Abi Talib, señala Ahmed Mamdouh de Al Azhar, una universidad egipcia.

Muchos en la región, sin embargo, simplemente no saben de los riesgos de casarse con un miembro de la familia. Una pequeña encuesta realizada en Arabia Saudita encontró que los participantes eran 50% menos propensos a ver casarse con un primo de manera positiva cuando se les advierte de los problemas. "No nos habríamos casado si hubiéramos sabido", dice Ahmed.

Para reducir los trastornos genéticos, algunos países han hecho pruebas de sangre obligatoria para los novios, que han ayudado a reducir la incidencia de enfermedades como la anemia de células falciformes. En Túnez, el gobierno ordena consejería prematrimonial para todos los prometidos a un pariente.

En Egipto, donde la educación es a menudo rudimentaria, hay mucho más trabajo por hacer. Las parejas que conocen los riesgos a menudo creen-a veces porque su médico les dice que-los análisis de sangre básicos descartan el riesgo de cualquier enfermedad genética. "La única forma de evitar el sufrimiento no es casarse con parientes", dice Zaki. "Pero eso será imposible de lograr aquí."

domingo, 6 de noviembre de 2016

Bibliometría: Índice H

Índice h
El índice h es un sistema propuesto por Jorge Hirsch, de la Universidad de California, para la medición de la calidad profesional de físicos y de otros científicos, en función de la cantidad de citas que han recibido sus artículos científicos. Un científico tiene índice h si ha publicado h trabajos con al menos h citas cada uno.

h-index de un gráfico de citas decrecientes de papers numerados.

Definición

El índice h se calcula con base en la distribución de las citas que han recibido los trabajos científicos de un investigador. Al respecto, Hirsch dice:

Un científico tiene índice h si el h de sus Np trabajos recibe al menos h citas cada uno, y los otros (Np - h) trabajos tienen como máximo h citas cada uno.1
Explicado de otro modo, si el factor h vale n, entonces n publicaciones han sido citadas más de n veces. Para hallarlo, basta ordenar los artículos de un autor o grupo por número de veces que han sido citados de mayor a menor, e ir recorriendo la lista hasta encontrar la última publicación cuyo número correlativo sea menor o igual que el número de citas: ese número correlativo es el factor h.

Así, el índice h es el balance entre el número de publicaciones y las citas a estas. El índice se diseñó para medir eficazmente la calidad del investigador, a diferencia de sistemas de medición más sencillos que cuentan citas o publicaciones, donde se hace una distinción entre aquellos investigadores que tienen una gran influencia en el mundo científico de aquellos que simplemente publican muchos trabajos. El índice funciona eficazmente solamente entre científicos del mismo campo, pues los mecanismos convencionales para citar los trabajos difieren entre cada uno de estos.

Hay programas en línea para calcular el índice h de un científico. También los índices h se pueden calcular manualmente, basándose en bases de datos accesibles en Internet, como Google Scholar, como una alternativa al tradicional factor de impacto de revistas a las que no se puede acceder libremente. Hirsch ha demostrado que h tiene importantes capacidades predictivas en relación con los honores que un científico pueda recibir o haya recibido, tales como el Premio Nobel. En física, un científico considerado productivo tiene un h por lo menos igual a la cantidad de años que lleva trabajando, mientras que en la ciencia biomédica estos valores son generalmente más altos.

Ciencias de la Computación Índice H significa 23, mediana 21
Psicología índice H significa 26, mediana 19
Enfermería Índice H media 20, mediana 18
Ciencias Sociales Índice H significa 19, mediana 16
Física / matemáticas H-índice media 23, mediana 22
Bio-medicina índice H significa 28, mediana 25

Ventajas

La principal desventaja de los viejos indicadores bibliométricos, tales como el número total de artículos o el número de citas es que en la primera medida no se aprecia la calidad de las publicaciones científicas, y la segunda se ve afectada desproporcionadamente por grupos que tienen pocas publicaciones y, sin embargo, un número grande de citas. El índice h pretende medir simultáneamente la calidad y la cantidad de la producción científica.

El índice h también puede calcularse como una función dependiente del tiempo, de dos modos distintos. Originalmente, Hirsch propuso que h dependía linealmente de los años que se llevara investigando. En este caso se podían comparar científicos de edades distintas. Otra posibilidad es calcular h usando artículos publicados dentro de un período específico, por ejemplo, en los últimos 10 años. De este modo se mide la productividad actual.

Críticas

No es muy difícil comprender que el índice h puede llevar a confusiones en cuanto a la importancia de un científico porque, al estar limitado por el número de publicaciones totales, un científico de corta carrera está en clara desventaja y no se considera la importancia de sus primeros trabajos en una medida correcta. Por ejemplo, el índice h de Évariste Galois es 2, y se quedará así por siempre, independientemente del impacto de su trabajo. Adicionalmente, algunas desventajas del factor de impacto se aplican a la vez al índice h. Por ejemplo, los artículos de revisión suelen tener mayor cantidad de citas que los artículos originales, así que un autor hipotético que solamente escribiera revisiones obtendría un índice h mayor que el de los científicos que aportan trabajos originales.

Finalmente, se ha observado que el índice h aminora drásticamente la importancia de trabajos singulares, dando valor a la productividad. En efecto, dos científicos pueden tener el mismo índice h (30, por ejemplo), siendo que uno de ellos escribió un trabajo con 200 citas y el otro no ha escrito ninguno con más de 30. Se han hecho varias propuestas para modificar este error evidente, pero ninguno se ha adoptado a nivel internacional.2 3

domingo, 30 de octubre de 2016

Modularidad en redes de células madres

Mapa de modularidad de la red de la diferenciación celular humana
Viviane Galvão, José G. V. Miranda, Roberto F. S. Andradeb, S. José Andrade Jr., Lazaros K. Gallose, y Hernán A. Maksee,

PNAS

Resumen

La diferenciación celular en los organismos multicelulares es un proceso complejo, cuyo mecanismo puede ser entendido por un enfoque reduccionista, en el que se identifican los procesos individuales que controlan la generación de diferentes tipos de células. Como alternativa, un enfoque a gran escala en busca de diferentes características organizativas de las etapas de crecimiento promete revelar su estructura global modular con el objetivo de descubrir las relaciones antes desconocidas entre tipos de células. En este sentido, clasificar y analizar un gran conjunto de datos dispersos para la construcción de la red de la diferenciación de células humanas (NHCD) basado en tipos de células (nodos) y etapas de diferenciación (links) desde el huevo fertilizado a un ser humano desarrollado. Descubrimos una ley dinámica de ramificación crítico que revela una regularidad auto-similares en la organización modular de la red, y nos permite observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células después de una organización jerárquica, que van desde los sub-módulos a los super-módulos de tejidos y órganos especializados en distintas escalas. Este descubrimiento permitirá a uno para tratar el desarrollo de una función celular particular en el contexto de la compleja red de desarrollo humano como un todo. Nuestros resultados apuntan a una visión integrada a gran escala de la red de tipos de células que revela sistemáticamente vínculos entre dominios previamente no relacionados en las funciones orgánicas.

El proceso de diferenciación celular juega un papel crucial en el desarrollo prenatal de los organismos multicelulares. Los recientes avances en la investigación sobre las propiedades de células madre y el desarrollo embrionario han descubierto varios pasos en el proceso de diferenciación (1-7). secuencias únicas y múltiples de la diferenciación celular han sido identificados a través de observaciones in vivo de un embrión en particular durante las primeras etapas de desarrollo, así como estudios de patología de abortos involuntarios durante las etapas finales del proceso. Mientras que la identificación de cada paso de la diferenciación celular ha sido objeto de una intensa investigación, una visión integrada de este complejo proceso sigue desaparecido. Tal punto de vista mundial promete revelar características asociadas con la organización modular a gran escala de los tipos de células (5-12) con el fin de descubrir los módulos funcionales entre tipos de células mediante el uso de análisis de redes teórico para la detección de la comunidad (9-11). En esta carta, nos aprovechamos de los conocimientos actuales sobre la secuencia de los procesos de diferenciación celular que se extiende sobre una vasta literatura especializada (1-6, 13-27) (SI Apéndice), para revelar y caracterizar las características topológicas y dinámicas asociadas con la red de la diferenciación celular humana (NHCD).

I. Resultados

Construimos la NHCD recopilando sistemáticamente la información dispersa sobre la evolución de cada tipo de célula presente en el embrión y el feto a partir de un antecesor con un mayor grado de potencial de diferenciación en un tipo más especializado. El proceso de diferenciación de las células es luego mapea en una red compleja que consta de 873 nodos conectados a través de 977 bordes. Los nodos de la red representan distintos tipos de células descritos en la literatura (1-6, 13-27) y los bordes representan la asociación entre dos tipos de células a través de un evento de diferenciación.

Los pasos iniciales de la NHCD se muestran en el recuadro de la Fig. 1, mientras que la estructura de la red resultante se muestra en el panel principal de la fig. 1 (SI Apéndice). El óvulo fertilizado es seguido por la etapa de la bola, y la formación de las capas de células germinales primarias. Actualmente, se sabe que hasta el punto de bola, la división celular es simétrica y produce más células madre totipotentes (1). Estas células dan lugar a todos los tejidos diferenciados del organismo, así como los tejidos extraembryonic (placenta, el cordón umbilical, etc.). Por otra parte, en el transcurso de todo el proceso de formación organismo, hay una disminución monotónica en el potencial de diferenciación (totipotentes → pluripotentes → multipotentes → unipotentes células) acompañado con un aumento de la especialización celular.

Fig. 1.
Representación de red compleja del proceso de diferenciación de la célula humana. Los primeros pasos de la construcción NHCD se muestran en el recuadro de esta figura. Estos pasos, que se sabe que está presente en la formación de la mayoría de los organismos multicelulares, incluyen la primera escisión de un huevo fertilizado, es decir, posteriormente, seguido de la etapa de la bola y la formación de capas de células germinales primarias, a saber, el ectodermo , mesodermo, endodermo y. El óvulo fecundado es una célula madre totipotentes. El blastocisto, a su vez, da lugar, simultáneamente trofoblasto y la masa celular interna. Estas dos células se diferencian más en otros tipos de células, y así sucesivamente. Siguiendo el proceso anterior hasta que el feto está completamente desarrollado produce el complejo de red que se muestra en esta figura. Cada nodo, representa como un círculo, corresponde a un tipo de célula y los bordes a un paso diferenciación. Toda la red se origina a partir del óvulo fecundado (indicado por un cuadrado rojo) y conduce a las células especializadas de un ser humano desarrollado. Círculos rellenos corresponden a los nodos que sobreviven al final del proceso de desarrollo, mientras que los círculos vacíos corresponden a tipos de células no sobrevivieron. Los nodos en las comunidades de funciones conocidas de la literatura se indican con diferentes colores, a excepción de aquellos tipos de células sin anotación funcional (ver Apéndice SI y el conjunto de datos S1 para la asociación de las funciones conocidas de C1 a C19 extraídos de la literatura).

Ciertos tipos de células pueden obtenerse tras más de un camino desde el óvulo fertilizado. Este proceso genera algunos bucles cerrados de los bordes de la red. El NHCD comprende 529 sucursales de diferentes longitudes con cada rama termina cuando los tipos de células no se someten a una mayor diferenciación. Nótese, sin embargo, que la más reciente compilación de tipos de células en adultos normales, sanos, humanos realizados en (6) informa de sólo 407 tipos de células. Por lo tanto, no todos los puntos finales de la rama corresponden a tipos de células en los seres humanos nacidos. Por lo tanto, no todos los 873 tipos de células están presentes en un ser humano. Entre los ausentes son las células de la placenta que se generan a partir del huevo fecundado durante el desarrollo embrionario, así como otros tipos de células somáticas que son importantes para el control de embrión y el desarrollo del feto. Los tipos de células que sobreviven en un ser humano se indican mediante círculos rellenos, mientras que los que no sobrevivieron se indican por círculos vacíos. Los datos recogidos completas se enumeran en el Apéndice SI y el conjunto de datos S1, incluyendo una enumeración de las células y los vínculos entre los tipos de células, su tiempo de aparición en días después de la fecundación (Ta), y la referencia a las publicaciones de informes de cada enlace. A lo mejor de nuestro conocimiento, la estructura identificada aquí proporciona el diagrama esquemático más completa del proceso de diferenciación humana hasta la fecha.

Es visualmente evidente de la figura. 1 que la NHCD tiene una estructura modular prominente. La diferenciación continua de células en funciones más especializadas conduce naturalmente a la formación de agrupaciones aisladas denso en el NHCD. Como una primera aproximación para entender esta estructura modular, agrupamos tipos de células en la red de la figura. 1 de acuerdo con sus funciones conocidas; diferentes colores indican 19 módulos funcionales extraídos de la bibliografía (C1-C19) (SI Apéndice). Las comunidades más numerosas fueron extraídos de los árbitros. 1-6, 13-27. Hay, sin embargo, un cierto grado de arbitrariedad en esta estructura modular como la separación de los nodos en comunidades en nuestro conjunto de datos no es única. Por ejemplo, la comunidad C12, el linaje neural, se podría dividir en dos subcomunidades, que representa la las células de apoyo (gliales) (1-3, 5, 6, 13,14) y neural. Por otra parte, el módulo de sistema neural podrían fusionarse con el módulo de sistema de ojo (1, 5, 6, 13) en una escala más grande, ya que tienen un tipo de célula ancestral común. Por lo tanto, una más fina o más gruesa estructura de la comunidad se pueden extraer de los datos cuando nos fijamos en toda la red en diferentes escalas de observación; Se necesita un algoritmo de módulo de detección modificado para identificar estas comunidades de una manera sistemática.

Conceptos teóricos de grafos nos permiten desentrañar la dependencia escala de la estructura modular de la NHCD. La teoría de grafos (11) define la distancia entre dos nodos (también llamados la distancia química) como el número de enlaces a lo largo de la ruta más corta entre los nodos de la red. Utilizamos esta idea de proponer un algoritmo de detección de la comunidad que identifica los módulos de tamaño ℓ compuesta de tipos de células altamente conectadas. El algoritmo encuentra el alicatado óptima de la red con el menor número posible de módulos, NB, de ℓ tamaño (12) (cada nodo se le asigna a un módulo o caja y todos los nodos en un módulo están a una distancia menor que ℓ). Este proceso resulta en un problema de optimización que se pueden resolver mediante el uso del algoritmo de caja que cubre explican en la figura. 2A, Materiales y Métodos Sección III y reportado en la referencia 28 como el máximo Excluidos misa Burning algoritmo (MEMB, el algoritmo se puede descargar desde http://lev.ccny.cuny.edu/~hmakse/soft_data.html). El requisito de un número mínimo de módulos para cubrir la red (NB) garantiza que la partición de la red es tal que cada módulo contiene el mayor número posible de nodos y enlaces dentro del módulo con la restricción de que los módulos no pueden exceder ℓ tamaño. Este proceso embaldosado optimizado da lugar a módulos con el menor número de enlaces que conectan con otros módulos lo que implica que el grado de modularidad, definida por (9-11, 29)

Formula

se maximiza. Aquí

representan el número de enlaces que se inician en un determinado módulo I y terminan ya sea dentro o fuera de i, respectivamente. Los grandes valores de

(

) se corresponden con un mayor grado de modularidad. El valor de la modularidad de la red gráfico varía con ℓ, por lo que podemos detectar la dependencia de modularidad en diferentes escalas de longitud, o de manera equivalente la forma de los propios módulos se organizan en módulos más grandes que mejoran el grado de modularidad.

Fig. 2.
La detección de los módulos y de la red de módulos a diferentes escalas. (A) Demostración de que el algoritmo de caja cubre para una red esquemática, siguiendo el algoritmo MEMB en refs. 12 y 28 (SI Apéndice). Cubrimos la red con el menor número posible de cajas para un valor dado ℓ. Esto se hace en un proceso de dos etapas: (i) Se detecta el número más pequeño posible de los orígenes de la caja (que se muestra con el color cian) que proporcionan el número máximo de nodos (en masa) en cada cuadro, de acuerdo con el siguiente algoritmo de optimización: Nos calcular la masa asociada a cada nodo, y escoger el primer centro como el nodo con la masa más grande y marcar los nodos de este cuadro como con etiqueta. Repetimos el proceso desde los nodos restantes no centros para identificar a un segundo centro de la más alta masa, y así sucesivamente. (Ii) Construimos las cajas a través de la quema simultánea de estos nodos centrales hasta que toda la red se cubre con cajas. Por ejemplo, en ℓ = 3 hay cuatro cajas, donde la distancia máxima entre dos nodos en una caja es menor que ℓ. Del mismo modo, podemos cubrir la misma red con dos cajas en ℓ = 6. Estos dos cuadros son el resultado de la fusión de dos de las cuatro cajas en ℓ = 3. (B) Detalle de los módulos NHCD detectados por el algoritmo anterior en forma de caja que cubre de dos funciones particulares. El algoritmo detecta una jerarquía de sub-módulos, funciones conocidas y super-módulos de tamaño ℓ representa en diferentes colores. Mostramos los módulos identificados correspondientes al sistema de C12-C13 y el sistema neuronal de ojos (Fig. 2C y SI Apéndice) que aparecen por primera vez en ℓ = 15 y ℓ = 11, respectivamente. En otras escalas el algoritmo de caja que cubre detecta nuevas relaciones funcionales entre tipos de células expresadas en la sub obtenida y super-módulos. Por ejemplo, en ℓ = 11 el linaje neural se divide en dos sub-módulos, mientras que en ℓ = 19 las dos funciones se funden en un módulo de super. (C) La red de módulos a diferentes valores de l, detectada a través del algoritmo de caja que cubre. Cada nodo corresponde a uno de los tres tipos siguientes, en términos de aumento de escala: (i) Los sub-módulos (pequeños puntos grises) que son fracciones de un módulo totalmente funcional, (ii) Conocido módulos biológicos funcionales (círculos de colores), cuya color corresponde a las funciones de C1-C19, y (iii) Grandes módulos (gráficos circulares) que representan la unión de más de un módulo funcional conocido, descrito por los colores del gráfico circular. Los enlaces que se derivan de los módulos funcionales conocidos y super-módulos se muestran en rojo, y que se extienden progresivamente toda la red a medida que aumentamos ℓ.

Para una ℓ dado, se obtiene la cobertura óptima de la red con los módulos de NB [utilizamos el algoritmo MEMB (28) se explica en la Fig. 2A y Materiales y Métodos]. Análisis de la modularidad (Ec. 1) en la Fig. 3A muestra un aumento monotónico de

con la falta de un valor característico de ℓ. De hecho, los datos pueden ser equipados con aproximadamente una forma funcional de ley de potencia:

Formula

que se detecta a través de la modularidad dM exponente. Nos caracterizamos la red mediante el uso de diferentes instantáneas en el tiempo y nos encontramos con que dM ≃ 2.0 es aproximadamente constante a lo largo de la evolución en el tiempo (Fig. 3A). Este valor pone de manifiesto un considerable grado de modularidad en todo el sistema [para la comparación, una red aleatoria tiene dM = 0 y un retículo uniforme tiene dM = 1 (29)], como se evidencia por la estructura de red en la Fig. 1. La falta de una característica escala de longitud en la modularidad se muestra en la Fig. 3A sugiere que los módulos aparecen en todas las escalas de longitud, es decir, los módulos se organizan dentro de los módulos más grandes de una manera auto-similar, de modo que las interconexiones entre los grupos repiten el carácter modular básica de toda la NHCD. Por lo tanto, la NHCD sigue siendo estadísticamente invariable cuando se observan a diferentes escalas. Variando el tamaño del módulo ℓ rendimientos la relación de escala para el número de módulos (Fig 3B.):

Formula

donde dB representa la dimensión fractal de la red (12). Nos encontramos con que el carácter fractal de los módulos se establece en las primeras etapas, produciendo 1,4 dB ≃ ya en 30 d (Fig. 3B). Como evoluciona la red, aumenta la dimensión fractal alcanza ligeramente y finalmente dB ≃ 1,9.

Fig. 3.
Propiedades modulares del NHCD. (A) Grado de modularidad de la red,

, en diferentes momentos, t (indicado en la figura), como una función de la escala de observación, ℓ. (B) Número de cajas / módulos, NB, en comparación con el tamaño de los módulos, ℓ, identificado por el algoritmo de caja que cubre por diferentes redes en el tiempo t.

El significado de la ecuación. 2 es que los módulos deben ser interpretados en una escala de longitud dada. La Figura 2B muestra un ejemplo de tal organización jerárquica (Fig. 2C y la SI Apéndice muestran la estructura modular completo, mientras que una lista de módulos detectado aparece en conjunto de datos S2). Hay tres tipos de comunidades de tipos de células se identifican claramente en la Fig. 2B a medida que cambie ℓ. (I) Los módulos funcionales conocidos: Todo el linaje de los ojos (1, 5, 6, 13) se detecta como un único módulo por el algoritmo de caja que cubre al ℓ = 11, mientras que todo el linaje neuronal (1-3, 5, 6, 13, 14) aparece en ℓ = 15. Finer y módulos más gruesas son identificados por el algoritmo. (Ii) sub-módulos: En ℓ = 11 el linaje neural se divide en la neural principal y los módulos de células gliales de apoyo, mientras que para ℓ se identifican = 7 sub-módulos en el sistema del ojo. (Iii) Grandes módulos: Cuando se aumenta la longitud de ℓ = 19, el ojo y el sistema neural forman un único super-módulo. Por lo tanto, cada tipo de célula está conectado a otros tipos de acuerdo en que los grupos de nodos de todos los tamaños auto-organizarse después de un solo principio. Esta propiedad nos permite renormalizar la red (12) mediante la sustitución de cada módulo detectado por un solo supernode para identificar la red de módulos como se muestra en la Fig. 2C. Siguiendo la evolución y la interdependencia de estos super-módulos, como se ve en la Fig. 2C, identifica las familias de los tipos de células en diferentes escalas. Este mapa de la modularidad es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en las funciones orgánicas.

La dinámica que conducen a una estructura de este tipo pueden desenmarañarse por el estudio de la NHCD como un proceso de crecimiento. El conocimiento del tiempo de aparición de cada tipo de célula, Ta, hace posible seguir el crecimiento acumulado del embrión y el feto en términos del número total de tipos de células en el momento t, N (t), así como el número de tipos de células que sobreviven el tiempo en el organismo (Fig. 4A). Como se esperaba, las células supervivientes surgen en las etapas posteriores del período de gestación. Sin embargo, la diferencia entre el total y el número de tipos de células supervivientes indica que la generación de nuevos tipos de células que no sobrevivieron tiene lugar incluso durante los meses de gestación finales.

Fig. 4.
Propiedades de crecimiento de la NHCD. (A) Número de tipos de células en la red, N (t), como una función del tiempo. Nos encontramos con información precisa sobre el tiempo de aparición, Ta, por 782 entre los 873 tipos de células. Esas células con apariencia tiempo que falta no se han tenido en cuenta en esta parcela. También se muestra la evolución temporal del número de células sobrevivientes y no sobrevivientes. (B) Número de nodos cuyos aumentos grado en el tiempo t (Red de histograma) y el número de nuevos enlaces que aparecen en la red (azul histograma) como una función del tiempo. Si todos los nodos estaban dando sólo un niño entonces los dos histogramas coincidirían. Recuadro: El número medio de nuevos enlaces por nodo en un momento dado se puede encontrar dividiendo los dos histogramas en la trama principal. Este gráfico muestra la intensidad de la actividad es en ese momento en particular. A pesar de la variación en la actividad, la nueva conexiones promedio alrededor de uno que da una relación de derivación crítica de <k> ≃ 2. (C) Número de tipos de células en comparación con la distancia química al primer nodo, ℓN1. Esta distancia se determina solamente por las conexiones entre los tipos de células y no se ve influenciada por el tiempo de aparición de modo que incluimos todos los 873 tipos de células. (D) Promedio grado <k> de la red como una función del tiempo que muestra que la red alcanza el estado de proceso de ramificación crítico <k> ≈ 2 a alrededor de T * = 40 días.

El aumento de tamaño de la red, N (t), es inicialmente aproximadamente exponencial y después de t * = 40 días cambia en un crecimiento más lento (Fig. 4A). Sólo un pequeño porcentaje de los nodos de crecer dentro de un intervalo de tiempo dado de manera que la actividad de la red se centra en un pequeño número de ellos en un momento dado. El número de nodos que se diferencian en un momento dado se muestran en la Fig. 4B. Observamos una actividad que aumenta monótonamente hasta alrededor de t * = 40 días y luego se reduce a valores más bajos. El cruce de tiempo T * = 40 días observarse en la Fig. 4A y B separa dos regímenes de crecimiento y corresponde aproximadamente a la vez debajo de la cual la mayor parte de las células tienen una característica de plástico (es decir, la capacidad para diferenciar) y por encima del cual empiezan a ser funcional (1). Curiosamente, los dos regímenes observados en N (t) se funden en una sola curva funcional universal cuando nos Replot N (ℓN1) como una función de la distancia químico para el huevo fertilizado, ℓN1 (Fig. 4C). Este resultado sugiere que la distancia topológica en la red ℓN1 es la variable natural para caracterizar el proceso de crecimiento en una forma universal en lugar del tiempo. La dinámica de N (ℓ) sigue un proceso logístico típica (Verhulst) de crecimiento de la población, donde la tasa de crecimiento está restringido por las limitaciones ambientales:
Formula

con una solución,
Formula

(Véase el accesorio en la Fig. 4C), donde NF es el número final de tipos de células y r = 0,65 es la tasa de crecimiento de tipos de células.

El análisis de la conectividad de red revela que el número medio de enlaces por nodo en la etapa final de todo el NHCD es <k> = 2,24 (Fig. 4D). A pesar de que <k> ≈ 2, existe una amplia distribución de grado [libres de escala (11), P (k) ~ k-γ, γ ≃ 3.0 y Apéndice SI]. Esto implica que siempre hay un pequeño número de tipos de células cruciales que diferencian mucho más que los otros, un hecho que está de acuerdo con la evidencia de la existencia de unas pocas células con gran potencial de plasticidad. Como este potencial se pierde rápidamente después de 40 d, tipos de células cambian su capacidad de desarrollo a favor de la vida de mantenimiento organismo.

El hecho de que el grado medio está cerca de dos implica que la evolución dinámica de NHCD puede ser descrita por un proceso crítico de ramificación en el que cada nodo tiene una cierta probabilidad de descendientes de generación, en cuyo caso el estado crítico para la ramificación de continuar es <k > = 2 (30). Esto significa efectivamente que cada nodo tiene que dar al menos un descendiente de la red para seguir creciendo. Si <k> <2, el crecimiento se detiene pronto, mientras que para <k>> 2 el crecimiento sería más rápido que exponencial.

La red alcanza la condición de criticidad, <k> ≈ 2, alrededor de t * = 40 días (Fig. 4D), en relación con la transición de la plasticidad de comportamiento funcional. Después de esto, el grado medio se mantiene justo por encima de la criticidad de sostener una tasa de crecimiento que garantice la supervivencia de la red. La mayoría de los nodos propagar el crecimiento en una sola línea, pero hay nodos que generan significativamente más descendientes para generar la diversidad implícitos en las distribuciones de ley potencial de grado y modularidad.

II. Discusión

En resumen, presentamos un estudio a gran escala de la evolución prenatal del proceso de diferenciación celular humana desde el óvulo fertilizado a un ser humano desarrollado. El proceso de diferenciación de células humanas se puede asignar a una red compleja compuesta de tipos de células y etapas de diferenciación. Este mapeo permite estudiar el proceso de diferenciación de las células con el estado de la teoría de redes técnica para la detección de la comunidad con el objetivo de identificar las relaciones funcionales hasta ahora desconocidas entre tipos de células.

Descubrimos una ley dinámica de ramificación crítico explicar la aparición de la topología de red que revela una estructura modular invariante en escala de la red de tipos de células. Las características modulares auto-similares evidenciaron en las figuras. 1, 2, y 3 se establecen al principio del proceso y permanecen invariables durante la evolución de la NHCD, aunque el tamaño de la red cambia de manera significativa.

Mediante el uso de esta ley, somos capaces de observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células, o módulos, y su conectividad a otros módulos dentro de sus propias y otras funciones. La organización jerárquica resultante consiste en sub-módulos, funciones biológicas conocidas, y super-módulos de tejidos y órganos especializados emergentes en escalas diferentes. Este descubrimiento es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en funciones de los órganos de una manera sistemática. Además, esta información podría ser de importancia en el suministro de predicciones de atributos funcionales a un número de módulos identificados de tipos de células en la NHCD.

III. Materiales y métodos

La detección de los módulos o cajas en nuestro trabajo se sigue de la aplicación del algoritmo de caja de cubierta (12, 28) a diferentes tallas escalas. El algoritmo se puede descargar en http://lev.ccny.cuny.edu/~hmakse/soft_data.html. En el cuadro que cubre asignamos cada nodo a un módulo, al encontrar el mínimo número posible de cajas, NB (ℓ), que cubre la red y cuyo diámetro (que se define como la distancia máxima entre dos nodos en este cuadro) es menor que ℓ . Estas cajas se caracterizan por la proximidad entre todos sus nodos, a una longitud de escala dada. Diferentes valores de las cajas de la caja de diámetro rendimiento ℓ de diferente tamaño. Estas cajas se identifican como módulos que a escala, ℓ más pequeño, pueden separarse, pero se funden en entidades más grandes a medida que aumentamos ℓ.

En este trabajo ponemos en práctica la máxima Excluidos misa Burning (MEMB) algoritmo a partir de (28) para la caja de cubierta. El algoritmo utiliza la idea básica de la optimización de la caja, donde se requiere que cada caja debe cubrir el máximo número posible de nodos, y funciona de la siguiente manera: Para una ℓ dada, en primer lugar localizar los nodos óptimos "centrales" que actuarán como los orígenes para las cajas. Esto se hace calculando primero el número de nodos (llamada la masa) dentro de un ℓ diámetro de cada nodo. El nodo que produce la masa más grande está marcado como centro. Luego marcamos todos los nodos de la caja de este nodo central como "etiquetado". Repetimos el proceso de cálculo de la masa de las cajas a partir de todos los nodos noncenter, e identificamos un segundo centro de acuerdo con la masa restante más grande, mientras que los nodos en el cuadro correspondiente etiquetados, y así sucesivamente. Cuando todos los nodos son o centros o etiquetados hemos identificado el número mínimo de centros que pueden cubrir la red en el valor ℓ dado. A partir de estos centros como orígenes de la caja, que luego grabar simultáneamente las cajas de cada origen hasta que toda la red está cubierto, es decir, cada nodo se le asigna a una caja [llamamos a esto quema proceso, ya que es similar a la quema de los algoritmos desarrollados para investigar la agrupación estadísticas en teoría de la percolación (11)]. En la Fig. 2A se muestra cómo la caja que cubre las obras de una red simple en dos valores diferentes l.

Este algoritmo es impulsado por la proximidad entre los nodos y la maximización de la masa asociada con cada centro de módulo (12, 28). Por lo tanto, detecta cajas que maximizan la modularidad (Ec. 1). En el caso de MEMB, tenemos la ventaja adicional de detección de módulos a diferentes escalas para que podamos estudiar el carácter jerárquico de la modularidad, es decir, los módulos de los módulos, y podemos detectar si la modularidad es una característica de la red que se mantiene escala- invariante.

La dimensión fractal dB de una compleja red es un exponente que determina cómo la masa (de forma equivalente: el número de nodos) en torno a cualquier nodo dado se escala con la longitud que en las redes corresponde a la distancia más corta entre dos nodos. Para medir numéricamente este exponente cubrimos de manera óptima la red con las cajas utilizando el algoritmo de MEMB. Un cuadro es un conjunto de nodos en los que todas las distancias ℓij entre dos nodos i y j en este conjunto son más pequeños que un valor dado de ℓ, el tamaño de la caja. Aunque hay un gran número de cubiertas, para cada valor de ℓ queremos encontrar el que le da el menor número posible de cajas, NB (ℓ). Variando ℓ produce entonces la relación de escala (Ec. 3). Una dimensión finita fractal revela los principios fundamentales de la organización de la red subyacente, es decir, un carácter estructural auto-similares, donde la red se construye de una manera similar a pesar de que lo observamos en diferentes escalas de longitud-. Las cajas que son identificados a través de este proceso corresponden a los módulos a escalas diferentes.

Referencias

Sell S (2004) Stem Cells Handbook (Humana Press, Totowa, NJ). Google Scholar
Kirschstein R, Skirboll LR (2001) Stem Cells: Scientific Progress and Future Research Directions(NIH, Bethesda). Google Scholar
Freitas RA Jr (1999) Nanomedicine, Volume I: Basic Capabilities (Landes Bioscience, Georgetown, Texas). Google Scholar
Alberts B, et al. (2002) Molecular Biology of the Cell (Garland Science, New York), IVth Ed. Google Scholar
Sadler TW (2004) Langman’s Medical Embryology (Lippincott Williams and Wilkins, Baltimore), IXth Ed. Google Scholar
Vickaryous MK, Hall BK (2006) Human cell type diversity, evolution, development, and classification with special reference to cells derived from the neural crest. Biol Rev 81:425–455.Medline Google Scholar
Valentine JW (2003) in Keywords and Concepts in Evolutionary Developmental Biology, eds HallBK, Olson WM (Harvard Univ Press, Cambridge), pp 35–53. Google Scholar
Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabási A-L (2002) Hierarchical organization of modularity in metabolic networks. Science 297:1551–1555. Abstract/FREE Full Text
Newman MEJ, Girvan M (2004) Finding and evaluating community structure in networks. Phys Rev E 69:026113. CrossRef Google Scholar
Guimerà R, Amaral LAN (2005) Functional cartography of complex metabolic networks. Nature433:895–900. CrossRef Medline Google Scholar
Caldarelli G, Vespignani A, eds (2007) Large scale structure and dynamics of complex networks(World Scientific, Singapore). Google Scholar
Song C, Havlin S, Makse HA (2005) Self-similarity of complex networks. Nature 433:392–395. CrossRef Medline Google Scholar
Paxinos G, Mai JK (2004) The Human Nervous System (Elsevier Academic, San Diego), 2nd Ed. Google Scholar
Temple S (2001) The development of neural stem cells. Nature 414:112–117. CrossRef Medline Google Scholar
Bianco P, Riminucci M, Gronthos S, Robey PG (2001) Bone marrow stromal stem cells: Nature, biology, and potential applications. Stem Cells 19:180–192. CrossRef Medline Web of Science Google Scholar
Chen JCJ, Goldhamer DJ (2003) Skeletal muscle stem cells. Reprod Biol Endocrin 1:101. CrossRef Google Scholar
Janeway CA, Travers P, Walport M, Shlomchik M (2001) Immunobiology: The Immune System in Health and Disease (Garland Science, New York), 5th Ed. Google Scholar
Anglani F, et al. (2004) In search of adult renal stem cells. J Cell Mol Med 8:474–487. Medline Web of Science Google Scholar
Horster MF, Braun GS, Huber SM (1999) Embryonic renal epithelial: induction, nephrogenesis, and cell differentiation. Physiol Rev 79:1157–1191. Abstract/FREE Full Text
Herrick SE, Mutsaers SE (2004) Mesothelial progenitor cells and their potential in tissue engineering. Int J Biochem Cell B 36:621–642. CrossRef Medline Web of Science Google Scholar
Otto WR (2002) Lung epithelial stem cells. J Pathol 197:527–535. CrossRef Medline Web of Science Google Scholar
Jessen KR, Mirsky R (2005) The origin and development of glial cells in peripheral nerves. Nat Rev Neurosci 6:671–682. CrossRef Medline Web of Science Google Scholar
Nakashima M, Redid AH (2003) The application of bone morphogenetic proteins to dental tissue engineering. Nat Biotechnol 21:1025–1032. CrossRef Medline Web of Science Google Scholar
Santagati F, Rijli FM (2003) Cranial neural crest and the building of the vertebrate head. Nat Rev Neurosci 4:806–818. Medline Web of Science Google Scholar
Savage JJ, Yaden BC, Kiratipranon P, Rhodes SJ (2003) Transcriptional control during mammalian anterior pituitary development. Gene 319:1–19. Google Scholar
Forge A, Wright T (2002) The molecular architecture of the inner ear. Brit Med Bull 63:5–24. Abstract/FREE Full Text
Panteleyev A, Jahoda CAB, Christiano AM (2001) Hair follicle predetermination. J Cell Sci114:3419–3431. Abstract/FREE Full Text
Song C, Gallos LK, Havlin S, Makse HA (2007) How to calculate the fractal dimension in complex networks. J Stat Mech, P03006. Google Scholar
Gallos LK, Song C, Havlin S, Makse HA (2007) Scaling Theory of transport in complex biological networks. Proc Natl Acad Sci USA 104:7746–7751. Abstract/FREE Full Text
Athreya KB, Ney PE (2004) Branching processes (Dover, New York). Google Scholar

jueves, 27 de octubre de 2016

Epidemia: No hubo paciente cero en el SIDA

El VIH conquistó América desde Haití y Nueva York

La mayor investigación de los genomas virales refuta la identidad del famoso “paciente cero”

JAVIER SAMPEDRO - El País

Manifestantes en un desfile del Orgullo Gay en Manhattan, en 1983. La pancarta dice "SIDA: necesitamos investigación, ¡no histeria!". BARBARA ALPER/GETTY IMAGES

El virus de la inmunodeficiencia humana (VIH-1), causante del sida, fue reconocido en California en 1983, pero ni entró por allí en el continente americano ni quien lo propagó fue el famoso “paciente cero”, identificado en la literatura técnica y los medios como el azafato canadiense Gaëtan Dugas. Una innovadora investigación histórica y genómica revela que el virus saltó desde Haití hasta Nueva York en 1970, y que esta ciudad fue el foco central desde el que se propagó la epidemia por América. Y que el virus original no era el que llevaba Dugas.

El evolucionista Michael Worobey, de la Universidad de Arizona, y el historiador de la salud pública Richard McKay, de la Universidad de Cambridge, han logrado reconstruir con una precisión sin precedentes el origen y la propagación del virus en América. El VIH se originó en África en la primera mitad del siglo XX, pero no llegó a la atención pública hasta que fue reconocido como causa del sida en 1983.

El VIH se originó en África en la primera mitad del siglo XX, pero no llegó a la atención pública hasta que fue reconocido como causa del sida en 1981

La reconstrucción de Worobey y McKay demuestra que el virus llegó de África al Caribe, probablemente a Haití, en los años sesenta; que de allí saltó a Nueva York en 1970, y de esta ciudad no solo a zonas cercanas como Pensilvania y Nueva Jersey, sino también a Georgia y directamente a San Francisco y el resto de California, en el otro extremo de Estados Unidos. Presentan su investigación en la revista Nature.

El trabajo logra también la rara proeza de limpiar el nombre del azafato canadiense Gaëtan Dugas, muerto de sida en 1984. Ese mismo año, un estudio de los centros de control de enfermedades (CDC) de Atlanta, publicado en el American Journal of Medicine, rastreó muchas de las infecciones iniciales por VIH hasta ese auxiliar de vuelo. El propio Dugas admitió haber tenido unas 2.000 relaciones con distintas personas homosexuales por todo el mundo.

Su trabajo de auxiliar de vuelo, unido a su notable promiscuidad, le convirtieron en un buen candidato a haber introducido el virus en América desde África. Los investigadores del CDC introdujeron esta hipótesis en su artículo técnico. Tuvieron el atino de no publicar su nombre, y lo identificaron solo como “paciente O”. Pero el secreto solo duró tres años. El nombre de Dugas fue publicado por el reportero freelance del San Francisco Chronicle Randy Shilts en un libro de 1987, y a partir de ahí reproducido por varios medios.

Puede que Dugas contribuyera a propagar el virus por el continente, pero desde luego no fue quien lo introdujo allí desde África. El análisis evolutivo de Worobey y McKay demuestra por encima de toda duda razonable que el virus de las muestras de Dugas es de tipo tardío, muy distinto de los primeros que entraron en Nueva York desde el Caribe. El azafato, por tanto, fue una más de las personas que se contagiaron en Nueva York o Georgia a mediados de los setenta. No fue el “paciente cero”. Nadie sabe quién fue el paciente cero.

Dugas no fue el paciente cero; nadie sabe quién lo fue

Para acabar de arreglar este triste malentendido, resulta que aquel “cero” ni siquiera era un cero en la publicación original de los CDC. Era una O. Quería decir Outside of California, fuera de California. Un desastre colectivo. “No hay evidencias ni biológicas ni históricas que apoyen la extendida creencia de que [Dugas] fuera la causa primaria de la epidemia de VIH en Norteamérica”, asegura Worobey.

Los investigadores han partido de más de 2.000 muestras de sangre recogidas de hombres en Estados Unidos en los años setenta, antes de que se supiera lo que era el sida. Ese tipo de muestras, obviamente, no se extrajeron en condiciones adecuadas para analizar los genes de un virus, lo que ha obligado a Worobey y sus colegas a desarrollar unos métodos genómicos muy avanzados, en parte desarrollados específicamente para este estudio.

“Ahora podemos mirar adelante y ver realmente un futuro en el que, incluso si el virus no se elimina por completo, pueda ser reducido hasta que no cause ningún nuevo contagio en amplias zonas del mundo”, dice Worobey. Las técnicas desarrolladas para este trabajo pueden convertirse en unos ensayos ultrasensibles que puedan detectar el virus en la sangre de personas que no son conscientes de haberse infectado recientemente.

LECCIÓN DE HISTORIALo peor del caso de Gaëtan Dugas, el “paciente cero”, no es que haga agua después de haber leído el genoma de su virus VIH, sino que ya la hacía antes. El historiador de la salud pública McKay, uno de los autores del estudio, tiene aquí casi tanto que decir como su coautor, el evolucionista de los virus Worobey. El historiador no solo ha documentado que el cero era en realidad una letra O y que la atribución al auxiliar de vuelo de haber originado la epidemia americana de sida fue más bien obra de un escritor y algunos periódicos que de los laboratorios de referencia mundial en enfermedades infecciosas, los CDC de Atlanta. Hay más.
En su libro And the Band Played On (y la banda siguió tocando), el periodista del San Francisco Chronicle Randy Shilts pintaba a Dugas como un depredador sexual y un peligroso irresponsable, llegando a insinuar lo posibilidad de que hubiera propagado la enfermedad a propósito. Los periodistas que reseñaron el libro completaron la faena culpando al azafato de haber traído el virus desde África, generando una de las pandemias más mortíferas de todos los tiempos.
Pero Dugas no solo fue uno de los pocos afectados de la época que donó sangre para los análisis, sino también de los poquísimos que pudo aportar a los investigadores los nombres del 10% de las parejas sexuales que había tenido en los últimos años. El historiador McKay sospecha que su papel central en la propagación del virus que detectó aquel estudio de 1984 pudo tener mucho que ver con su buena memoria, en un caso claro de sesgo muestral: el que más parejas recuerda consigue más positivos entre ellas.

miércoles, 26 de octubre de 2016

Increíbles redes de circuitos electrónicos de un chip

Increíbles primeros planos de los chips de ordenador se asemejan a un complejo entramado de las ciudades
Wired

Las personas pasan horas y horas cada día frente a las computadoras y los teléfonos inteligentes, pero rara vez se ven los minúsculos circuitos que los hacen funcionar. Pero si usted hecha una mirada cercana a un microprocesador, verá algo sorprendente. "Se parece a un horizonte de tres dimensiones", dice Christoph Morlinghaus. "Puede uno perderse totalmente en ella."

Morlinghaus descubrió esto hace tres años, mientras que fotografiar placas base para Cisco. Las juntas de modo que él le fascinaban los mantuvo durante una semana más, disparando a los primeros planos que se convirtieron en su serie de la placa base. Volvió a la idea el año pasado, la obtención de los microprocesadores de los foros en línea y disparos en su estudio de Miami.

cámara Sinar P2 de 8 × 10 con - Morlinghaus

Fotografiar algo más grande que un grano de arroz no es fácil. Morlinghaus utiliza un Sinar P2 cámara de 8 × 10 con un fuelle de siete pies y una lente f2.8 50mm. El sistema de iluminación de cada procesador con un par de luces de armario de 12 pulgadas, pero todavía tenía que hacer exposiciones de tres minutos. Esto significaba disparar varias tramas, porque la menor perturbación se ve borrosa la imagen. "Cada vez que había un carro que conduce por el estudio, o alguien en el edificio encendido AC, tendría que hacer toda la cosa de nuevo", dice. Haciendo cada uno de los siete fotos en la serie tomó alrededor de una semana, incluyendo el escaneo de los negativos y cuidadosamente quitar el polvo.

Las imágenes de Computerwelt son ricos en detalle, cada componente claramente definido. Todo tiene un aspecto como si estuviera mirando hacia abajo en una ciudad, los edificios de la proyección de sombras en las calles por debajo de ellos. Es una fascinante mirada a la tecnología que dan por sentado, incluso cuando usted está mirando ahora mismo.

Páginas