Grandes datos muestran que el comportamiento colectivo de la gente sigue patrones periódicos fuertes
Nuevas investigaciones han revelado que mediante el uso de grandes datos para analizar conjuntos de datos masivos de noticias modernas e históricas, medios de comunicación social y páginas de Wikipedia, se pueden observar patrones periódicos en el comportamiento colectivo de la población que podrían pasar desapercibidos.
Los académicos del proyecto ThinkBIG de la Universidad de Bristol, dirigidos por Nello Cristianini, profesor de Inteligencia Artificial, han publicado dos artículos que han analizado patrones periódicos en el contenido y consumo diario de los medios de comunicación.
Los dos conjuntos de hallazgos, considerados en conjunto, muestran que el comportamiento colectivo de la gente sigue patrones periódicos fuertes y es más predecible de lo que se pensaba anteriormente. Sin embargo, estos patrones a menudo sólo pueden ser revelados al analizar las actividades de un gran número de personas durante un tiempo muy largo, y hasta hace poco esto ha sido una tarea muy difícil.
Mediante el uso de grandes tecnologías de datos, ahora es posible obtener una visión unificada del contenido de los periódicos, para decenas de periódicos al mismo tiempo, que abarcan varias décadas o analizar los contenidos publicados en Twitter por un gran número de usuarios o incluso las páginas de Wikipedia visitadas .
El profesor Nello Cristianini, del Departamento de Matemáticas de Ingeniería, dijo: "Lo que emerge es un vistazo a las regularidades en nuestro comportamiento que se esconden detrás de las variaciones cotidianas en nuestras vidas.
"Nuestros dos artículos han demostrado que mediante el análisis de conjuntos de datos masivos de noticias modernas e históricas, medios de comunicación social y páginas de Wikipedia, podemos obtener una mirada sin precedentes a nuestro comportamiento colectivo, revelando ciclos que ciertamente sospechamos, pero que nunca se han observado antes . "
El primer trabajo, publicado en la revista PLOS ONE, analizó 87 años de los periódicos estadounidenses y británicos entre 1836 y 1922. Los investigadores encontraron que el ocio y el trabajo de la gente estaban fuertemente regulados por el clima y las estaciones, En el Reino Unido y EE.UU.
Gran parte de nuestra dieta estaba influenciada por las estaciones también, con horarios muy predecibles para diferentes frutas y alimentos, e incluso flores, en las noticias históricas. Lo mismo se encontró para las enfermedades, como la temporada alta de sarampión en ambos países se encontró a finales de marzo a principios de abril. Curiosamente, un fuerte indicador fue proporcionado por la reaparición muy periódica de grosellas en junio, que ya no se encuentra en las noticias modernas, junto con muchas otras tradiciones perdidas.
Esto puede parecer obvio, pero el equipo de investigación también notó que ciertas actividades que solían ser muy regulares, como las conferencias de Navidad, ahora casi han desaparecido y han sido reemplazadas por otras actividades periódicas, como el fútbol, Ibiza, Oktoberfest. De alguna manera, la TV ha reemplazado parcialmente el clima como un factor importante de sincronización de la vida de las personas.
En el segundo trabajo, que se presentará el próximo mes en un taller de la Conferencia Internacional de Minería de Datos del IEEE 2016 (ICDM), los investigadores descubrieron que las estaciones también pueden tener fuertes efectos sobre la salud mental. El equipo analizó el sentimiento agregado en Twitter en el Reino Unido, además de acceso agregado a Wikipedia durante cuatro años. Encontraron que el sentimiento negativo es sobreexpresado en el invierno, alcanzando su máximo en noviembre, y la ansiedad y la cólera son sobreexpresado entre septiembre y abril.
Al mismo tiempo, un análisis de las visitas de Wikipedia a páginas de salud mental, globalmente pero fuertemente dominadas por el tráfico del hemisferio norte, mostró una estacionalidad clara en las búsquedas de formas específicas de problemas mentales. Por ejemplo, las visitas a la página sobre el padecimiento de trastornos afectivos estacionales a finales de diciembre y las visitas al trastorno de pánico alcanzan su punto máximo en abril, al mismo tiempo que las visitas a la página sobre el trastorno de estrés agudo.
En conjunto, estos dos artículos muestran que el uso de múltiples fuentes de datos grandes puede permitir a los investigadores observar el comportamiento colectivo, e incluso el estado de ánimo y la salud mental, de grandes poblaciones, revelando ciclos por primera vez que se sospecha pero fueron difíciles para observar.
Phys,org
Este blog reúne material del curso de posgrado "Análisis de redes sociales" dictado en la Universidad Nacional del Sur (Argentina).
miércoles, 16 de noviembre de 2016
lunes, 14 de noviembre de 2016
Red criminal georgiana en España
MAFIA GEORGIANA
La larga sombra del capo DarsadzeLa mafia georgiana dirigida por un ‘ladrón en ley’ encarcelado comete cientos de atracos en domicilios de España. La Policía le atribuye el 60 % de los robos en viviendas de la Comunidad de Madrid
JOSÉ ANTONIO HERNÁNDEZ | JOAQUÍN GIL
El País
Todo ocurrió a las 14.30 horas. Un fornido hombre de 75 años se desploma a la entrada de un restaurante en el centro de Moscú. Aslan Usoyan, alias abuelo Hasan, se desangra en segundos. El tiro de gracia del francotirador ha sido certero.
Estructura de la mafia georgiana en España y Europa
El asesinato el 16 de enero de 2013 del capo de la mafia georgiana de la rama de los Tblisi Aslan Usoyan llevó la firma de uno de los suyos. La negativa de este ladrón en ley (jefe) a reconocer a los nuevos líderes coronados en una cumbre criminal en Dubai un mes antes resultó letal. Los vor v zakone, cabecillas de una banda transnacional especializada en desvalijar pisos, no toleran la disidencia. Usoyan fue víctima del clan Kutaisi, según informes de la inteligencia.
El Juzgado Central número 3 de la Audiencia Nacional investiga de cerca los movimientos en España de la mafia georgiana de los ladrones en ley. La Policía les atribuye el 60 % de los robos cometidos en domicilios en la Comunidad de Madrid, según ha podido saber EL PAÍS. Durante el primer trimestre de este año, 4.516 viviendas madrileñas fueron asaltadas, según el Ministerio del Interior.
El capo de la mafia georgiana Knyazevich Kalashov durante su traslado a España desde Dubai en una imagen de junio de 2006. EL PAÍS
A sus 44 años, Zviad Darsadze es el cabecilla de la mafia georgiana en España. Coronado vor en 2000, los investigadores describen a este hombre nacido en Kutaisi, la segunda ciudad del país caucásico, como un amante del lujo y los restaurantes exclusivos que carece de empleo conocido. Su tren de vida no encaja con los 3.504 euros que percibió oficialmente en 2010 como trabajador de una empresa de compraventa de frutas y hortalizas en Guadassuar (Valencia).
Darsadze es un capo con funciones de juez para dirimir disputas. Pero también un respetado oráculo en la toma de decisiones que combina el liderazgo con la supervisión de los asaltos, generalmente en tareas de vigilancia. Por estas y otras fechorías, el vor se encuentra en prisión desde el pasado año. La Policía le describe como el cabecilla de la red desmantelada en la Operación Aikon, que se saldó en julio de 2015 con una treintena de arrestos. Y frustró el saqueo de centenares de viviendas en la Comunidad Valenciana, Murcia y Cataluña. La Audiencia Nacional asume desde entonces la investigación al atribuir a la banda de ladrones en ley cientos de atracos en España y Europa. El juzgado de Instrucción número 43 de Madrid fue el primero en instruir el caso.
La organización tiene medio centenar de miembros. Solo Zviad y otro integrante más están en prisión. En el grupo destaca el hombre que hace las funciones de guardaespaldas, relaciones públicas y lugarteniente del vor, Archil Giorgobiani. Junto a él, Merab Toroshelidze se encarga de colocar la mercancía. Y también suministra los juguetes, que es como la banda denomina a las ganzúas e inhibidores de frecuencia que son adquiridos en una tienda de artículos de espionaje del centro de Madrid. El español Francisco F. actuaría supuestamente como intermediario del botín con tres casas de compraventa de oro de la capital.
El integrante de la mafia georgiana Kakhaber Shushanasvili, en una imagen captada en la Audiencia Nacional en diciembre de 2011 EFE / KOTE RODRIGO
Los jefes profesan fidelidad absoluta al hombre fuerte de la mafia georgiana, que corresponde con visitas al hospital a sus chicos tras los tiroteos. Citas clave como el cumpleaños de Darsadze, que se celebró en febrero de 2015 en un hotel de cinco estrellas de la zona de Avenida América de Madrid, sirven para aproximarse al vor. Y también para hablar de las shodkas (cumbres criminales) que se registraron ese año en Armenia y Turquía. Al cumpleaños del capo en Madrid asistió Varlam Kukhianidze, condenado en 1997 a siete años por secuestro y extorsión.
La red de Darsadze es familiar. Y en ella figura la esposa del vor, responsable de supervisar las transferencias; el hermano del jefe, encargado de una célula de siete atracadores. Y un vástago del cabecilla que adquiere pisos en Georgia con el dinero de la organización, según las pesquisas.
Tras hacerse con el botín, la mercancía planea a través de un alambicado entramado de blanqueo compuesto por sociedades pantalla, peristas, correos humanos rumbo a Georgia y transferencias a través de agencias como MoneyGram, Ria Money o Western Union. El dinero acaba en Rusia en una obschack, una caja común o hucha que centraliza los flujos de capital de todas las facciones europeas de vor v zakone. Darsadze se encarga de decidir las cantidades enviadas desde España, pero también controlaría el dinero recaudado en Francia y Alemania, según los agentes. Del bote común salen los beneficios que se reparten los capos y la financiación de esta compleja telaraña criminal, que está siendo investigada por la Brigada Provincial de la Policía Judicial de Madrid, la Unidad de Drogas y Crimen Organizado (UDYCO) y la Guardia Civil en La Rioja por algunos golpes a viviendas cometidos en Calahorra (24.000 habitantes) y Arnedo (15.000).
Primera sesión del juicio celebrado en noviembre de 2009 en la Audiencia Nacional contra la mafia ruso-georgiana arrestada en la Operación Avispa. EFE
Las pesquisas revelan vínculos del vor Darsadze con homólogos en Francia, Italia, Alemania, Austria, Suiza y Grecia. La Policía relaciona al ladrón en ley de España con una empresa que roba coches en Bélgica y Alemania para su posterior venta en Europa del Este.
Una red de confidentes con tentáculos en Europa informa al vor Darsadze en tiempo real sobre los arrestos. El protagonista de esta historia recibe informes telefónicos sobre los hombres que no se avienen a la autoridad. Uno de estos reportes llegó desde Grecia en febrero de 2015. Al otro lado del móvil estaba Zara Ambroladze, condenado a siete años de prisión por tráfico de armas.
Zviad Darsadze es un hombre con un poder omnímodo. Así lo demostró en una conversación en marzo de 2015 cuando aleccionó a un colaborador sobre cómo encarrilar a un grupo díscolo. “Hazles llegar mis palabras. Me follo a sus madres. Diles que es el mensaje de Zviad”.
investigacion@elpais.es
LLAVES MÁGICAS Y MARCADORESLa mafia georgiana asentada en España tiene sus cuarteles generales en Madrid y Alcobendas, donde reside el entorno del jefe Zviad Darsadze. Desde el centro del país, los corpulentos atracadores planean el saqueo de cientos de viviendas.
Procedentes en su mayoría de las ciudades georgianas de Tbilisi y Kutaisi, la banda de los vor v zakone actúa como una maquinaria itinerante. Mediante un enjambre de pisos patera –que figuran a nombre de mujeres georgianas, ucranianas y rusas- la red campa a sus anchas por España y Europa, según informes policiales.
La organización actúa en grupos de cuatro. Dos vigilan en el exterior de las viviendas móvil en mano mientras que el resto comete el asalto en sigilo. Un marcador, plástico transparente de una cajetilla de tabaco situado entre el marco y la puerta, confirma previamente que hay vía libre. La casa está vacía.
Los ladrones en ley combinan las ganzúas con el eficaz magic key, un artilugio reservado para cerrajeros profesionales pero que se puede comprar por Internet sin dar explicaciones. El aparejo posibilita abrir un portón acorazado en quince minutos y fabricar una llave con la puerta cerrada. Otra variante es el bumping, una técnica que consiste en introducir una llave en la cerradura y golpearla con un objeto hasta que cede.
La banda de los ladrones en ley prefiere trabajar de día en invierno. Y comienza su jornada de atracos a partir de medianoche en verano, según informes policiales.
Para despistar a los investigadores, los ladrones manejan documentación falsa. Se hacen pasar por ciudadanos de Lituania, República Checa, Bulgaria y Polonia. Disponen además de decenas de móviles y usan programas de llamadas gratis por Internet como Skype o Viber por seguridad. La mayoría son reincidentes y tienen antecedentes por robo con violencia o falsificación. Salen de prisión y vuelven a las andadas, concluyen informes policiales.
sábado, 12 de noviembre de 2016
La influencia de los bots en la elección americana
Cómo influyeron los bots políticos en esta elección
Casi el 20 por ciento de todos los tweets relacionados con las elecciones provienen de un ejército de influyentes robots.
Por Nanette Byrnes - MIT Technology Review
Si sus conversaciones políticas en las redes sociales parecen mecánicas y predecibles, podría ser porque está debatiendo con un robot.
Un estudio publicado el día antes de las elecciones encontró un estimado de 400.000 bots operando en Twitter que estaban twittando -y retweeted- a un ritmo notable, generando casi el 20 por ciento de todos los mensajes relacionados con las elecciones.
Además de ser numerosos, estos robots también son muy influyentes y capaces de distorsionar el debate en línea, según los autores Alessandro Bessi y Emilio Ferrara del Instituto de Ciencias de la Información de la Universidad del Sur de California.
Una cosa sigue siendo misteriosa: ¿quién los está creando? Eso es aún imposible de determinar, dijo Ferrara MIT Technology Review en una discusión sobre su estudio, llevado a cabo durante un mes este otoño, un período que incluyó los tres debates presidenciales. A continuación se muestra una transcripción editada.
En el estudio se mide la influencia de los bots, y encontrar que sea sorprendentemente alta. ŻPuedes explicar eso?
Medimos cuántas conexiones tiene una cuenta con otras cuentas y cuántos usuarios diferentes retweet esa cuenta. Lo que encontramos es que la gente no es muy buena para determinar si las fuentes de información a las que están expuestos son un humano o un bot. Los bots se están retweeted al mismo ritmo que los seres humanos. Dado que los bots son mucho más activos y producen [muchos más tweets] el subproducto es que están siendo retweeted mucho y se vuelven influyentes. Eso lleva a algunos problemas serios con retweeting-propagación de la desinformación, difusión de rumores, teorías de la conspiración, y así sucesivamente.
Este mapa del estudio muestra el volumen de tweets bots generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado, lo que indica que un estado, Georgia, es el mayor contribuyente.
Este mapa del estudio refleja el volumen de tweets humanos generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado. Muestra la conversación que es conducida por los estados más populosos, incluyendo California, Tejas, la Florida, Illinois, y Nueva York.
Casi el 75 por ciento de los bots que encontró apoyaban al candidato republicano Donald Trump, y los mensajes en sus tweets eran diferentes.
Los bots que apoyan a Donald Trump están realmente produciendo una cantidad abrumadoramente grande de apoyo positivo para el candidato, mientras que en el caso de los partidarios de Hillary Clinton, más tweets son neutrales que positivos.
Los bots de medios sociales que se involucran en la política no es un fenómeno totalmente nuevo, pero usted encuentra que la hornada de este año es particularmente sofisticada.
Estos bots son más complejos, usando la inteligencia artificial para charlar con la gente. Pueden agregar el sentimiento en una discusión polarizada y quizás aún más polarizarlo.
Había sido más fácil identificar bots anteriores, pero ahora es increíblemente difícil para un humano hacer una determinación. Hice una prueba en mí mismo, y en algunas cuentas hay señales que son claras, como publicar 1.000 tweets por hora. En otros es más difícil. Parecen que se van a dormir [yendo fuera de línea por un período prolongado cada día]. Ellos tweet cinco, 10, 15 tweets en una fila, y luego ninguno durante una hora. Ellos clonan el comportamiento de las personas.
Casi el 20 por ciento de todos los tweets relacionados con las elecciones provienen de un ejército de influyentes robots.
Por Nanette Byrnes - MIT Technology Review
Si sus conversaciones políticas en las redes sociales parecen mecánicas y predecibles, podría ser porque está debatiendo con un robot.
Un estudio publicado el día antes de las elecciones encontró un estimado de 400.000 bots operando en Twitter que estaban twittando -y retweeted- a un ritmo notable, generando casi el 20 por ciento de todos los mensajes relacionados con las elecciones.
Además de ser numerosos, estos robots también son muy influyentes y capaces de distorsionar el debate en línea, según los autores Alessandro Bessi y Emilio Ferrara del Instituto de Ciencias de la Información de la Universidad del Sur de California.
Una cosa sigue siendo misteriosa: ¿quién los está creando? Eso es aún imposible de determinar, dijo Ferrara MIT Technology Review en una discusión sobre su estudio, llevado a cabo durante un mes este otoño, un período que incluyó los tres debates presidenciales. A continuación se muestra una transcripción editada.
En el estudio se mide la influencia de los bots, y encontrar que sea sorprendentemente alta. ŻPuedes explicar eso?
Medimos cuántas conexiones tiene una cuenta con otras cuentas y cuántos usuarios diferentes retweet esa cuenta. Lo que encontramos es que la gente no es muy buena para determinar si las fuentes de información a las que están expuestos son un humano o un bot. Los bots se están retweeted al mismo ritmo que los seres humanos. Dado que los bots son mucho más activos y producen [muchos más tweets] el subproducto es que están siendo retweeted mucho y se vuelven influyentes. Eso lleva a algunos problemas serios con retweeting-propagación de la desinformación, difusión de rumores, teorías de la conspiración, y así sucesivamente.
Este mapa del estudio muestra el volumen de tweets bots generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado, lo que indica que un estado, Georgia, es el mayor contribuyente.
Este mapa del estudio refleja el volumen de tweets humanos generados entre el 16 de septiembre y el 21 de octubre de 2016 por estado. Muestra la conversación que es conducida por los estados más populosos, incluyendo California, Tejas, la Florida, Illinois, y Nueva York.
¿Espera que esto tenga un impacto en el resultado de las elecciones?
Es realmente difícil o incluso imposible hacer una interpretación de qué influencia tienen estas dinámicas en el resultado de la elección, la votación real y así sucesivamente. Una cosa en riesgo es la participación de votantes. Encontramos en algunos estados, en particular en el Sur y el Medio Oeste, hay mucho más bots que en cualquier otro estado. La gente podría pensar que hay un apoyo de base real allí, pero en realidad todo es generado por los bots.Casi el 75 por ciento de los bots que encontró apoyaban al candidato republicano Donald Trump, y los mensajes en sus tweets eran diferentes.
Los bots que apoyan a Donald Trump están realmente produciendo una cantidad abrumadoramente grande de apoyo positivo para el candidato, mientras que en el caso de los partidarios de Hillary Clinton, más tweets son neutrales que positivos.
Los bots de medios sociales que se involucran en la política no es un fenómeno totalmente nuevo, pero usted encuentra que la hornada de este año es particularmente sofisticada.
Estos bots son más complejos, usando la inteligencia artificial para charlar con la gente. Pueden agregar el sentimiento en una discusión polarizada y quizás aún más polarizarlo.
Había sido más fácil identificar bots anteriores, pero ahora es increíblemente difícil para un humano hacer una determinación. Hice una prueba en mí mismo, y en algunas cuentas hay señales que son claras, como publicar 1.000 tweets por hora. En otros es más difícil. Parecen que se van a dormir [yendo fuera de línea por un período prolongado cada día]. Ellos tweet cinco, 10, 15 tweets en una fila, y luego ninguno durante una hora. Ellos clonan el comportamiento de las personas.
jueves, 10 de noviembre de 2016
Usando redes para escribir el resumen de literatura de la tesis doctoral
Barriendo Google Scholar para escribir su capítulo de literatura de doctorado
My Student Voices
Diagrama de red de autores clave en mi doctorado. Los enlaces representan citas y coautorías. Los colores son comunidades como lo indica la "modularidad". La clave indica algunas conjeturas aproximadas en lo que los autores de una comunidad tienen en común - en algunos casos hay un ajuste excelente (diseño participativo), en otros mucho menos (lila).
En un post anterior escribí sobre el diseño de un mejor sistema para la publicación académica. Un problema con el ecosistema de publicación comercial es que inhibe a quienes deseen desarrollar nuevas herramientas para navegar por el cada vez mayor cuerpo de investigación. (Por supuesto, también existe la clara injusticia de pedir a los contribuyentes que financien investigaciones que posteriormente no pueden leer).
Esta publicación trata de un prototipo de "red" para encontrar documentos usando datos de Google Scholar, con lo que se podría señalar lo que se podría hacer con datos más abiertos. Pude usar un programa supervisado buscando en Google Scholar para extraer mis datos, pero una versión escalable de esta herramienta requeriría datos abiertos.
También es rascar mi propia picazón: estoy en la etapa de mi doctorado donde necesito juntar todo. Necesito un capítulo de literatura que establezca el contexto teórico para mis cuatro estudios de caso, explicando lo que ya se ha escrito sobre mi tema y aclarando mis términos clave. En mi caso eso significa lo que se ha dicho sobre el tema del diseño participativo, la formulación de políticas, la acción colectiva y el análisis de redes sociales. (Mi título de trabajo es: ¿Cómo pueden los medios de comunicación social informar a la política del gobierno local?)
Hay cuatro áreas que conozco que juegan un papel en mi investigación:
Con la lista de términos de búsqueda, Bibnet realiza dos pasos:
Este proceso genera archivos que se pueden exportar a la herramienta de visualización Gephi.
De las 55 cadenas de búsqueda originales grabé 1120 autores, 1223 publicaciones y 1382 citas. (Lista legible de las citas)
La misma imagen que el encabezado, pero con los autores claves rodeados en rojo
Para que el gráfico sea legible, sólo muestro los nodos con más enlaces. Como se describe en el primer epígrafe, los colores representan algoritmicamente descubiertos 'comunidades' utilizando la función de Gefi- s de modularidad - grupos de autores que citan y coautorizan mucho. Estas comunidades son probablemente bastante dependiente del conjunto inicial de búsquedas, sin embargo, algunos de ellos tienen sentido intuitivo. La 'comunidad de diseño participativo', por ejemplo, está muy bien definida. La comunidad rosada son todos los autores que he estado viendo en el tema de la democracia deliberativa.
Por otra parte, S Lukes habría tenido más sentido para mí en la comunidad verde con RA Dahl, a quien su trabajo hace extensa referencia. De hecho, como indica la clave, no puedo decir lo que la comunidad de lilas indica con ningún grado de confianza - su existencia puede ser el resultado de mi muestreo selectivo de la red académica en general. La centralidad del grupo lila indica que son comúnmente referenciados por todos los otros grupos, y Arrow y Rawls son dos de los investigadores con mayor referencia en la red. Puede ser esta propiedad, más que una especialidad de sujeto, que los nodos de lila tienen en común.
Hay una serie de casos límite anómalos como este.
Creo que un análisis más profundo podría revelar documentos menos citados que citan combinaciones interesantes de mis autores clave.
Este enfoque parece especialmente relevante para mi trabajo porque me estoy posicionando en relación con varias disciplinas. También parece importante en las humanidades más amplias, donde la búsqueda por palabra clave puede fallar al devolver resultados relevantes de otra disciplina con un vocabulario diferente.
Por último, debo reconocer en primer lugar que la red de citas no es la única manera de descubrir documentos, y también que Google Scholar es una fuente incompleta de datos en sí.
My Student Voices
Diagrama de red de autores clave en mi doctorado. Los enlaces representan citas y coautorías. Los colores son comunidades como lo indica la "modularidad". La clave indica algunas conjeturas aproximadas en lo que los autores de una comunidad tienen en común - en algunos casos hay un ajuste excelente (diseño participativo), en otros mucho menos (lila).
En un post anterior escribí sobre el diseño de un mejor sistema para la publicación académica. Un problema con el ecosistema de publicación comercial es que inhibe a quienes deseen desarrollar nuevas herramientas para navegar por el cada vez mayor cuerpo de investigación. (Por supuesto, también existe la clara injusticia de pedir a los contribuyentes que financien investigaciones que posteriormente no pueden leer).
Esta publicación trata de un prototipo de "red" para encontrar documentos usando datos de Google Scholar, con lo que se podría señalar lo que se podría hacer con datos más abiertos. Pude usar un programa supervisado buscando en Google Scholar para extraer mis datos, pero una versión escalable de esta herramienta requeriría datos abiertos.
También es rascar mi propia picazón: estoy en la etapa de mi doctorado donde necesito juntar todo. Necesito un capítulo de literatura que establezca el contexto teórico para mis cuatro estudios de caso, explicando lo que ya se ha escrito sobre mi tema y aclarando mis términos clave. En mi caso eso significa lo que se ha dicho sobre el tema del diseño participativo, la formulación de políticas, la acción colectiva y el análisis de redes sociales. (Mi título de trabajo es: ¿Cómo pueden los medios de comunicación social informar a la política del gobierno local?)
Hay cuatro áreas que conozco que juegan un papel en mi investigación:
- Las ideas sociológicas sobre redes (Roland Burt y Mark Granovetter)
- El trabajo de Elinor Ostrom sobre los bienes comunes
- Diseño participativo
- Ética / Política de Steven Lukes, Amartya Sen y John Rawls
Construcción de un prototipo
Uso de Meteor (un paquete de JavaScript) Construí una aplicación web para recopilar datos de Google Scholar. Lo llamé Bibnet (código en github). El proceso comienza con un conjunto de términos de búsqueda que conozco los papeles de retorno que ya cito de Google Académico (lista de 55 términos de búsqueda aquí).Con la lista de términos de búsqueda, Bibnet realiza dos pasos:
- Bibnet registra cada artículo o libro que es devuelto por Google Académico (hasta 10 resultados por término) para cada uno de los términos de búsqueda. Esta información genera una lista de publicaciones en una base de datos. En la misma base de datos, también registra quién escribió cada publicación como una lista de autores.
- Usando la "búsqueda dentro de las citas" de Google Scholar, verifica si alguno de los autores registrados en la base de datos ha citado alguna de las publicaciones.
Este proceso genera archivos que se pueden exportar a la herramienta de visualización Gephi.
De las 55 cadenas de búsqueda originales grabé 1120 autores, 1223 publicaciones y 1382 citas. (Lista legible de las citas)
Resultados
Para generar la imagen de abajo, exporté una lista de todos los autores y mostré enlaces entre ellos si habían coautorizado una publicación o si se habían citado. El tamaño de los nodos indica el número de enlaces entrantes, el grosor del borde indica el número de conexiones (citas y coauthoring) entre dos nodos.La misma imagen que el encabezado, pero con los autores claves rodeados en rojo
Para que el gráfico sea legible, sólo muestro los nodos con más enlaces. Como se describe en el primer epígrafe, los colores representan algoritmicamente descubiertos 'comunidades' utilizando la función de Gefi- s de modularidad - grupos de autores que citan y coautorizan mucho. Estas comunidades son probablemente bastante dependiente del conjunto inicial de búsquedas, sin embargo, algunos de ellos tienen sentido intuitivo. La 'comunidad de diseño participativo', por ejemplo, está muy bien definida. La comunidad rosada son todos los autores que he estado viendo en el tema de la democracia deliberativa.
Por otra parte, S Lukes habría tenido más sentido para mí en la comunidad verde con RA Dahl, a quien su trabajo hace extensa referencia. De hecho, como indica la clave, no puedo decir lo que la comunidad de lilas indica con ningún grado de confianza - su existencia puede ser el resultado de mi muestreo selectivo de la red académica en general. La centralidad del grupo lila indica que son comúnmente referenciados por todos los otros grupos, y Arrow y Rawls son dos de los investigadores con mayor referencia en la red. Puede ser esta propiedad, más que una especialidad de sujeto, que los nodos de lila tienen en común.
Hay una serie de casos límite anómalos como este.
¿Cómo ayuda a escribir un capítulo de literatura?
Me siento más cómodo con el paisaje de mi investigación con la red como una visión general, y la intención de añadir nuevas referencias a medida que surgen. Algunas lecciones clave se destacaron:- Y Guo, un investigador que nunca he encontrado (y probablemente no habría hecho a través de mi enfoque normal) está haciendo una investigación similar a la mía y haciendo referencia a la misma mezcla ecléctica de fuentes.
- Mi creencia anterior de que la comunidad de diseño participativo no hace referencia a Lukes ha resultado ser errónea. Mi opinión anterior se basaba en lo que yo pensaba que era una búsqueda sustancial, por lo que este fue un hallazgo sorprendente. Es difícil encontrar enlaces de citas usando un proceso manual cuando cualquier investigador de diseño participativo podría haber citado a Lukes.
- La comunidad de diseño participativo es difícil de entender. Este enfoque me ha ayudado a concentrarme en Hillgren como un autor muy relevante, un autor que no conocía antes.
- Estoy sorprendido (y complacido) de ver que Fishkin, que siempre parecía aislado para mí, está realmente bien integrado entre los autores que estoy haciendo referencia.
- Estoy interesado en The making of the social world del filósofo John Searle como parte de mi investigación. Aunque el libro estaba en las búsquedas iniciales, y el trabajo de Searle es famoso y ampliamente referenciado, no apareció como un nodo bien conectado en mi red. Tal vez su investigación no es tan relevante como yo pensaba, o tal vez es una conexión que debe hacerse.
- Bjorgvinsson es el nodo más grande de la red, lo que significa que tienen la mayoría de los enlaces entrantes. Sin embargo, su investigación no es de particular relevancia para la mía. 'Eyeballing' sugiere que Bjorgvinsson tiene muchas conexiones dentro del diseño participativo, pero poco alcance más amplio. Esta estructura de conectividad todavía nos dice algo sobre la comunidad, incluso si, como en este caso, puede que no sea algo que deba seguir.
Creo que un análisis más profundo podría revelar documentos menos citados que citan combinaciones interesantes de mis autores clave.
Este enfoque parece especialmente relevante para mi trabajo porque me estoy posicionando en relación con varias disciplinas. También parece importante en las humanidades más amplias, donde la búsqueda por palabra clave puede fallar al devolver resultados relevantes de otra disciplina con un vocabulario diferente.
Por último, debo reconocer en primer lugar que la red de citas no es la única manera de descubrir documentos, y también que Google Scholar es una fuente incompleta de datos en sí.
¿No es esto sólo un tipo avanzado de la dilación?
No le digas a mis supervisores.martes, 8 de noviembre de 2016
Redes matrimoniales y el tabú del incesto
matrimonio consanguíneo
Mantenerlo en la familia
El matrimonio entre parientes cercanos es demasiado común
The Economist
MAHA SAAD ZAKI, profesor de genética clínica, lleva a Ahmed, Fátima y su familia a su habitación en el Centro Nacional de Investigación de Egipto. Al menos tres de sus seis hijos tienen una enfermedad neurológica rara que se manifiesta alrededor de los cuatro años, causando retraso mental, pérdida del uso de sus extremidades y, más tarde, muerte. La hija de nueve años de la pareja se desploma, temblando. Esta enfermedad congénita ha aparecido porque, además de ser marido y mujer, Ahmed y Fátima son también primos hermanos (sus nombres han sido cambiados).
Casos como estos son muy comunes en el Medio Oriente y el norte de África. Casarse con un pariente cercano incrementa notablemente la probabilidad de que ambos padres sean portadores de genes recesivos peligrosos, lo que puede causar enfermedad cuando un niño hereda una copia del gen de ambos padres, como ocurrirá en el 25% de los casos. La gama de estas enfermedades va desde las conocidas como la microcefalia (en la que los niños tienen cabezas inusualmente pequeñas), la fibrosis quística y la talasemia, un trastorno sanguíneo, hasta trastornos completamente nuevos. "El noventa por ciento de los casos que veo son causados por matrimonios consanguíneos", dice la Sra. Zaki.
Las estadísticas sobre la prevalencia de matrimonios entre parientes cercanos hoy en día son escasas. Una vez que la práctica común en las sociedades occidentales, las estimaciones sugieren que el Oriente Medio, junto con África, siguen teniendo los niveles más altos del mundo. En Egipto, alrededor del 40% de la población se casa con un primo; La última encuesta realizada en Jordania, en 1992, encontró que el 32% estaba casado con un primo hermano; Otro 17,3% estaban casados con parientes más distantes. Se cree que las tasas son aún más altas en países tribales como Irak y los estados del Golfo de Arabia Saudita, Yemen y Kuwait.
Hoy la primera razón por la que los hombres y las mujeres buscan casarse dentro de la familia es porque saben mucho de sus parientes: quiénes son, qué ganan, qué errores pasados. Y las familias grandes significan que tienen muchos de ellos. "La gente está buscando la ética y las costumbres", dice Atef al-Shitany, del Ministerio de Salud de Egipto. Atar el nudo dentro también asegura la propiedad permanece en la familia. En Egipto superior, una zona agrícola rural, las tarifas son las más altas de Egipto.
A diferencia de Occidente, no hay estigma social; todo lo contrario. Una mujer egipcia de 38 años, que tiene dos hijos con micro-síndrome (que causa cataratas, pequeños genitales y dificultades de aprendizaje) debido a su matrimonio con un primo, dice que los familiares la critican por permitir que su hija de 18 años Para comprometerse con un "extraño" -el prometido no es una relación.
Muchos piensan erróneamente que los primos maternos no son parientes de sangre. La creencia islámica prevalente refuerza el matrimonio mixto, aunque también sucede entre los cristianos. El Corán permite el matrimonio a cualquier persona, pero los padres, hermanos, tías y tíos, sobrinos y sobrinas. De hecho, Fátima, la hija de Muhammad, se casó con su primo, Ali Ibn Abi Talib, señala Ahmed Mamdouh de Al Azhar, una universidad egipcia.
Muchos en la región, sin embargo, simplemente no saben de los riesgos de casarse con un miembro de la familia. Una pequeña encuesta realizada en Arabia Saudita encontró que los participantes eran 50% menos propensos a ver casarse con un primo de manera positiva cuando se les advierte de los problemas. "No nos habríamos casado si hubiéramos sabido", dice Ahmed.
Para reducir los trastornos genéticos, algunos países han hecho pruebas de sangre obligatoria para los novios, que han ayudado a reducir la incidencia de enfermedades como la anemia de células falciformes. En Túnez, el gobierno ordena consejería prematrimonial para todos los prometidos a un pariente.
En Egipto, donde la educación es a menudo rudimentaria, hay mucho más trabajo por hacer. Las parejas que conocen los riesgos a menudo creen-a veces porque su médico les dice que-los análisis de sangre básicos descartan el riesgo de cualquier enfermedad genética. "La única forma de evitar el sufrimiento no es casarse con parientes", dice Zaki. "Pero eso será imposible de lograr aquí."
Mantenerlo en la familia
El matrimonio entre parientes cercanos es demasiado común
The Economist
MAHA SAAD ZAKI, profesor de genética clínica, lleva a Ahmed, Fátima y su familia a su habitación en el Centro Nacional de Investigación de Egipto. Al menos tres de sus seis hijos tienen una enfermedad neurológica rara que se manifiesta alrededor de los cuatro años, causando retraso mental, pérdida del uso de sus extremidades y, más tarde, muerte. La hija de nueve años de la pareja se desploma, temblando. Esta enfermedad congénita ha aparecido porque, además de ser marido y mujer, Ahmed y Fátima son también primos hermanos (sus nombres han sido cambiados).
Casos como estos son muy comunes en el Medio Oriente y el norte de África. Casarse con un pariente cercano incrementa notablemente la probabilidad de que ambos padres sean portadores de genes recesivos peligrosos, lo que puede causar enfermedad cuando un niño hereda una copia del gen de ambos padres, como ocurrirá en el 25% de los casos. La gama de estas enfermedades va desde las conocidas como la microcefalia (en la que los niños tienen cabezas inusualmente pequeñas), la fibrosis quística y la talasemia, un trastorno sanguíneo, hasta trastornos completamente nuevos. "El noventa por ciento de los casos que veo son causados por matrimonios consanguíneos", dice la Sra. Zaki.
Las estadísticas sobre la prevalencia de matrimonios entre parientes cercanos hoy en día son escasas. Una vez que la práctica común en las sociedades occidentales, las estimaciones sugieren que el Oriente Medio, junto con África, siguen teniendo los niveles más altos del mundo. En Egipto, alrededor del 40% de la población se casa con un primo; La última encuesta realizada en Jordania, en 1992, encontró que el 32% estaba casado con un primo hermano; Otro 17,3% estaban casados con parientes más distantes. Se cree que las tasas son aún más altas en países tribales como Irak y los estados del Golfo de Arabia Saudita, Yemen y Kuwait.
Hoy la primera razón por la que los hombres y las mujeres buscan casarse dentro de la familia es porque saben mucho de sus parientes: quiénes son, qué ganan, qué errores pasados. Y las familias grandes significan que tienen muchos de ellos. "La gente está buscando la ética y las costumbres", dice Atef al-Shitany, del Ministerio de Salud de Egipto. Atar el nudo dentro también asegura la propiedad permanece en la familia. En Egipto superior, una zona agrícola rural, las tarifas son las más altas de Egipto.
A diferencia de Occidente, no hay estigma social; todo lo contrario. Una mujer egipcia de 38 años, que tiene dos hijos con micro-síndrome (que causa cataratas, pequeños genitales y dificultades de aprendizaje) debido a su matrimonio con un primo, dice que los familiares la critican por permitir que su hija de 18 años Para comprometerse con un "extraño" -el prometido no es una relación.
Muchos piensan erróneamente que los primos maternos no son parientes de sangre. La creencia islámica prevalente refuerza el matrimonio mixto, aunque también sucede entre los cristianos. El Corán permite el matrimonio a cualquier persona, pero los padres, hermanos, tías y tíos, sobrinos y sobrinas. De hecho, Fátima, la hija de Muhammad, se casó con su primo, Ali Ibn Abi Talib, señala Ahmed Mamdouh de Al Azhar, una universidad egipcia.
Muchos en la región, sin embargo, simplemente no saben de los riesgos de casarse con un miembro de la familia. Una pequeña encuesta realizada en Arabia Saudita encontró que los participantes eran 50% menos propensos a ver casarse con un primo de manera positiva cuando se les advierte de los problemas. "No nos habríamos casado si hubiéramos sabido", dice Ahmed.
Para reducir los trastornos genéticos, algunos países han hecho pruebas de sangre obligatoria para los novios, que han ayudado a reducir la incidencia de enfermedades como la anemia de células falciformes. En Túnez, el gobierno ordena consejería prematrimonial para todos los prometidos a un pariente.
En Egipto, donde la educación es a menudo rudimentaria, hay mucho más trabajo por hacer. Las parejas que conocen los riesgos a menudo creen-a veces porque su médico les dice que-los análisis de sangre básicos descartan el riesgo de cualquier enfermedad genética. "La única forma de evitar el sufrimiento no es casarse con parientes", dice Zaki. "Pero eso será imposible de lograr aquí."
domingo, 6 de noviembre de 2016
Bibliometría: Índice H
Índice h
El índice h es un sistema propuesto por Jorge Hirsch, de la Universidad de California, para la medición de la calidad profesional de físicos y de otros científicos, en función de la cantidad de citas que han recibido sus artículos científicos. Un científico tiene índice h si ha publicado h trabajos con al menos h citas cada uno.
h-index de un gráfico de citas decrecientes de papers numerados.
Definición
El índice h se calcula con base en la distribución de las citas que han recibido los trabajos científicos de un investigador. Al respecto, Hirsch dice:Un científico tiene índice h si el h de sus Np trabajos recibe al menos h citas cada uno, y los otros (Np - h) trabajos tienen como máximo h citas cada uno.1
Explicado de otro modo, si el factor h vale n, entonces n publicaciones han sido citadas más de n veces. Para hallarlo, basta ordenar los artículos de un autor o grupo por número de veces que han sido citados de mayor a menor, e ir recorriendo la lista hasta encontrar la última publicación cuyo número correlativo sea menor o igual que el número de citas: ese número correlativo es el factor h.
Así, el índice h es el balance entre el número de publicaciones y las citas a estas. El índice se diseñó para medir eficazmente la calidad del investigador, a diferencia de sistemas de medición más sencillos que cuentan citas o publicaciones, donde se hace una distinción entre aquellos investigadores que tienen una gran influencia en el mundo científico de aquellos que simplemente publican muchos trabajos. El índice funciona eficazmente solamente entre científicos del mismo campo, pues los mecanismos convencionales para citar los trabajos difieren entre cada uno de estos.
Hay programas en línea para calcular el índice h de un científico. También los índices h se pueden calcular manualmente, basándose en bases de datos accesibles en Internet, como Google Scholar, como una alternativa al tradicional factor de impacto de revistas a las que no se puede acceder libremente. Hirsch ha demostrado que h tiene importantes capacidades predictivas en relación con los honores que un científico pueda recibir o haya recibido, tales como el Premio Nobel. En física, un científico considerado productivo tiene un h por lo menos igual a la cantidad de años que lleva trabajando, mientras que en la ciencia biomédica estos valores son generalmente más altos.
Ciencias de la Computación Índice H significa 23, mediana 21
Psicología índice H significa 26, mediana 19
Enfermería Índice H media 20, mediana 18
Ciencias Sociales Índice H significa 19, mediana 16
Física / matemáticas H-índice media 23, mediana 22
Bio-medicina índice H significa 28, mediana 25
Ventajas
La principal desventaja de los viejos indicadores bibliométricos, tales como el número total de artículos o el número de citas es que en la primera medida no se aprecia la calidad de las publicaciones científicas, y la segunda se ve afectada desproporcionadamente por grupos que tienen pocas publicaciones y, sin embargo, un número grande de citas. El índice h pretende medir simultáneamente la calidad y la cantidad de la producción científica.El índice h también puede calcularse como una función dependiente del tiempo, de dos modos distintos. Originalmente, Hirsch propuso que h dependía linealmente de los años que se llevara investigando. En este caso se podían comparar científicos de edades distintas. Otra posibilidad es calcular h usando artículos publicados dentro de un período específico, por ejemplo, en los últimos 10 años. De este modo se mide la productividad actual.
Críticas
No es muy difícil comprender que el índice h puede llevar a confusiones en cuanto a la importancia de un científico porque, al estar limitado por el número de publicaciones totales, un científico de corta carrera está en clara desventaja y no se considera la importancia de sus primeros trabajos en una medida correcta. Por ejemplo, el índice h de Évariste Galois es 2, y se quedará así por siempre, independientemente del impacto de su trabajo. Adicionalmente, algunas desventajas del factor de impacto se aplican a la vez al índice h. Por ejemplo, los artículos de revisión suelen tener mayor cantidad de citas que los artículos originales, así que un autor hipotético que solamente escribiera revisiones obtendría un índice h mayor que el de los científicos que aportan trabajos originales.Finalmente, se ha observado que el índice h aminora drásticamente la importancia de trabajos singulares, dando valor a la productividad. En efecto, dos científicos pueden tener el mismo índice h (30, por ejemplo), siendo que uno de ellos escribió un trabajo con 200 citas y el otro no ha escrito ninguno con más de 30. Se han hecho varias propuestas para modificar este error evidente, pero ninguno se ha adoptado a nivel internacional.2 3
domingo, 30 de octubre de 2016
Modularidad en redes de células madres
Mapa de modularidad de la red de la diferenciación celular humana
Viviane Galvão, José G. V. Miranda, Roberto F. S. Andradeb, S. José Andrade Jr., Lazaros K. Gallose, y Hernán A. Maksee,
PNAS
El proceso de diferenciación celular juega un papel crucial en el desarrollo prenatal de los organismos multicelulares. Los recientes avances en la investigación sobre las propiedades de células madre y el desarrollo embrionario han descubierto varios pasos en el proceso de diferenciación (1-7). secuencias únicas y múltiples de la diferenciación celular han sido identificados a través de observaciones in vivo de un embrión en particular durante las primeras etapas de desarrollo, así como estudios de patología de abortos involuntarios durante las etapas finales del proceso. Mientras que la identificación de cada paso de la diferenciación celular ha sido objeto de una intensa investigación, una visión integrada de este complejo proceso sigue desaparecido. Tal punto de vista mundial promete revelar características asociadas con la organización modular a gran escala de los tipos de células (5-12) con el fin de descubrir los módulos funcionales entre tipos de células mediante el uso de análisis de redes teórico para la detección de la comunidad (9-11). En esta carta, nos aprovechamos de los conocimientos actuales sobre la secuencia de los procesos de diferenciación celular que se extiende sobre una vasta literatura especializada (1-6, 13-27) (SI Apéndice), para revelar y caracterizar las características topológicas y dinámicas asociadas con la red de la diferenciación celular humana (NHCD).
Los pasos iniciales de la NHCD se muestran en el recuadro de la Fig. 1, mientras que la estructura de la red resultante se muestra en el panel principal de la fig. 1 (SI Apéndice). El óvulo fertilizado es seguido por la etapa de la bola, y la formación de las capas de células germinales primarias. Actualmente, se sabe que hasta el punto de bola, la división celular es simétrica y produce más células madre totipotentes (1). Estas células dan lugar a todos los tejidos diferenciados del organismo, así como los tejidos extraembryonic (placenta, el cordón umbilical, etc.). Por otra parte, en el transcurso de todo el proceso de formación organismo, hay una disminución monotónica en el potencial de diferenciación (totipotentes → pluripotentes → multipotentes → unipotentes células) acompañado con un aumento de la especialización celular.
Fig. 1.
Representación de red compleja del proceso de diferenciación de la célula humana. Los primeros pasos de la construcción NHCD se muestran en el recuadro de esta figura. Estos pasos, que se sabe que está presente en la formación de la mayoría de los organismos multicelulares, incluyen la primera escisión de un huevo fertilizado, es decir, posteriormente, seguido de la etapa de la bola y la formación de capas de células germinales primarias, a saber, el ectodermo , mesodermo, endodermo y. El óvulo fecundado es una célula madre totipotentes. El blastocisto, a su vez, da lugar, simultáneamente trofoblasto y la masa celular interna. Estas dos células se diferencian más en otros tipos de células, y así sucesivamente. Siguiendo el proceso anterior hasta que el feto está completamente desarrollado produce el complejo de red que se muestra en esta figura. Cada nodo, representa como un círculo, corresponde a un tipo de célula y los bordes a un paso diferenciación. Toda la red se origina a partir del óvulo fecundado (indicado por un cuadrado rojo) y conduce a las células especializadas de un ser humano desarrollado. Círculos rellenos corresponden a los nodos que sobreviven al final del proceso de desarrollo, mientras que los círculos vacíos corresponden a tipos de células no sobrevivieron. Los nodos en las comunidades de funciones conocidas de la literatura se indican con diferentes colores, a excepción de aquellos tipos de células sin anotación funcional (ver Apéndice SI y el conjunto de datos S1 para la asociación de las funciones conocidas de C1 a C19 extraídos de la literatura).
Ciertos tipos de células pueden obtenerse tras más de un camino desde el óvulo fertilizado. Este proceso genera algunos bucles cerrados de los bordes de la red. El NHCD comprende 529 sucursales de diferentes longitudes con cada rama termina cuando los tipos de células no se someten a una mayor diferenciación. Nótese, sin embargo, que la más reciente compilación de tipos de células en adultos normales, sanos, humanos realizados en (6) informa de sólo 407 tipos de células. Por lo tanto, no todos los puntos finales de la rama corresponden a tipos de células en los seres humanos nacidos. Por lo tanto, no todos los 873 tipos de células están presentes en un ser humano. Entre los ausentes son las células de la placenta que se generan a partir del huevo fecundado durante el desarrollo embrionario, así como otros tipos de células somáticas que son importantes para el control de embrión y el desarrollo del feto. Los tipos de células que sobreviven en un ser humano se indican mediante círculos rellenos, mientras que los que no sobrevivieron se indican por círculos vacíos. Los datos recogidos completas se enumeran en el Apéndice SI y el conjunto de datos S1, incluyendo una enumeración de las células y los vínculos entre los tipos de células, su tiempo de aparición en días después de la fecundación (Ta), y la referencia a las publicaciones de informes de cada enlace. A lo mejor de nuestro conocimiento, la estructura identificada aquí proporciona el diagrama esquemático más completa del proceso de diferenciación humana hasta la fecha.
Es visualmente evidente de la figura. 1 que la NHCD tiene una estructura modular prominente. La diferenciación continua de células en funciones más especializadas conduce naturalmente a la formación de agrupaciones aisladas denso en el NHCD. Como una primera aproximación para entender esta estructura modular, agrupamos tipos de células en la red de la figura. 1 de acuerdo con sus funciones conocidas; diferentes colores indican 19 módulos funcionales extraídos de la bibliografía (C1-C19) (SI Apéndice). Las comunidades más numerosas fueron extraídos de los árbitros. 1-6, 13-27. Hay, sin embargo, un cierto grado de arbitrariedad en esta estructura modular como la separación de los nodos en comunidades en nuestro conjunto de datos no es única. Por ejemplo, la comunidad C12, el linaje neural, se podría dividir en dos subcomunidades, que representa la las células de apoyo (gliales) (1-3, 5, 6, 13,14) y neural. Por otra parte, el módulo de sistema neural podrían fusionarse con el módulo de sistema de ojo (1, 5, 6, 13) en una escala más grande, ya que tienen un tipo de célula ancestral común. Por lo tanto, una más fina o más gruesa estructura de la comunidad se pueden extraer de los datos cuando nos fijamos en toda la red en diferentes escalas de observación; Se necesita un algoritmo de módulo de detección modificado para identificar estas comunidades de una manera sistemática.
Conceptos teóricos de grafos nos permiten desentrañar la dependencia escala de la estructura modular de la NHCD. La teoría de grafos (11) define la distancia entre dos nodos (también llamados la distancia química) como el número de enlaces a lo largo de la ruta más corta entre los nodos de la red. Utilizamos esta idea de proponer un algoritmo de detección de la comunidad que identifica los módulos de tamaño ℓ compuesta de tipos de células altamente conectadas. El algoritmo encuentra el alicatado óptima de la red con el menor número posible de módulos, NB, de ℓ tamaño (12) (cada nodo se le asigna a un módulo o caja y todos los nodos en un módulo están a una distancia menor que ℓ). Este proceso resulta en un problema de optimización que se pueden resolver mediante el uso del algoritmo de caja que cubre explican en la figura. 2A, Materiales y Métodos Sección III y reportado en la referencia 28 como el máximo Excluidos misa Burning algoritmo (MEMB, el algoritmo se puede descargar desde http://lev.ccny.cuny.edu/~hmakse/soft_data.html). El requisito de un número mínimo de módulos para cubrir la red (NB) garantiza que la partición de la red es tal que cada módulo contiene el mayor número posible de nodos y enlaces dentro del módulo con la restricción de que los módulos no pueden exceder ℓ tamaño. Este proceso embaldosado optimizado da lugar a módulos con el menor número de enlaces que conectan con otros módulos lo que implica que el grado de modularidad, definida por (9-11, 29)
se maximiza. Aquí y representan el número de enlaces que se inician en un determinado módulo I y terminan ya sea dentro o fuera de i, respectivamente. Los grandes valores de () se corresponden con un mayor grado de modularidad. El valor de la modularidad de la red gráfico varía con ℓ, por lo que podemos detectar la dependencia de modularidad en diferentes escalas de longitud, o de manera equivalente la forma de los propios módulos se organizan en módulos más grandes que mejoran el grado de modularidad.
Fig. 2.
La detección de los módulos y de la red de módulos a diferentes escalas. (A) Demostración de que el algoritmo de caja cubre para una red esquemática, siguiendo el algoritmo MEMB en refs. 12 y 28 (SI Apéndice). Cubrimos la red con el menor número posible de cajas para un valor dado ℓ. Esto se hace en un proceso de dos etapas: (i) Se detecta el número más pequeño posible de los orígenes de la caja (que se muestra con el color cian) que proporcionan el número máximo de nodos (en masa) en cada cuadro, de acuerdo con el siguiente algoritmo de optimización: Nos calcular la masa asociada a cada nodo, y escoger el primer centro como el nodo con la masa más grande y marcar los nodos de este cuadro como con etiqueta. Repetimos el proceso desde los nodos restantes no centros para identificar a un segundo centro de la más alta masa, y así sucesivamente. (Ii) Construimos las cajas a través de la quema simultánea de estos nodos centrales hasta que toda la red se cubre con cajas. Por ejemplo, en ℓ = 3 hay cuatro cajas, donde la distancia máxima entre dos nodos en una caja es menor que ℓ. Del mismo modo, podemos cubrir la misma red con dos cajas en ℓ = 6. Estos dos cuadros son el resultado de la fusión de dos de las cuatro cajas en ℓ = 3. (B) Detalle de los módulos NHCD detectados por el algoritmo anterior en forma de caja que cubre de dos funciones particulares. El algoritmo detecta una jerarquía de sub-módulos, funciones conocidas y super-módulos de tamaño ℓ representa en diferentes colores. Mostramos los módulos identificados correspondientes al sistema de C12-C13 y el sistema neuronal de ojos (Fig. 2C y SI Apéndice) que aparecen por primera vez en ℓ = 15 y ℓ = 11, respectivamente. En otras escalas el algoritmo de caja que cubre detecta nuevas relaciones funcionales entre tipos de células expresadas en la sub obtenida y super-módulos. Por ejemplo, en ℓ = 11 el linaje neural se divide en dos sub-módulos, mientras que en ℓ = 19 las dos funciones se funden en un módulo de super. (C) La red de módulos a diferentes valores de l, detectada a través del algoritmo de caja que cubre. Cada nodo corresponde a uno de los tres tipos siguientes, en términos de aumento de escala: (i) Los sub-módulos (pequeños puntos grises) que son fracciones de un módulo totalmente funcional, (ii) Conocido módulos biológicos funcionales (círculos de colores), cuya color corresponde a las funciones de C1-C19, y (iii) Grandes módulos (gráficos circulares) que representan la unión de más de un módulo funcional conocido, descrito por los colores del gráfico circular. Los enlaces que se derivan de los módulos funcionales conocidos y super-módulos se muestran en rojo, y que se extienden progresivamente toda la red a medida que aumentamos ℓ.
Para una ℓ dado, se obtiene la cobertura óptima de la red con los módulos de NB [utilizamos el algoritmo MEMB (28) se explica en la Fig. 2A y Materiales y Métodos]. Análisis de la modularidad (Ec. 1) en la Fig. 3A muestra un aumento monotónico de con la falta de un valor característico de ℓ. De hecho, los datos pueden ser equipados con aproximadamente una forma funcional de ley de potencia:
que se detecta a través de la modularidad dM exponente. Nos caracterizamos la red mediante el uso de diferentes instantáneas en el tiempo y nos encontramos con que dM ≃ 2.0 es aproximadamente constante a lo largo de la evolución en el tiempo (Fig. 3A). Este valor pone de manifiesto un considerable grado de modularidad en todo el sistema [para la comparación, una red aleatoria tiene dM = 0 y un retículo uniforme tiene dM = 1 (29)], como se evidencia por la estructura de red en la Fig. 1. La falta de una característica escala de longitud en la modularidad se muestra en la Fig. 3A sugiere que los módulos aparecen en todas las escalas de longitud, es decir, los módulos se organizan dentro de los módulos más grandes de una manera auto-similar, de modo que las interconexiones entre los grupos repiten el carácter modular básica de toda la NHCD. Por lo tanto, la NHCD sigue siendo estadísticamente invariable cuando se observan a diferentes escalas. Variando el tamaño del módulo ℓ rendimientos la relación de escala para el número de módulos (Fig 3B.):
donde dB representa la dimensión fractal de la red (12). Nos encontramos con que el carácter fractal de los módulos se establece en las primeras etapas, produciendo 1,4 dB ≃ ya en 30 d (Fig. 3B). Como evoluciona la red, aumenta la dimensión fractal alcanza ligeramente y finalmente dB ≃ 1,9.
Fig. 3.
Propiedades modulares del NHCD. (A) Grado de modularidad de la red, , en diferentes momentos, t (indicado en la figura), como una función de la escala de observación, ℓ. (B) Número de cajas / módulos, NB, en comparación con el tamaño de los módulos, ℓ, identificado por el algoritmo de caja que cubre por diferentes redes en el tiempo t.
El significado de la ecuación. 2 es que los módulos deben ser interpretados en una escala de longitud dada. La Figura 2B muestra un ejemplo de tal organización jerárquica (Fig. 2C y la SI Apéndice muestran la estructura modular completo, mientras que una lista de módulos detectado aparece en conjunto de datos S2). Hay tres tipos de comunidades de tipos de células se identifican claramente en la Fig. 2B a medida que cambie ℓ. (I) Los módulos funcionales conocidos: Todo el linaje de los ojos (1, 5, 6, 13) se detecta como un único módulo por el algoritmo de caja que cubre al ℓ = 11, mientras que todo el linaje neuronal (1-3, 5, 6, 13, 14) aparece en ℓ = 15. Finer y módulos más gruesas son identificados por el algoritmo. (Ii) sub-módulos: En ℓ = 11 el linaje neural se divide en la neural principal y los módulos de células gliales de apoyo, mientras que para ℓ se identifican = 7 sub-módulos en el sistema del ojo. (Iii) Grandes módulos: Cuando se aumenta la longitud de ℓ = 19, el ojo y el sistema neural forman un único super-módulo. Por lo tanto, cada tipo de célula está conectado a otros tipos de acuerdo en que los grupos de nodos de todos los tamaños auto-organizarse después de un solo principio. Esta propiedad nos permite renormalizar la red (12) mediante la sustitución de cada módulo detectado por un solo supernode para identificar la red de módulos como se muestra en la Fig. 2C. Siguiendo la evolución y la interdependencia de estos super-módulos, como se ve en la Fig. 2C, identifica las familias de los tipos de células en diferentes escalas. Este mapa de la modularidad es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en las funciones orgánicas.
La dinámica que conducen a una estructura de este tipo pueden desenmarañarse por el estudio de la NHCD como un proceso de crecimiento. El conocimiento del tiempo de aparición de cada tipo de célula, Ta, hace posible seguir el crecimiento acumulado del embrión y el feto en términos del número total de tipos de células en el momento t, N (t), así como el número de tipos de células que sobreviven el tiempo en el organismo (Fig. 4A). Como se esperaba, las células supervivientes surgen en las etapas posteriores del período de gestación. Sin embargo, la diferencia entre el total y el número de tipos de células supervivientes indica que la generación de nuevos tipos de células que no sobrevivieron tiene lugar incluso durante los meses de gestación finales.
Fig. 4.
Propiedades de crecimiento de la NHCD. (A) Número de tipos de células en la red, N (t), como una función del tiempo. Nos encontramos con información precisa sobre el tiempo de aparición, Ta, por 782 entre los 873 tipos de células. Esas células con apariencia tiempo que falta no se han tenido en cuenta en esta parcela. También se muestra la evolución temporal del número de células sobrevivientes y no sobrevivientes. (B) Número de nodos cuyos aumentos grado en el tiempo t (Red de histograma) y el número de nuevos enlaces que aparecen en la red (azul histograma) como una función del tiempo. Si todos los nodos estaban dando sólo un niño entonces los dos histogramas coincidirían. Recuadro: El número medio de nuevos enlaces por nodo en un momento dado se puede encontrar dividiendo los dos histogramas en la trama principal. Este gráfico muestra la intensidad de la actividad es en ese momento en particular. A pesar de la variación en la actividad, la nueva conexiones promedio alrededor de uno que da una relación de derivación crítica de <k> ≃ 2. (C) Número de tipos de células en comparación con la distancia química al primer nodo, ℓN1. Esta distancia se determina solamente por las conexiones entre los tipos de células y no se ve influenciada por el tiempo de aparición de modo que incluimos todos los 873 tipos de células. (D) Promedio grado <k> de la red como una función del tiempo que muestra que la red alcanza el estado de proceso de ramificación crítico <k> ≈ 2 a alrededor de T * = 40 días.
El aumento de tamaño de la red, N (t), es inicialmente aproximadamente exponencial y después de t * = 40 días cambia en un crecimiento más lento (Fig. 4A). Sólo un pequeño porcentaje de los nodos de crecer dentro de un intervalo de tiempo dado de manera que la actividad de la red se centra en un pequeño número de ellos en un momento dado. El número de nodos que se diferencian en un momento dado se muestran en la Fig. 4B. Observamos una actividad que aumenta monótonamente hasta alrededor de t * = 40 días y luego se reduce a valores más bajos. El cruce de tiempo T * = 40 días observarse en la Fig. 4A y B separa dos regímenes de crecimiento y corresponde aproximadamente a la vez debajo de la cual la mayor parte de las células tienen una característica de plástico (es decir, la capacidad para diferenciar) y por encima del cual empiezan a ser funcional (1). Curiosamente, los dos regímenes observados en N (t) se funden en una sola curva funcional universal cuando nos Replot N (ℓN1) como una función de la distancia químico para el huevo fertilizado, ℓN1 (Fig. 4C). Este resultado sugiere que la distancia topológica en la red ℓN1 es la variable natural para caracterizar el proceso de crecimiento en una forma universal en lugar del tiempo. La dinámica de N (ℓ) sigue un proceso logístico típica (Verhulst) de crecimiento de la población, donde la tasa de crecimiento está restringido por las limitaciones ambientales:
con una solución,
(Véase el accesorio en la Fig. 4C), donde NF es el número final de tipos de células y r = 0,65 es la tasa de crecimiento de tipos de células.
El análisis de la conectividad de red revela que el número medio de enlaces por nodo en la etapa final de todo el NHCD es <k> = 2,24 (Fig. 4D). A pesar de que <k> ≈ 2, existe una amplia distribución de grado [libres de escala (11), P (k) ~ k-γ, γ ≃ 3.0 y Apéndice SI]. Esto implica que siempre hay un pequeño número de tipos de células cruciales que diferencian mucho más que los otros, un hecho que está de acuerdo con la evidencia de la existencia de unas pocas células con gran potencial de plasticidad. Como este potencial se pierde rápidamente después de 40 d, tipos de células cambian su capacidad de desarrollo a favor de la vida de mantenimiento organismo.
El hecho de que el grado medio está cerca de dos implica que la evolución dinámica de NHCD puede ser descrita por un proceso crítico de ramificación en el que cada nodo tiene una cierta probabilidad de descendientes de generación, en cuyo caso el estado crítico para la ramificación de continuar es <k > = 2 (30). Esto significa efectivamente que cada nodo tiene que dar al menos un descendiente de la red para seguir creciendo. Si <k> <2, el crecimiento se detiene pronto, mientras que para <k>> 2 el crecimiento sería más rápido que exponencial.
La red alcanza la condición de criticidad, <k> ≈ 2, alrededor de t * = 40 días (Fig. 4D), en relación con la transición de la plasticidad de comportamiento funcional. Después de esto, el grado medio se mantiene justo por encima de la criticidad de sostener una tasa de crecimiento que garantice la supervivencia de la red. La mayoría de los nodos propagar el crecimiento en una sola línea, pero hay nodos que generan significativamente más descendientes para generar la diversidad implícitos en las distribuciones de ley potencial de grado y modularidad.
Descubrimos una ley dinámica de ramificación crítico explicar la aparición de la topología de red que revela una estructura modular invariante en escala de la red de tipos de células. Las características modulares auto-similares evidenciaron en las figuras. 1, 2, y 3 se establecen al principio del proceso y permanecen invariables durante la evolución de la NHCD, aunque el tamaño de la red cambia de manera significativa.
Mediante el uso de esta ley, somos capaces de observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células, o módulos, y su conectividad a otros módulos dentro de sus propias y otras funciones. La organización jerárquica resultante consiste en sub-módulos, funciones biológicas conocidas, y super-módulos de tejidos y órganos especializados emergentes en escalas diferentes. Este descubrimiento es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en funciones de los órganos de una manera sistemática. Además, esta información podría ser de importancia en el suministro de predicciones de atributos funcionales a un número de módulos identificados de tipos de células en la NHCD.
En este trabajo ponemos en práctica la máxima Excluidos misa Burning (MEMB) algoritmo a partir de (28) para la caja de cubierta. El algoritmo utiliza la idea básica de la optimización de la caja, donde se requiere que cada caja debe cubrir el máximo número posible de nodos, y funciona de la siguiente manera: Para una ℓ dada, en primer lugar localizar los nodos óptimos "centrales" que actuarán como los orígenes para las cajas. Esto se hace calculando primero el número de nodos (llamada la masa) dentro de un ℓ diámetro de cada nodo. El nodo que produce la masa más grande está marcado como centro. Luego marcamos todos los nodos de la caja de este nodo central como "etiquetado". Repetimos el proceso de cálculo de la masa de las cajas a partir de todos los nodos noncenter, e identificamos un segundo centro de acuerdo con la masa restante más grande, mientras que los nodos en el cuadro correspondiente etiquetados, y así sucesivamente. Cuando todos los nodos son o centros o etiquetados hemos identificado el número mínimo de centros que pueden cubrir la red en el valor ℓ dado. A partir de estos centros como orígenes de la caja, que luego grabar simultáneamente las cajas de cada origen hasta que toda la red está cubierto, es decir, cada nodo se le asigna a una caja [llamamos a esto quema proceso, ya que es similar a la quema de los algoritmos desarrollados para investigar la agrupación estadísticas en teoría de la percolación (11)]. En la Fig. 2A se muestra cómo la caja que cubre las obras de una red simple en dos valores diferentes l.
Este algoritmo es impulsado por la proximidad entre los nodos y la maximización de la masa asociada con cada centro de módulo (12, 28). Por lo tanto, detecta cajas que maximizan la modularidad (Ec. 1). En el caso de MEMB, tenemos la ventaja adicional de detección de módulos a diferentes escalas para que podamos estudiar el carácter jerárquico de la modularidad, es decir, los módulos de los módulos, y podemos detectar si la modularidad es una característica de la red que se mantiene escala- invariante.
La dimensión fractal dB de una compleja red es un exponente que determina cómo la masa (de forma equivalente: el número de nodos) en torno a cualquier nodo dado se escala con la longitud que en las redes corresponde a la distancia más corta entre dos nodos. Para medir numéricamente este exponente cubrimos de manera óptima la red con las cajas utilizando el algoritmo de MEMB. Un cuadro es un conjunto de nodos en los que todas las distancias ℓij entre dos nodos i y j en este conjunto son más pequeños que un valor dado de ℓ, el tamaño de la caja. Aunque hay un gran número de cubiertas, para cada valor de ℓ queremos encontrar el que le da el menor número posible de cajas, NB (ℓ). Variando ℓ produce entonces la relación de escala (Ec. 3). Una dimensión finita fractal revela los principios fundamentales de la organización de la red subyacente, es decir, un carácter estructural auto-similares, donde la red se construye de una manera similar a pesar de que lo observamos en diferentes escalas de longitud-. Las cajas que son identificados a través de este proceso corresponden a los módulos a escalas diferentes.
Viviane Galvão, José G. V. Miranda, Roberto F. S. Andradeb, S. José Andrade Jr., Lazaros K. Gallose, y Hernán A. Maksee,
PNAS
Resumen
La diferenciación celular en los organismos multicelulares es un proceso complejo, cuyo mecanismo puede ser entendido por un enfoque reduccionista, en el que se identifican los procesos individuales que controlan la generación de diferentes tipos de células. Como alternativa, un enfoque a gran escala en busca de diferentes características organizativas de las etapas de crecimiento promete revelar su estructura global modular con el objetivo de descubrir las relaciones antes desconocidas entre tipos de células. En este sentido, clasificar y analizar un gran conjunto de datos dispersos para la construcción de la red de la diferenciación de células humanas (NHCD) basado en tipos de células (nodos) y etapas de diferenciación (links) desde el huevo fertilizado a un ser humano desarrollado. Descubrimos una ley dinámica de ramificación crítico que revela una regularidad auto-similares en la organización modular de la red, y nos permite observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células después de una organización jerárquica, que van desde los sub-módulos a los super-módulos de tejidos y órganos especializados en distintas escalas. Este descubrimiento permitirá a uno para tratar el desarrollo de una función celular particular en el contexto de la compleja red de desarrollo humano como un todo. Nuestros resultados apuntan a una visión integrada a gran escala de la red de tipos de células que revela sistemáticamente vínculos entre dominios previamente no relacionados en las funciones orgánicas.
El proceso de diferenciación celular juega un papel crucial en el desarrollo prenatal de los organismos multicelulares. Los recientes avances en la investigación sobre las propiedades de células madre y el desarrollo embrionario han descubierto varios pasos en el proceso de diferenciación (1-7). secuencias únicas y múltiples de la diferenciación celular han sido identificados a través de observaciones in vivo de un embrión en particular durante las primeras etapas de desarrollo, así como estudios de patología de abortos involuntarios durante las etapas finales del proceso. Mientras que la identificación de cada paso de la diferenciación celular ha sido objeto de una intensa investigación, una visión integrada de este complejo proceso sigue desaparecido. Tal punto de vista mundial promete revelar características asociadas con la organización modular a gran escala de los tipos de células (5-12) con el fin de descubrir los módulos funcionales entre tipos de células mediante el uso de análisis de redes teórico para la detección de la comunidad (9-11). En esta carta, nos aprovechamos de los conocimientos actuales sobre la secuencia de los procesos de diferenciación celular que se extiende sobre una vasta literatura especializada (1-6, 13-27) (SI Apéndice), para revelar y caracterizar las características topológicas y dinámicas asociadas con la red de la diferenciación celular humana (NHCD).
I. Resultados
Construimos la NHCD recopilando sistemáticamente la información dispersa sobre la evolución de cada tipo de célula presente en el embrión y el feto a partir de un antecesor con un mayor grado de potencial de diferenciación en un tipo más especializado. El proceso de diferenciación de las células es luego mapea en una red compleja que consta de 873 nodos conectados a través de 977 bordes. Los nodos de la red representan distintos tipos de células descritos en la literatura (1-6, 13-27) y los bordes representan la asociación entre dos tipos de células a través de un evento de diferenciación.Los pasos iniciales de la NHCD se muestran en el recuadro de la Fig. 1, mientras que la estructura de la red resultante se muestra en el panel principal de la fig. 1 (SI Apéndice). El óvulo fertilizado es seguido por la etapa de la bola, y la formación de las capas de células germinales primarias. Actualmente, se sabe que hasta el punto de bola, la división celular es simétrica y produce más células madre totipotentes (1). Estas células dan lugar a todos los tejidos diferenciados del organismo, así como los tejidos extraembryonic (placenta, el cordón umbilical, etc.). Por otra parte, en el transcurso de todo el proceso de formación organismo, hay una disminución monotónica en el potencial de diferenciación (totipotentes → pluripotentes → multipotentes → unipotentes células) acompañado con un aumento de la especialización celular.
Fig. 1.
Representación de red compleja del proceso de diferenciación de la célula humana. Los primeros pasos de la construcción NHCD se muestran en el recuadro de esta figura. Estos pasos, que se sabe que está presente en la formación de la mayoría de los organismos multicelulares, incluyen la primera escisión de un huevo fertilizado, es decir, posteriormente, seguido de la etapa de la bola y la formación de capas de células germinales primarias, a saber, el ectodermo , mesodermo, endodermo y. El óvulo fecundado es una célula madre totipotentes. El blastocisto, a su vez, da lugar, simultáneamente trofoblasto y la masa celular interna. Estas dos células se diferencian más en otros tipos de células, y así sucesivamente. Siguiendo el proceso anterior hasta que el feto está completamente desarrollado produce el complejo de red que se muestra en esta figura. Cada nodo, representa como un círculo, corresponde a un tipo de célula y los bordes a un paso diferenciación. Toda la red se origina a partir del óvulo fecundado (indicado por un cuadrado rojo) y conduce a las células especializadas de un ser humano desarrollado. Círculos rellenos corresponden a los nodos que sobreviven al final del proceso de desarrollo, mientras que los círculos vacíos corresponden a tipos de células no sobrevivieron. Los nodos en las comunidades de funciones conocidas de la literatura se indican con diferentes colores, a excepción de aquellos tipos de células sin anotación funcional (ver Apéndice SI y el conjunto de datos S1 para la asociación de las funciones conocidas de C1 a C19 extraídos de la literatura).
Ciertos tipos de células pueden obtenerse tras más de un camino desde el óvulo fertilizado. Este proceso genera algunos bucles cerrados de los bordes de la red. El NHCD comprende 529 sucursales de diferentes longitudes con cada rama termina cuando los tipos de células no se someten a una mayor diferenciación. Nótese, sin embargo, que la más reciente compilación de tipos de células en adultos normales, sanos, humanos realizados en (6) informa de sólo 407 tipos de células. Por lo tanto, no todos los puntos finales de la rama corresponden a tipos de células en los seres humanos nacidos. Por lo tanto, no todos los 873 tipos de células están presentes en un ser humano. Entre los ausentes son las células de la placenta que se generan a partir del huevo fecundado durante el desarrollo embrionario, así como otros tipos de células somáticas que son importantes para el control de embrión y el desarrollo del feto. Los tipos de células que sobreviven en un ser humano se indican mediante círculos rellenos, mientras que los que no sobrevivieron se indican por círculos vacíos. Los datos recogidos completas se enumeran en el Apéndice SI y el conjunto de datos S1, incluyendo una enumeración de las células y los vínculos entre los tipos de células, su tiempo de aparición en días después de la fecundación (Ta), y la referencia a las publicaciones de informes de cada enlace. A lo mejor de nuestro conocimiento, la estructura identificada aquí proporciona el diagrama esquemático más completa del proceso de diferenciación humana hasta la fecha.
Es visualmente evidente de la figura. 1 que la NHCD tiene una estructura modular prominente. La diferenciación continua de células en funciones más especializadas conduce naturalmente a la formación de agrupaciones aisladas denso en el NHCD. Como una primera aproximación para entender esta estructura modular, agrupamos tipos de células en la red de la figura. 1 de acuerdo con sus funciones conocidas; diferentes colores indican 19 módulos funcionales extraídos de la bibliografía (C1-C19) (SI Apéndice). Las comunidades más numerosas fueron extraídos de los árbitros. 1-6, 13-27. Hay, sin embargo, un cierto grado de arbitrariedad en esta estructura modular como la separación de los nodos en comunidades en nuestro conjunto de datos no es única. Por ejemplo, la comunidad C12, el linaje neural, se podría dividir en dos subcomunidades, que representa la las células de apoyo (gliales) (1-3, 5, 6, 13,14) y neural. Por otra parte, el módulo de sistema neural podrían fusionarse con el módulo de sistema de ojo (1, 5, 6, 13) en una escala más grande, ya que tienen un tipo de célula ancestral común. Por lo tanto, una más fina o más gruesa estructura de la comunidad se pueden extraer de los datos cuando nos fijamos en toda la red en diferentes escalas de observación; Se necesita un algoritmo de módulo de detección modificado para identificar estas comunidades de una manera sistemática.
Conceptos teóricos de grafos nos permiten desentrañar la dependencia escala de la estructura modular de la NHCD. La teoría de grafos (11) define la distancia entre dos nodos (también llamados la distancia química) como el número de enlaces a lo largo de la ruta más corta entre los nodos de la red. Utilizamos esta idea de proponer un algoritmo de detección de la comunidad que identifica los módulos de tamaño ℓ compuesta de tipos de células altamente conectadas. El algoritmo encuentra el alicatado óptima de la red con el menor número posible de módulos, NB, de ℓ tamaño (12) (cada nodo se le asigna a un módulo o caja y todos los nodos en un módulo están a una distancia menor que ℓ). Este proceso resulta en un problema de optimización que se pueden resolver mediante el uso del algoritmo de caja que cubre explican en la figura. 2A, Materiales y Métodos Sección III y reportado en la referencia 28 como el máximo Excluidos misa Burning algoritmo (MEMB, el algoritmo se puede descargar desde http://lev.ccny.cuny.edu/~hmakse/soft_data.html). El requisito de un número mínimo de módulos para cubrir la red (NB) garantiza que la partición de la red es tal que cada módulo contiene el mayor número posible de nodos y enlaces dentro del módulo con la restricción de que los módulos no pueden exceder ℓ tamaño. Este proceso embaldosado optimizado da lugar a módulos con el menor número de enlaces que conectan con otros módulos lo que implica que el grado de modularidad, definida por (9-11, 29)
se maximiza. Aquí y representan el número de enlaces que se inician en un determinado módulo I y terminan ya sea dentro o fuera de i, respectivamente. Los grandes valores de () se corresponden con un mayor grado de modularidad. El valor de la modularidad de la red gráfico varía con ℓ, por lo que podemos detectar la dependencia de modularidad en diferentes escalas de longitud, o de manera equivalente la forma de los propios módulos se organizan en módulos más grandes que mejoran el grado de modularidad.
Fig. 2.
La detección de los módulos y de la red de módulos a diferentes escalas. (A) Demostración de que el algoritmo de caja cubre para una red esquemática, siguiendo el algoritmo MEMB en refs. 12 y 28 (SI Apéndice). Cubrimos la red con el menor número posible de cajas para un valor dado ℓ. Esto se hace en un proceso de dos etapas: (i) Se detecta el número más pequeño posible de los orígenes de la caja (que se muestra con el color cian) que proporcionan el número máximo de nodos (en masa) en cada cuadro, de acuerdo con el siguiente algoritmo de optimización: Nos calcular la masa asociada a cada nodo, y escoger el primer centro como el nodo con la masa más grande y marcar los nodos de este cuadro como con etiqueta. Repetimos el proceso desde los nodos restantes no centros para identificar a un segundo centro de la más alta masa, y así sucesivamente. (Ii) Construimos las cajas a través de la quema simultánea de estos nodos centrales hasta que toda la red se cubre con cajas. Por ejemplo, en ℓ = 3 hay cuatro cajas, donde la distancia máxima entre dos nodos en una caja es menor que ℓ. Del mismo modo, podemos cubrir la misma red con dos cajas en ℓ = 6. Estos dos cuadros son el resultado de la fusión de dos de las cuatro cajas en ℓ = 3. (B) Detalle de los módulos NHCD detectados por el algoritmo anterior en forma de caja que cubre de dos funciones particulares. El algoritmo detecta una jerarquía de sub-módulos, funciones conocidas y super-módulos de tamaño ℓ representa en diferentes colores. Mostramos los módulos identificados correspondientes al sistema de C12-C13 y el sistema neuronal de ojos (Fig. 2C y SI Apéndice) que aparecen por primera vez en ℓ = 15 y ℓ = 11, respectivamente. En otras escalas el algoritmo de caja que cubre detecta nuevas relaciones funcionales entre tipos de células expresadas en la sub obtenida y super-módulos. Por ejemplo, en ℓ = 11 el linaje neural se divide en dos sub-módulos, mientras que en ℓ = 19 las dos funciones se funden en un módulo de super. (C) La red de módulos a diferentes valores de l, detectada a través del algoritmo de caja que cubre. Cada nodo corresponde a uno de los tres tipos siguientes, en términos de aumento de escala: (i) Los sub-módulos (pequeños puntos grises) que son fracciones de un módulo totalmente funcional, (ii) Conocido módulos biológicos funcionales (círculos de colores), cuya color corresponde a las funciones de C1-C19, y (iii) Grandes módulos (gráficos circulares) que representan la unión de más de un módulo funcional conocido, descrito por los colores del gráfico circular. Los enlaces que se derivan de los módulos funcionales conocidos y super-módulos se muestran en rojo, y que se extienden progresivamente toda la red a medida que aumentamos ℓ.
Para una ℓ dado, se obtiene la cobertura óptima de la red con los módulos de NB [utilizamos el algoritmo MEMB (28) se explica en la Fig. 2A y Materiales y Métodos]. Análisis de la modularidad (Ec. 1) en la Fig. 3A muestra un aumento monotónico de con la falta de un valor característico de ℓ. De hecho, los datos pueden ser equipados con aproximadamente una forma funcional de ley de potencia:
que se detecta a través de la modularidad dM exponente. Nos caracterizamos la red mediante el uso de diferentes instantáneas en el tiempo y nos encontramos con que dM ≃ 2.0 es aproximadamente constante a lo largo de la evolución en el tiempo (Fig. 3A). Este valor pone de manifiesto un considerable grado de modularidad en todo el sistema [para la comparación, una red aleatoria tiene dM = 0 y un retículo uniforme tiene dM = 1 (29)], como se evidencia por la estructura de red en la Fig. 1. La falta de una característica escala de longitud en la modularidad se muestra en la Fig. 3A sugiere que los módulos aparecen en todas las escalas de longitud, es decir, los módulos se organizan dentro de los módulos más grandes de una manera auto-similar, de modo que las interconexiones entre los grupos repiten el carácter modular básica de toda la NHCD. Por lo tanto, la NHCD sigue siendo estadísticamente invariable cuando se observan a diferentes escalas. Variando el tamaño del módulo ℓ rendimientos la relación de escala para el número de módulos (Fig 3B.):
donde dB representa la dimensión fractal de la red (12). Nos encontramos con que el carácter fractal de los módulos se establece en las primeras etapas, produciendo 1,4 dB ≃ ya en 30 d (Fig. 3B). Como evoluciona la red, aumenta la dimensión fractal alcanza ligeramente y finalmente dB ≃ 1,9.
Fig. 3.
Propiedades modulares del NHCD. (A) Grado de modularidad de la red, , en diferentes momentos, t (indicado en la figura), como una función de la escala de observación, ℓ. (B) Número de cajas / módulos, NB, en comparación con el tamaño de los módulos, ℓ, identificado por el algoritmo de caja que cubre por diferentes redes en el tiempo t.
El significado de la ecuación. 2 es que los módulos deben ser interpretados en una escala de longitud dada. La Figura 2B muestra un ejemplo de tal organización jerárquica (Fig. 2C y la SI Apéndice muestran la estructura modular completo, mientras que una lista de módulos detectado aparece en conjunto de datos S2). Hay tres tipos de comunidades de tipos de células se identifican claramente en la Fig. 2B a medida que cambie ℓ. (I) Los módulos funcionales conocidos: Todo el linaje de los ojos (1, 5, 6, 13) se detecta como un único módulo por el algoritmo de caja que cubre al ℓ = 11, mientras que todo el linaje neuronal (1-3, 5, 6, 13, 14) aparece en ℓ = 15. Finer y módulos más gruesas son identificados por el algoritmo. (Ii) sub-módulos: En ℓ = 11 el linaje neural se divide en la neural principal y los módulos de células gliales de apoyo, mientras que para ℓ se identifican = 7 sub-módulos en el sistema del ojo. (Iii) Grandes módulos: Cuando se aumenta la longitud de ℓ = 19, el ojo y el sistema neural forman un único super-módulo. Por lo tanto, cada tipo de célula está conectado a otros tipos de acuerdo en que los grupos de nodos de todos los tamaños auto-organizarse después de un solo principio. Esta propiedad nos permite renormalizar la red (12) mediante la sustitución de cada módulo detectado por un solo supernode para identificar la red de módulos como se muestra en la Fig. 2C. Siguiendo la evolución y la interdependencia de estos super-módulos, como se ve en la Fig. 2C, identifica las familias de los tipos de células en diferentes escalas. Este mapa de la modularidad es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en las funciones orgánicas.
La dinámica que conducen a una estructura de este tipo pueden desenmarañarse por el estudio de la NHCD como un proceso de crecimiento. El conocimiento del tiempo de aparición de cada tipo de célula, Ta, hace posible seguir el crecimiento acumulado del embrión y el feto en términos del número total de tipos de células en el momento t, N (t), así como el número de tipos de células que sobreviven el tiempo en el organismo (Fig. 4A). Como se esperaba, las células supervivientes surgen en las etapas posteriores del período de gestación. Sin embargo, la diferencia entre el total y el número de tipos de células supervivientes indica que la generación de nuevos tipos de células que no sobrevivieron tiene lugar incluso durante los meses de gestación finales.
Fig. 4.
Propiedades de crecimiento de la NHCD. (A) Número de tipos de células en la red, N (t), como una función del tiempo. Nos encontramos con información precisa sobre el tiempo de aparición, Ta, por 782 entre los 873 tipos de células. Esas células con apariencia tiempo que falta no se han tenido en cuenta en esta parcela. También se muestra la evolución temporal del número de células sobrevivientes y no sobrevivientes. (B) Número de nodos cuyos aumentos grado en el tiempo t (Red de histograma) y el número de nuevos enlaces que aparecen en la red (azul histograma) como una función del tiempo. Si todos los nodos estaban dando sólo un niño entonces los dos histogramas coincidirían. Recuadro: El número medio de nuevos enlaces por nodo en un momento dado se puede encontrar dividiendo los dos histogramas en la trama principal. Este gráfico muestra la intensidad de la actividad es en ese momento en particular. A pesar de la variación en la actividad, la nueva conexiones promedio alrededor de uno que da una relación de derivación crítica de <k> ≃ 2. (C) Número de tipos de células en comparación con la distancia química al primer nodo, ℓN1. Esta distancia se determina solamente por las conexiones entre los tipos de células y no se ve influenciada por el tiempo de aparición de modo que incluimos todos los 873 tipos de células. (D) Promedio grado <k> de la red como una función del tiempo que muestra que la red alcanza el estado de proceso de ramificación crítico <k> ≈ 2 a alrededor de T * = 40 días.
El aumento de tamaño de la red, N (t), es inicialmente aproximadamente exponencial y después de t * = 40 días cambia en un crecimiento más lento (Fig. 4A). Sólo un pequeño porcentaje de los nodos de crecer dentro de un intervalo de tiempo dado de manera que la actividad de la red se centra en un pequeño número de ellos en un momento dado. El número de nodos que se diferencian en un momento dado se muestran en la Fig. 4B. Observamos una actividad que aumenta monótonamente hasta alrededor de t * = 40 días y luego se reduce a valores más bajos. El cruce de tiempo T * = 40 días observarse en la Fig. 4A y B separa dos regímenes de crecimiento y corresponde aproximadamente a la vez debajo de la cual la mayor parte de las células tienen una característica de plástico (es decir, la capacidad para diferenciar) y por encima del cual empiezan a ser funcional (1). Curiosamente, los dos regímenes observados en N (t) se funden en una sola curva funcional universal cuando nos Replot N (ℓN1) como una función de la distancia químico para el huevo fertilizado, ℓN1 (Fig. 4C). Este resultado sugiere que la distancia topológica en la red ℓN1 es la variable natural para caracterizar el proceso de crecimiento en una forma universal en lugar del tiempo. La dinámica de N (ℓ) sigue un proceso logístico típica (Verhulst) de crecimiento de la población, donde la tasa de crecimiento está restringido por las limitaciones ambientales:
con una solución,
(Véase el accesorio en la Fig. 4C), donde NF es el número final de tipos de células y r = 0,65 es la tasa de crecimiento de tipos de células.
El análisis de la conectividad de red revela que el número medio de enlaces por nodo en la etapa final de todo el NHCD es <k> = 2,24 (Fig. 4D). A pesar de que <k> ≈ 2, existe una amplia distribución de grado [libres de escala (11), P (k) ~ k-γ, γ ≃ 3.0 y Apéndice SI]. Esto implica que siempre hay un pequeño número de tipos de células cruciales que diferencian mucho más que los otros, un hecho que está de acuerdo con la evidencia de la existencia de unas pocas células con gran potencial de plasticidad. Como este potencial se pierde rápidamente después de 40 d, tipos de células cambian su capacidad de desarrollo a favor de la vida de mantenimiento organismo.
El hecho de que el grado medio está cerca de dos implica que la evolución dinámica de NHCD puede ser descrita por un proceso crítico de ramificación en el que cada nodo tiene una cierta probabilidad de descendientes de generación, en cuyo caso el estado crítico para la ramificación de continuar es <k > = 2 (30). Esto significa efectivamente que cada nodo tiene que dar al menos un descendiente de la red para seguir creciendo. Si <k> <2, el crecimiento se detiene pronto, mientras que para <k>> 2 el crecimiento sería más rápido que exponencial.
La red alcanza la condición de criticidad, <k> ≈ 2, alrededor de t * = 40 días (Fig. 4D), en relación con la transición de la plasticidad de comportamiento funcional. Después de esto, el grado medio se mantiene justo por encima de la criticidad de sostener una tasa de crecimiento que garantice la supervivencia de la red. La mayoría de los nodos propagar el crecimiento en una sola línea, pero hay nodos que generan significativamente más descendientes para generar la diversidad implícitos en las distribuciones de ley potencial de grado y modularidad.
II. Discusión
En resumen, presentamos un estudio a gran escala de la evolución prenatal del proceso de diferenciación celular humana desde el óvulo fertilizado a un ser humano desarrollado. El proceso de diferenciación de células humanas se puede asignar a una red compleja compuesta de tipos de células y etapas de diferenciación. Este mapeo permite estudiar el proceso de diferenciación de las células con el estado de la teoría de redes técnica para la detección de la comunidad con el objetivo de identificar las relaciones funcionales hasta ahora desconocidas entre tipos de células.Descubrimos una ley dinámica de ramificación crítico explicar la aparición de la topología de red que revela una estructura modular invariante en escala de la red de tipos de células. Las características modulares auto-similares evidenciaron en las figuras. 1, 2, y 3 se establecen al principio del proceso y permanecen invariables durante la evolución de la NHCD, aunque el tamaño de la red cambia de manera significativa.
Mediante el uso de esta ley, somos capaces de observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células, o módulos, y su conectividad a otros módulos dentro de sus propias y otras funciones. La organización jerárquica resultante consiste en sub-módulos, funciones biológicas conocidas, y super-módulos de tejidos y órganos especializados emergentes en escalas diferentes. Este descubrimiento es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en funciones de los órganos de una manera sistemática. Además, esta información podría ser de importancia en el suministro de predicciones de atributos funcionales a un número de módulos identificados de tipos de células en la NHCD.
III. Materiales y métodos
La detección de los módulos o cajas en nuestro trabajo se sigue de la aplicación del algoritmo de caja de cubierta (12, 28) a diferentes tallas escalas. El algoritmo se puede descargar en http://lev.ccny.cuny.edu/~hmakse/soft_data.html. En el cuadro que cubre asignamos cada nodo a un módulo, al encontrar el mínimo número posible de cajas, NB (ℓ), que cubre la red y cuyo diámetro (que se define como la distancia máxima entre dos nodos en este cuadro) es menor que ℓ . Estas cajas se caracterizan por la proximidad entre todos sus nodos, a una longitud de escala dada. Diferentes valores de las cajas de la caja de diámetro rendimiento ℓ de diferente tamaño. Estas cajas se identifican como módulos que a escala, ℓ más pequeño, pueden separarse, pero se funden en entidades más grandes a medida que aumentamos ℓ.En este trabajo ponemos en práctica la máxima Excluidos misa Burning (MEMB) algoritmo a partir de (28) para la caja de cubierta. El algoritmo utiliza la idea básica de la optimización de la caja, donde se requiere que cada caja debe cubrir el máximo número posible de nodos, y funciona de la siguiente manera: Para una ℓ dada, en primer lugar localizar los nodos óptimos "centrales" que actuarán como los orígenes para las cajas. Esto se hace calculando primero el número de nodos (llamada la masa) dentro de un ℓ diámetro de cada nodo. El nodo que produce la masa más grande está marcado como centro. Luego marcamos todos los nodos de la caja de este nodo central como "etiquetado". Repetimos el proceso de cálculo de la masa de las cajas a partir de todos los nodos noncenter, e identificamos un segundo centro de acuerdo con la masa restante más grande, mientras que los nodos en el cuadro correspondiente etiquetados, y así sucesivamente. Cuando todos los nodos son o centros o etiquetados hemos identificado el número mínimo de centros que pueden cubrir la red en el valor ℓ dado. A partir de estos centros como orígenes de la caja, que luego grabar simultáneamente las cajas de cada origen hasta que toda la red está cubierto, es decir, cada nodo se le asigna a una caja [llamamos a esto quema proceso, ya que es similar a la quema de los algoritmos desarrollados para investigar la agrupación estadísticas en teoría de la percolación (11)]. En la Fig. 2A se muestra cómo la caja que cubre las obras de una red simple en dos valores diferentes l.
Este algoritmo es impulsado por la proximidad entre los nodos y la maximización de la masa asociada con cada centro de módulo (12, 28). Por lo tanto, detecta cajas que maximizan la modularidad (Ec. 1). En el caso de MEMB, tenemos la ventaja adicional de detección de módulos a diferentes escalas para que podamos estudiar el carácter jerárquico de la modularidad, es decir, los módulos de los módulos, y podemos detectar si la modularidad es una característica de la red que se mantiene escala- invariante.
La dimensión fractal dB de una compleja red es un exponente que determina cómo la masa (de forma equivalente: el número de nodos) en torno a cualquier nodo dado se escala con la longitud que en las redes corresponde a la distancia más corta entre dos nodos. Para medir numéricamente este exponente cubrimos de manera óptima la red con las cajas utilizando el algoritmo de MEMB. Un cuadro es un conjunto de nodos en los que todas las distancias ℓij entre dos nodos i y j en este conjunto son más pequeños que un valor dado de ℓ, el tamaño de la caja. Aunque hay un gran número de cubiertas, para cada valor de ℓ queremos encontrar el que le da el menor número posible de cajas, NB (ℓ). Variando ℓ produce entonces la relación de escala (Ec. 3). Una dimensión finita fractal revela los principios fundamentales de la organización de la red subyacente, es decir, un carácter estructural auto-similares, donde la red se construye de una manera similar a pesar de que lo observamos en diferentes escalas de longitud-. Las cajas que son identificados a través de este proceso corresponden a los módulos a escalas diferentes.
Referencias
- Sell S (2004) Stem Cells Handbook (Humana Press, Totowa, NJ). Google Scholar
- Kirschstein R, Skirboll LR (2001) Stem Cells: Scientific Progress and Future Research Directions(NIH, Bethesda). Google Scholar
- Freitas RA Jr (1999) Nanomedicine, Volume I: Basic Capabilities (Landes Bioscience, Georgetown, Texas). Google Scholar
- Alberts B, et al. (2002) Molecular Biology of the Cell (Garland Science, New York), IVth Ed. Google Scholar
- Sadler TW (2004) Langman’s Medical Embryology (Lippincott Williams and Wilkins, Baltimore), IXth Ed. Google Scholar
- Vickaryous MK, Hall BK (2006) Human cell type diversity, evolution, development, and classification with special reference to cells derived from the neural crest. Biol Rev 81:425–455.MedlineGoogle Scholar
- Valentine JW (2003) in Keywords and Concepts in Evolutionary Developmental Biology, eds HallBK, Olson WM (Harvard Univ Press, Cambridge), pp 35–53. Google Scholar
- Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabási A-L (2002) Hierarchical organization of modularity in metabolic networks. Science 297:1551–1555. Abstract/FREE Full Text
- Newman MEJ, Girvan M (2004) Finding and evaluating community structure in networks. Phys Rev E 69:026113. CrossRefGoogle Scholar
- Guimerà R, Amaral LAN (2005) Functional cartography of complex metabolic networks. Nature433:895–900. CrossRefMedlineGoogle Scholar
- Caldarelli G, Vespignani A, eds (2007) Large scale structure and dynamics of complex networks(World Scientific, Singapore). Google Scholar
- Song C, Havlin S, Makse HA (2005) Self-similarity of complex networks. Nature 433:392–395. CrossRefMedlineGoogle Scholar
- Paxinos G, Mai JK (2004) The Human Nervous System (Elsevier Academic, San Diego), 2nd Ed. Google Scholar
- Temple S (2001) The development of neural stem cells. Nature 414:112–117. CrossRefMedlineGoogle Scholar
- Bianco P, Riminucci M, Gronthos S, Robey PG (2001) Bone marrow stromal stem cells: Nature, biology, and potential applications. Stem Cells 19:180–192. CrossRefMedlineWeb of ScienceGoogle Scholar
- Chen JCJ, Goldhamer DJ (2003) Skeletal muscle stem cells. Reprod Biol Endocrin 1:101. CrossRefGoogle Scholar
- Janeway CA, Travers P, Walport M, Shlomchik M (2001) Immunobiology: The Immune System in Health and Disease (Garland Science, New York), 5th Ed. Google Scholar
- Anglani F, et al. (2004) In search of adult renal stem cells. J Cell Mol Med 8:474–487. MedlineWeb of ScienceGoogle Scholar
- Horster MF, Braun GS, Huber SM (1999) Embryonic renal epithelial: induction, nephrogenesis, and cell differentiation. Physiol Rev 79:1157–1191. Abstract/FREE Full Text
- Herrick SE, Mutsaers SE (2004) Mesothelial progenitor cells and their potential in tissue engineering. Int J Biochem Cell B 36:621–642. CrossRefMedlineWeb of ScienceGoogle Scholar
- Otto WR (2002) Lung epithelial stem cells. J Pathol 197:527–535. CrossRefMedlineWeb of ScienceGoogle Scholar
- Jessen KR, Mirsky R (2005) The origin and development of glial cells in peripheral nerves. Nat Rev Neurosci 6:671–682. CrossRefMedlineWeb of ScienceGoogle Scholar
- Nakashima M, Redid AH (2003) The application of bone morphogenetic proteins to dental tissue engineering. Nat Biotechnol 21:1025–1032. CrossRefMedlineWeb of ScienceGoogle Scholar
- Santagati F, Rijli FM (2003) Cranial neural crest and the building of the vertebrate head. Nat Rev Neurosci 4:806–818. MedlineWeb of ScienceGoogle Scholar
- Savage JJ, Yaden BC, Kiratipranon P, Rhodes SJ (2003) Transcriptional control during mammalian anterior pituitary development. Gene 319:1–19. Google Scholar
- Forge A, Wright T (2002) The molecular architecture of the inner ear. Brit Med Bull 63:5–24. Abstract/FREE Full Text
- Panteleyev A, Jahoda CAB, Christiano AM (2001) Hair follicle predetermination. J Cell Sci114:3419–3431. Abstract/FREE Full Text
- Song C, Gallos LK, Havlin S, Makse HA (2007) How to calculate the fractal dimension in complex networks. J Stat Mech, P03006. Google Scholar
- Gallos LK, Song C, Havlin S, Makse HA (2007) Scaling Theory of transport in complex biological networks. Proc Natl Acad Sci USA 104:7746–7751. Abstract/FREE Full Text
- Athreya KB, Ney PE (2004) Branching processes (Dover, New York). Google Scholar
Suscribirse a:
Entradas (Atom)