domingo, 30 de octubre de 2016

Modularidad en redes de células madres

Mapa de modularidad de la red de la diferenciación celular humana
Viviane Galvão, José G. V. Miranda, Roberto F. S. Andradeb, S. José Andrade Jr., Lazaros K. Gallose, y Hernán A. Maksee,

PNAS



Resumen

La diferenciación celular en los organismos multicelulares es un proceso complejo, cuyo mecanismo puede ser entendido por un enfoque reduccionista, en el que se identifican los procesos individuales que controlan la generación de diferentes tipos de células. Como alternativa, un enfoque a gran escala en busca de diferentes características organizativas de las etapas de crecimiento promete revelar su estructura global modular con el objetivo de descubrir las relaciones antes desconocidas entre tipos de células. En este sentido, clasificar y analizar un gran conjunto de datos dispersos para la construcción de la red de la diferenciación de células humanas (NHCD) basado en tipos de células (nodos) y etapas de diferenciación (links) desde el huevo fertilizado a un ser humano desarrollado. Descubrimos una ley dinámica de ramificación crítico que revela una regularidad auto-similares en la organización modular de la red, y nos permite observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células después de una organización jerárquica, que van desde los sub-módulos a los super-módulos de tejidos y órganos especializados en distintas escalas. Este descubrimiento permitirá a uno para tratar el desarrollo de una función celular particular en el contexto de la compleja red de desarrollo humano como un todo. Nuestros resultados apuntan a una visión integrada a gran escala de la red de tipos de células que revela sistemáticamente vínculos entre dominios previamente no relacionados en las funciones orgánicas.


El proceso de diferenciación celular juega un papel crucial en el desarrollo prenatal de los organismos multicelulares. Los recientes avances en la investigación sobre las propiedades de células madre y el desarrollo embrionario han descubierto varios pasos en el proceso de diferenciación (1-7). secuencias únicas y múltiples de la diferenciación celular han sido identificados a través de observaciones in vivo de un embrión en particular durante las primeras etapas de desarrollo, así como estudios de patología de abortos involuntarios durante las etapas finales del proceso. Mientras que la identificación de cada paso de la diferenciación celular ha sido objeto de una intensa investigación, una visión integrada de este complejo proceso sigue desaparecido. Tal punto de vista mundial promete revelar características asociadas con la organización modular a gran escala de los tipos de células (5-12) con el fin de descubrir los módulos funcionales entre tipos de células mediante el uso de análisis de redes teórico para la detección de la comunidad (9-11). En esta carta, nos aprovechamos de los conocimientos actuales sobre la secuencia de los procesos de diferenciación celular que se extiende sobre una vasta literatura especializada (1-6, 13-27) (SI Apéndice), para revelar y caracterizar las características topológicas y dinámicas asociadas con la red de la diferenciación celular humana (NHCD).

I. Resultados

Construimos la NHCD recopilando sistemáticamente la información dispersa sobre la evolución de cada tipo de célula presente en el embrión y el feto a partir de un antecesor con un mayor grado de potencial de diferenciación en un tipo más especializado. El proceso de diferenciación de las células es luego mapea en una red compleja que consta de 873 nodos conectados a través de 977 bordes. Los nodos de la red representan distintos tipos de células descritos en la literatura (1-6, 13-27) y los bordes representan la asociación entre dos tipos de células a través de un evento de diferenciación.

Los pasos iniciales de la NHCD se muestran en el recuadro de la Fig. 1, mientras que la estructura de la red resultante se muestra en el panel principal de la fig. 1 (SI Apéndice). El óvulo fertilizado es seguido por la etapa de la bola, y la formación de las capas de células germinales primarias. Actualmente, se sabe que hasta el punto de bola, la división celular es simétrica y produce más células madre totipotentes (1). Estas células dan lugar a todos los tejidos diferenciados del organismo, así como los tejidos extraembryonic (placenta, el cordón umbilical, etc.). Por otra parte, en el transcurso de todo el proceso de formación organismo, hay una disminución monotónica en el potencial de diferenciación (totipotentes → pluripotentes → multipotentes → unipotentes células) acompañado con un aumento de la especialización celular.


Fig. 1.
Representación de red compleja del proceso de diferenciación de la célula humana. Los primeros pasos de la construcción NHCD se muestran en el recuadro de esta figura. Estos pasos, que se sabe que está presente en la formación de la mayoría de los organismos multicelulares, incluyen la primera escisión de un huevo fertilizado, es decir, posteriormente, seguido de la etapa de la bola y la formación de capas de células germinales primarias, a saber, el ectodermo , mesodermo, endodermo y. El óvulo fecundado es una célula madre totipotentes. El blastocisto, a su vez, da lugar, simultáneamente trofoblasto y la masa celular interna. Estas dos células se diferencian más en otros tipos de células, y así sucesivamente. Siguiendo el proceso anterior hasta que el feto está completamente desarrollado produce el complejo de red que se muestra en esta figura. Cada nodo, representa como un círculo, corresponde a un tipo de célula y los bordes a un paso diferenciación. Toda la red se origina a partir del óvulo fecundado (indicado por un cuadrado rojo) y conduce a las células especializadas de un ser humano desarrollado. Círculos rellenos corresponden a los nodos que sobreviven al final del proceso de desarrollo, mientras que los círculos vacíos corresponden a tipos de células no sobrevivieron. Los nodos en las comunidades de funciones conocidas de la literatura se indican con diferentes colores, a excepción de aquellos tipos de células sin anotación funcional (ver Apéndice SI y el conjunto de datos S1 para la asociación de las funciones conocidas de C1 a C19 extraídos de la literatura).

Ciertos tipos de células pueden obtenerse tras más de un camino desde el óvulo fertilizado. Este proceso genera algunos bucles cerrados de los bordes de la red. El NHCD comprende 529 sucursales de diferentes longitudes con cada rama termina cuando los tipos de células no se someten a una mayor diferenciación. Nótese, sin embargo, que la más reciente compilación de tipos de células en adultos normales, sanos, humanos realizados en (6) informa de sólo 407 tipos de células. Por lo tanto, no todos los puntos finales de la rama corresponden a tipos de células en los seres humanos nacidos. Por lo tanto, no todos los 873 tipos de células están presentes en un ser humano. Entre los ausentes son las células de la placenta que se generan a partir del huevo fecundado durante el desarrollo embrionario, así como otros tipos de células somáticas que son importantes para el control de embrión y el desarrollo del feto. Los tipos de células que sobreviven en un ser humano se indican mediante círculos rellenos, mientras que los que no sobrevivieron se indican por círculos vacíos. Los datos recogidos completas se enumeran en el Apéndice SI y el conjunto de datos S1, incluyendo una enumeración de las células y los vínculos entre los tipos de células, su tiempo de aparición en días después de la fecundación (Ta), y la referencia a las publicaciones de informes de cada enlace. A lo mejor de nuestro conocimiento, la estructura identificada aquí proporciona el diagrama esquemático más completa del proceso de diferenciación humana hasta la fecha.

Es visualmente evidente de la figura. 1 que la NHCD tiene una estructura modular prominente. La diferenciación continua de células en funciones más especializadas conduce naturalmente a la formación de agrupaciones aisladas denso en el NHCD. Como una primera aproximación para entender esta estructura modular, agrupamos tipos de células en la red de la figura. 1 de acuerdo con sus funciones conocidas; diferentes colores indican 19 módulos funcionales extraídos de la bibliografía (C1-C19) (SI Apéndice). Las comunidades más numerosas fueron extraídos de los árbitros. 1-6, 13-27. Hay, sin embargo, un cierto grado de arbitrariedad en esta estructura modular como la separación de los nodos en comunidades en nuestro conjunto de datos no es única. Por ejemplo, la comunidad C12, el linaje neural, se podría dividir en dos subcomunidades, que representa la las células de apoyo (gliales) (1-3, 5, 6, 13,14) y neural. Por otra parte, el módulo de sistema neural podrían fusionarse con el módulo de sistema de ojo (1, 5, 6, 13) en una escala más grande, ya que tienen un tipo de célula ancestral común. Por lo tanto, una más fina o más gruesa estructura de la comunidad se pueden extraer de los datos cuando nos fijamos en toda la red en diferentes escalas de observación; Se necesita un algoritmo de módulo de detección modificado para identificar estas comunidades de una manera sistemática.

Conceptos teóricos de grafos nos permiten desentrañar la dependencia escala de la estructura modular de la NHCD. La teoría de grafos (11) define la distancia entre dos nodos (también llamados la distancia química) como el número de enlaces a lo largo de la ruta más corta entre los nodos de la red. Utilizamos esta idea de proponer un algoritmo de detección de la comunidad que identifica los módulos de tamaño ℓ compuesta de tipos de células altamente conectadas. El algoritmo encuentra el alicatado óptima de la red con el menor número posible de módulos, NB, de ℓ tamaño (12) (cada nodo se le asigna a un módulo o caja y todos los nodos en un módulo están a una distancia menor que ℓ). Este proceso resulta en un problema de optimización que se pueden resolver mediante el uso del algoritmo de caja que cubre explican en la figura. 2A, Materiales y Métodos Sección III y reportado en la referencia 28 como el máximo Excluidos misa Burning algoritmo (MEMB, el algoritmo se puede descargar desde http://lev.ccny.cuny.edu/~hmakse/soft_data.html). El requisito de un número mínimo de módulos para cubrir la red (NB) garantiza que la partición de la red es tal que cada módulo contiene el mayor número posible de nodos y enlaces dentro del módulo con la restricción de que los módulos no pueden exceder ℓ tamaño. Este proceso embaldosado optimizado da lugar a módulos con el menor número de enlaces que conectan con otros módulos lo que implica que el grado de modularidad, definida por (9-11, 29)

Formula

se maximiza. Aquí GraphicGraphic representan el número de enlaces que se inician en un determinado módulo I y terminan ya sea dentro o fuera de i, respectivamente. Los grandes valores de Graphic(Graphic) se corresponden con un mayor grado de modularidad. El valor de la modularidad de la red gráfico varía con ℓ, por lo que podemos detectar la dependencia de modularidad en diferentes escalas de longitud, o de manera equivalente la forma de los propios módulos se organizan en módulos más grandes que mejoran el grado de modularidad.


Fig. 2.
La detección de los módulos y de la red de módulos a diferentes escalas. (A) Demostración de que el algoritmo de caja cubre para una red esquemática, siguiendo el algoritmo MEMB en refs. 12 y 28 (SI Apéndice). Cubrimos la red con el menor número posible de cajas para un valor dado ℓ. Esto se hace en un proceso de dos etapas: (i) Se detecta el número más pequeño posible de los orígenes de la caja (que se muestra con el color cian) que proporcionan el número máximo de nodos (en masa) en cada cuadro, de acuerdo con el siguiente algoritmo de optimización: Nos calcular la masa asociada a cada nodo, y escoger el primer centro como el nodo con la masa más grande y marcar los nodos de este cuadro como con etiqueta. Repetimos el proceso desde los nodos restantes no centros para identificar a un segundo centro de la más alta masa, y así sucesivamente. (Ii) Construimos las cajas a través de la quema simultánea de estos nodos centrales hasta que toda la red se cubre con cajas. Por ejemplo, en ℓ = 3 hay cuatro cajas, donde la distancia máxima entre dos nodos en una caja es menor que ℓ. Del mismo modo, podemos cubrir la misma red con dos cajas en ℓ = 6. Estos dos cuadros son el resultado de la fusión de dos de las cuatro cajas en ℓ = 3. (B) Detalle de los módulos NHCD detectados por el algoritmo anterior en forma de caja que cubre de dos funciones particulares. El algoritmo detecta una jerarquía de sub-módulos, funciones conocidas y super-módulos de tamaño ℓ representa en diferentes colores. Mostramos los módulos identificados correspondientes al sistema de C12-C13 y el sistema neuronal de ojos (Fig. 2C y SI Apéndice) que aparecen por primera vez en ℓ = 15 y ℓ = 11, respectivamente. En otras escalas el algoritmo de caja que cubre detecta nuevas relaciones funcionales entre tipos de células expresadas en la sub obtenida y super-módulos. Por ejemplo, en ℓ = 11 el linaje neural se divide en dos sub-módulos, mientras que en ℓ = 19 las dos funciones se funden en un módulo de super. (C) La red de módulos a diferentes valores de l, detectada a través del algoritmo de caja que cubre. Cada nodo corresponde a uno de los tres tipos siguientes, en términos de aumento de escala: (i) Los sub-módulos (pequeños puntos grises) que son fracciones de un módulo totalmente funcional, (ii) Conocido módulos biológicos funcionales (círculos de colores), cuya color corresponde a las funciones de C1-C19, y (iii) Grandes módulos (gráficos circulares) que representan la unión de más de un módulo funcional conocido, descrito por los colores del gráfico circular. Los enlaces que se derivan de los módulos funcionales conocidos y super-módulos se muestran en rojo, y que se extienden progresivamente toda la red a medida que aumentamos ℓ.

Para una ℓ dado, se obtiene la cobertura óptima de la red con los módulos de NB [utilizamos el algoritmo MEMB (28) se explica en la Fig. 2A y Materiales y Métodos]. Análisis de la modularidad (Ec. 1) en la Fig. 3A muestra un aumento monotónico de Graphic con la falta de un valor característico de ℓ. De hecho, los datos pueden ser equipados con aproximadamente una forma funcional de ley de potencia:

Formula

que se detecta a través de la modularidad dM exponente. Nos caracterizamos la red mediante el uso de diferentes instantáneas en el tiempo y nos encontramos con que dM ≃ 2.0 es aproximadamente constante a lo largo de la evolución en el tiempo (Fig. 3A). Este valor pone de manifiesto un considerable grado de modularidad en todo el sistema [para la comparación, una red aleatoria tiene dM = 0 y un retículo uniforme tiene dM = 1 (29)], como se evidencia por la estructura de red en la Fig. 1. La falta de una característica escala de longitud en la modularidad se muestra en la Fig. 3A sugiere que los módulos aparecen en todas las escalas de longitud, es decir, los módulos se organizan dentro de los módulos más grandes de una manera auto-similar, de modo que las interconexiones entre los grupos repiten el carácter modular básica de toda la NHCD. Por lo tanto, la NHCD sigue siendo estadísticamente invariable cuando se observan a diferentes escalas. Variando el tamaño del módulo ℓ rendimientos la relación de escala para el número de módulos (Fig 3B.):

Formula

donde dB representa la dimensión fractal de la red (12). Nos encontramos con que el carácter fractal de los módulos se establece en las primeras etapas, produciendo 1,4 dB ≃ ya en 30 d (Fig. 3B). Como evoluciona la red, aumenta la dimensión fractal alcanza ligeramente y finalmente dB ≃ 1,9.


Fig. 3.
Propiedades modulares del NHCD. (A) Grado de modularidad de la red, Graphic, en diferentes momentos, t (indicado en la figura), como una función de la escala de observación, ℓ. (B) Número de cajas / módulos, NB, en comparación con el tamaño de los módulos, ℓ, identificado por el algoritmo de caja que cubre por diferentes redes en el tiempo t.

El significado de la ecuación. 2 es que los módulos deben ser interpretados en una escala de longitud dada. La Figura 2B muestra un ejemplo de tal organización jerárquica (Fig. 2C y la SI Apéndice muestran la estructura modular completo, mientras que una lista de módulos detectado aparece en conjunto de datos S2). Hay tres tipos de comunidades de tipos de células se identifican claramente en la Fig. 2B a medida que cambie ℓ. (I) Los módulos funcionales conocidos: Todo el linaje de los ojos (1, 5, 6, 13) se detecta como un único módulo por el algoritmo de caja que cubre al ℓ = 11, mientras que todo el linaje neuronal (1-3, 5, 6, 13, 14) aparece en ℓ = 15. Finer y módulos más gruesas son identificados por el algoritmo. (Ii) sub-módulos: En ℓ = 11 el linaje neural se divide en la neural principal y los módulos de células gliales de apoyo, mientras que para ℓ se identifican = 7 sub-módulos en el sistema del ojo. (Iii) Grandes módulos: Cuando se aumenta la longitud de ℓ = 19, el ojo y el sistema neural forman un único super-módulo. Por lo tanto, cada tipo de célula está conectado a otros tipos de acuerdo en que los grupos de nodos de todos los tamaños auto-organizarse después de un solo principio. Esta propiedad nos permite renormalizar la red (12) mediante la sustitución de cada módulo detectado por un solo supernode para identificar la red de módulos como se muestra en la Fig. 2C. Siguiendo la evolución y la interdependencia de estos super-módulos, como se ve en la Fig. 2C, identifica las familias de los tipos de células en diferentes escalas. Este mapa de la modularidad es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en las funciones orgánicas.

La dinámica que conducen a una estructura de este tipo pueden desenmarañarse por el estudio de la NHCD como un proceso de crecimiento. El conocimiento del tiempo de aparición de cada tipo de célula, Ta, hace posible seguir el crecimiento acumulado del embrión y el feto en términos del número total de tipos de células en el momento t, N (t), así como el número de tipos de células que sobreviven el tiempo en el organismo (Fig. 4A). Como se esperaba, las células supervivientes surgen en las etapas posteriores del período de gestación. Sin embargo, la diferencia entre el total y el número de tipos de células supervivientes indica que la generación de nuevos tipos de células que no sobrevivieron tiene lugar incluso durante los meses de gestación finales.


Fig. 4.
Propiedades de crecimiento de la NHCD. (A) Número de tipos de células en la red, N (t), como una función del tiempo. Nos encontramos con información precisa sobre el tiempo de aparición, Ta, por 782 entre los 873 tipos de células. Esas células con apariencia tiempo que falta no se han tenido en cuenta en esta parcela. También se muestra la evolución temporal del número de células sobrevivientes y no sobrevivientes. (B) Número de nodos cuyos aumentos grado en el tiempo t (Red de histograma) y el número de nuevos enlaces que aparecen en la red (azul histograma) como una función del tiempo. Si todos los nodos estaban dando sólo un niño entonces los dos histogramas coincidirían. Recuadro: El número medio de nuevos enlaces por nodo en un momento dado se puede encontrar dividiendo los dos histogramas en la trama principal. Este gráfico muestra la intensidad de la actividad es en ese momento en particular. A pesar de la variación en la actividad, la nueva conexiones promedio alrededor de uno que da una relación de derivación crítica de <k> ≃ 2. (C) Número de tipos de células en comparación con la distancia química al primer nodo, ℓN1. Esta distancia se determina solamente por las conexiones entre los tipos de células y no se ve influenciada por el tiempo de aparición de modo que incluimos todos los 873 tipos de células. (D) Promedio grado <k> de la red como una función del tiempo que muestra que la red alcanza el estado de proceso de ramificación crítico <k> ≈ 2 a alrededor de T * = 40 días.

El aumento de tamaño de la red, N (t), es inicialmente aproximadamente exponencial y después de t * = 40 días cambia en un crecimiento más lento (Fig. 4A). Sólo un pequeño porcentaje de los nodos de crecer dentro de un intervalo de tiempo dado de manera que la actividad de la red se centra en un pequeño número de ellos en un momento dado. El número de nodos que se diferencian en un momento dado se muestran en la Fig. 4B. Observamos una actividad que aumenta monótonamente hasta alrededor de t * = 40 días y luego se reduce a valores más bajos. El cruce de tiempo T * = 40 días observarse en la Fig. 4A y B separa dos regímenes de crecimiento y corresponde aproximadamente a la vez debajo de la cual la mayor parte de las células tienen una característica de plástico (es decir, la capacidad para diferenciar) y por encima del cual empiezan a ser funcional (1). Curiosamente, los dos regímenes observados en N (t) se funden en una sola curva funcional universal cuando nos Replot N (ℓN1) como una función de la distancia químico para el huevo fertilizado, ℓN1 (Fig. 4C). Este resultado sugiere que la distancia topológica en la red ℓN1 es la variable natural para caracterizar el proceso de crecimiento en una forma universal en lugar del tiempo. La dinámica de N (ℓ) sigue un proceso logístico típica (Verhulst) de crecimiento de la población, donde la tasa de crecimiento está restringido por las limitaciones ambientales:
Formula
con una solución,
Formula
(Véase el accesorio en la Fig. 4C), donde NF es el número final de tipos de células y r = 0,65 es la tasa de crecimiento de tipos de células.

El análisis de la conectividad de red revela que el número medio de enlaces por nodo en la etapa final de todo el NHCD es <k> = 2,24 (Fig. 4D). A pesar de que <k> ≈ 2, existe una amplia distribución de grado [libres de escala (11), P (k) ~ k-γ, γ ≃ 3.0 y Apéndice SI]. Esto implica que siempre hay un pequeño número de tipos de células cruciales que diferencian mucho más que los otros, un hecho que está de acuerdo con la evidencia de la existencia de unas pocas células con gran potencial de plasticidad. Como este potencial se pierde rápidamente después de 40 d, tipos de células cambian su capacidad de desarrollo a favor de la vida de mantenimiento organismo.

El hecho de que el grado medio está cerca de dos implica que la evolución dinámica de NHCD puede ser descrita por un proceso crítico de ramificación en el que cada nodo tiene una cierta probabilidad de descendientes de generación, en cuyo caso el estado crítico para la ramificación de continuar es <k > = 2 (30). Esto significa efectivamente que cada nodo tiene que dar al menos un descendiente de la red para seguir creciendo. Si <k> <2, el crecimiento se detiene pronto, mientras que para <k>> 2 el crecimiento sería más rápido que exponencial.

La red alcanza la condición de criticidad, <k> ≈ 2, alrededor de t * = 40 días (Fig. 4D), en relación con la transición de la plasticidad de comportamiento funcional. Después de esto, el grado medio se mantiene justo por encima de la criticidad de sostener una tasa de crecimiento que garantice la supervivencia de la red. La mayoría de los nodos propagar el crecimiento en una sola línea, pero hay nodos que generan significativamente más descendientes para generar la diversidad implícitos en las distribuciones de ley potencial de grado y modularidad.


II. Discusión

En resumen, presentamos un estudio a gran escala de la evolución prenatal del proceso de diferenciación celular humana desde el óvulo fertilizado a un ser humano desarrollado. El proceso de diferenciación de células humanas se puede asignar a una red compleja compuesta de tipos de células y etapas de diferenciación. Este mapeo permite estudiar el proceso de diferenciación de las células con el estado de la teoría de redes técnica para la detección de la comunidad con el objetivo de identificar las relaciones funcionales hasta ahora desconocidas entre tipos de células.

Descubrimos una ley dinámica de ramificación crítico explicar la aparición de la topología de red que revela una estructura modular invariante en escala de la red de tipos de células. Las características modulares auto-similares evidenciaron en las figuras. 1, 2, y 3 se establecen al principio del proceso y permanecen invariables durante la evolución de la NHCD, aunque el tamaño de la red cambia de manera significativa.

Mediante el uso de esta ley, somos capaces de observar la red a diferentes escalas. La imagen que surge claramente identifica grupos de tipos de células, o módulos, y su conectividad a otros módulos dentro de sus propias y otras funciones. La organización jerárquica resultante consiste en sub-módulos, funciones biológicas conocidas, y super-módulos de tejidos y órganos especializados emergentes en escalas diferentes. Este descubrimiento es útil para proponer futuras relaciones de investigación entre los dominios previamente no relacionados en funciones de los órganos de una manera sistemática. Además, esta información podría ser de importancia en el suministro de predicciones de atributos funcionales a un número de módulos identificados de tipos de células en la NHCD.

III. Materiales y métodos

La detección de los módulos o cajas en nuestro trabajo se sigue de la aplicación del algoritmo de caja de cubierta (12, 28) a diferentes tallas escalas. El algoritmo se puede descargar en http://lev.ccny.cuny.edu/~hmakse/soft_data.html. En el cuadro que cubre asignamos cada nodo a un módulo, al encontrar el mínimo número posible de cajas, NB (ℓ), que cubre la red y cuyo diámetro (que se define como la distancia máxima entre dos nodos en este cuadro) es menor que ℓ . Estas cajas se caracterizan por la proximidad entre todos sus nodos, a una longitud de escala dada. Diferentes valores de las cajas de la caja de diámetro rendimiento ℓ de diferente tamaño. Estas cajas se identifican como módulos que a escala, ℓ más pequeño, pueden separarse, pero se funden en entidades más grandes a medida que aumentamos ℓ.

En este trabajo ponemos en práctica la máxima Excluidos misa Burning (MEMB) algoritmo a partir de (28) para la caja de cubierta. El algoritmo utiliza la idea básica de la optimización de la caja, donde se requiere que cada caja debe cubrir el máximo número posible de nodos, y funciona de la siguiente manera: Para una ℓ dada, en primer lugar localizar los nodos óptimos "centrales" que actuarán como los orígenes para las cajas. Esto se hace calculando primero el número de nodos (llamada la masa) dentro de un ℓ diámetro de cada nodo. El nodo que produce la masa más grande está marcado como centro. Luego marcamos todos los nodos de la caja de este nodo central como "etiquetado". Repetimos el proceso de cálculo de la masa de las cajas a partir de todos los nodos noncenter, e identificamos un segundo centro de acuerdo con la masa restante más grande, mientras que los nodos en el cuadro correspondiente etiquetados, y así sucesivamente. Cuando todos los nodos son o centros o etiquetados hemos identificado el número mínimo de centros que pueden cubrir la red en el valor ℓ dado. A partir de estos centros como orígenes de la caja, que luego grabar simultáneamente las cajas de cada origen hasta que toda la red está cubierto, es decir, cada nodo se le asigna a una caja [llamamos a esto quema proceso, ya que es similar a la quema de los algoritmos desarrollados para investigar la agrupación estadísticas en teoría de la percolación (11)]. En la Fig. 2A se muestra cómo la caja que cubre las obras de una red simple en dos valores diferentes l.

Este algoritmo es impulsado por la proximidad entre los nodos y la maximización de la masa asociada con cada centro de módulo (12, 28). Por lo tanto, detecta cajas que maximizan la modularidad (Ec. 1). En el caso de MEMB, tenemos la ventaja adicional de detección de módulos a diferentes escalas para que podamos estudiar el carácter jerárquico de la modularidad, es decir, los módulos de los módulos, y podemos detectar si la modularidad es una característica de la red que se mantiene escala- invariante.

La dimensión fractal dB de una compleja red es un exponente que determina cómo la masa (de forma equivalente: el número de nodos) en torno a cualquier nodo dado se escala con la longitud que en las redes corresponde a la distancia más corta entre dos nodos. Para medir numéricamente este exponente cubrimos de manera óptima la red con las cajas utilizando el algoritmo de MEMB. Un cuadro es un conjunto de nodos en los que todas las distancias ℓij entre dos nodos i y j en este conjunto son más pequeños que un valor dado de ℓ, el tamaño de la caja. Aunque hay un gran número de cubiertas, para cada valor de ℓ queremos encontrar el que le da el menor número posible de cajas, NB (ℓ). Variando ℓ produce entonces la relación de escala (Ec. 3). Una dimensión finita fractal revela los principios fundamentales de la organización de la red subyacente, es decir, un carácter estructural auto-similares, donde la red se construye de una manera similar a pesar de que lo observamos en diferentes escalas de longitud-. Las cajas que son identificados a través de este proceso corresponden a los módulos a escalas diferentes.


Referencias

  1. Sell S (2004) Stem Cells Handbook (Humana Press, Totowa, NJ). Google Scholar
  2. Kirschstein R, Skirboll LR (2001) Stem Cells: Scientific Progress and Future Research Directions(NIH, Bethesda). Google Scholar
  3. Freitas RA Jr (1999) Nanomedicine, Volume I: Basic Capabilities (Landes Bioscience, Georgetown, Texas). Google Scholar
  4. Alberts B, et al. (2002) Molecular Biology of the Cell (Garland Science, New York), IVth Ed. Google Scholar
  5. Sadler TW (2004) Langman’s Medical Embryology (Lippincott Williams and Wilkins, Baltimore), IXth Ed. Google Scholar
  6. Vickaryous MK, Hall BK (2006) Human cell type diversity, evolution, development, and classification with special reference to cells derived from the neural crest. Biol Rev 81:425–455.MedlineGoogle Scholar
  7. Valentine JW (2003) in Keywords and Concepts in Evolutionary Developmental Biology, eds HallBK, Olson WM (Harvard Univ Press, Cambridge), pp 35–53. Google Scholar
  8. Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabási A-L (2002) Hierarchical organization of modularity in metabolic networks. Science 297:1551–1555. Abstract/FREE Full Text
  9. Newman MEJ, Girvan M (2004) Finding and evaluating community structure in networks. Phys Rev E 69:026113. CrossRefGoogle Scholar
  10. Guimerà R, Amaral LAN (2005) Functional cartography of complex metabolic networks. Nature433:895–900. CrossRefMedlineGoogle Scholar
  11. Caldarelli G, Vespignani A, eds (2007) Large scale structure and dynamics of complex networks(World Scientific, Singapore). Google Scholar
  12. Song C, Havlin S, Makse HA (2005) Self-similarity of complex networks. Nature 433:392–395. CrossRefMedlineGoogle Scholar
  13. Paxinos G, Mai JK (2004) The Human Nervous System (Elsevier Academic, San Diego), 2nd Ed. Google Scholar
  14. Temple S (2001) The development of neural stem cells. Nature 414:112–117.  CrossRefMedlineGoogle Scholar
  15. Bianco P, Riminucci M, Gronthos S, Robey PG (2001) Bone marrow stromal stem cells: Nature, biology, and potential applications. Stem Cells 19:180–192. CrossRefMedlineWeb of ScienceGoogle Scholar
  16. Chen JCJ, Goldhamer DJ (2003) Skeletal muscle stem cells. Reprod Biol Endocrin 1:101. CrossRefGoogle Scholar
  17. Janeway CA, Travers P, Walport M, Shlomchik M (2001) Immunobiology: The Immune System in Health and Disease (Garland Science, New York), 5th Ed. Google Scholar
  18. Anglani F, et al. (2004) In search of adult renal stem cells. J Cell Mol Med 8:474–487. MedlineWeb of ScienceGoogle Scholar
  19. Horster MF, Braun GS, Huber SM (1999) Embryonic renal epithelial: induction, nephrogenesis, and cell differentiation. Physiol Rev 79:1157–1191. Abstract/FREE Full Text
  20. Herrick SE, Mutsaers SE (2004) Mesothelial progenitor cells and their potential in tissue engineering. Int J Biochem Cell B 36:621–642. CrossRefMedlineWeb of ScienceGoogle Scholar
  21. Otto WR (2002) Lung epithelial stem cells. J Pathol 197:527–535. CrossRefMedlineWeb of ScienceGoogle Scholar
  22. Jessen KR, Mirsky R (2005) The origin and development of glial cells in peripheral nerves. Nat Rev Neurosci 6:671–682. CrossRefMedlineWeb of ScienceGoogle Scholar
  23. Nakashima M, Redid AH (2003) The application of bone morphogenetic proteins to dental tissue engineering. Nat Biotechnol 21:1025–1032. CrossRefMedlineWeb of ScienceGoogle Scholar
  24. Santagati F, Rijli FM (2003) Cranial neural crest and the building of the vertebrate head. Nat Rev Neurosci 4:806–818. MedlineWeb of ScienceGoogle Scholar
  25. Savage JJ, Yaden BC, Kiratipranon P, Rhodes SJ (2003) Transcriptional control during mammalian anterior pituitary development. Gene 319:1–19. Google Scholar
  26. Forge A, Wright T (2002) The molecular architecture of the inner ear. Brit Med Bull 63:5–24. Abstract/FREE Full Text
  27. Panteleyev A, Jahoda CAB, Christiano AM (2001) Hair follicle predetermination. J Cell Sci114:3419–3431. Abstract/FREE Full Text
  28. Song C, Gallos LK, Havlin S, Makse HA (2007) How to calculate the fractal dimension in complex networks. J Stat Mech, P03006. Google Scholar
  29. Gallos LK, Song C, Havlin S, Makse HA (2007) Scaling Theory of transport in complex biological networks. Proc Natl Acad Sci USA 104:7746–7751. Abstract/FREE Full Text
  30. Athreya KB, Ney PE (2004) Branching processes (Dover, New York). Google Scholar

jueves, 27 de octubre de 2016

Epidemia: No hubo paciente cero en el SIDA

El VIH conquistó América desde Haití y Nueva York
La mayor investigación de los genomas virales refuta la identidad del famoso “paciente cero”

JAVIER SAMPEDRO - El País



Manifestantes en un desfile del Orgullo Gay en Manhattan, en 1983. La pancarta dice "SIDA: necesitamos investigación, ¡no histeria!". BARBARA ALPER/GETTY IMAGES

El virus de la inmunodeficiencia humana (VIH-1), causante del sida, fue reconocido en California en 1983, pero ni entró por allí en el continente americano ni quien lo propagó fue el famoso “paciente cero”, identificado en la literatura técnica y los medios como el azafato canadiense Gaëtan Dugas. Una innovadora investigación histórica y genómica revela que el virus saltó desde Haití hasta Nueva York en 1970, y que esta ciudad fue el foco central desde el que se propagó la epidemia por América. Y que el virus original no era el que llevaba Dugas.

El evolucionista Michael Worobey, de la Universidad de Arizona, y el historiador de la salud pública Richard McKay, de la Universidad de Cambridge, han logrado reconstruir con una precisión sin precedentes el origen y la propagación del virus en América. El VIH se originó en África en la primera mitad del siglo XX, pero no llegó a la atención pública hasta que fue reconocido como causa del sida en 1983.

El VIH se originó en África en la primera mitad del siglo XX, pero no llegó a la atención pública hasta que fue reconocido como causa del sida en 1981

La reconstrucción de Worobey y McKay demuestra que el virus llegó de África al Caribe, probablemente a Haití, en los años sesenta; que de allí saltó a Nueva York en 1970, y de esta ciudad no solo a zonas cercanas como Pensilvania y Nueva Jersey, sino también a Georgia y directamente a San Francisco y el resto de California, en el otro extremo de Estados Unidos. Presentan su investigación en la revista Nature.



El trabajo logra también la rara proeza de limpiar el nombre del azafato canadiense Gaëtan Dugas, muerto de sida en 1984. Ese mismo año, un estudio de los centros de control de enfermedades (CDC) de Atlanta, publicado en el American Journal of Medicine, rastreó muchas de las infecciones iniciales por VIH hasta ese auxiliar de vuelo. El propio Dugas admitió haber tenido unas 2.000 relaciones con distintas personas homosexuales por todo el mundo.

Su trabajo de auxiliar de vuelo, unido a su notable promiscuidad, le convirtieron en un buen candidato a haber introducido el virus en América desde África. Los investigadores del CDC introdujeron esta hipótesis en su artículo técnico. Tuvieron el atino de no publicar su nombre, y lo identificaron solo como “paciente O”. Pero el secreto solo duró tres años. El nombre de Dugas fue publicado por el reportero freelance del San Francisco Chronicle Randy Shilts en un libro de 1987, y a partir de ahí reproducido por varios medios.

Puede que Dugas contribuyera a propagar el virus por el continente, pero desde luego no fue quien lo introdujo allí desde África. El análisis evolutivo de Worobey y McKay demuestra por encima de toda duda razonable que el virus de las muestras de Dugas es de tipo tardío, muy distinto de los primeros que entraron en Nueva York desde el Caribe. El azafato, por tanto, fue una más de las personas que se contagiaron en Nueva York o Georgia a mediados de los setenta. No fue el “paciente cero”. Nadie sabe quién fue el paciente cero.

Dugas no fue el paciente cero; nadie sabe quién lo fue

Para acabar de arreglar este triste malentendido, resulta que aquel “cero” ni siquiera era un cero en la publicación original de los CDC. Era una O. Quería decir Outside of California, fuera de California. Un desastre colectivo. “No hay evidencias ni biológicas ni históricas que apoyen la extendida creencia de que [Dugas] fuera la causa primaria de la epidemia de VIH en Norteamérica”, asegura Worobey.

Los investigadores han partido de más de 2.000 muestras de sangre recogidas de hombres en Estados Unidos en los años setenta, antes de que se supiera lo que era el sida. Ese tipo de muestras, obviamente, no se extrajeron en condiciones adecuadas para analizar los genes de un virus, lo que ha obligado a Worobey y sus colegas a desarrollar unos métodos genómicos muy avanzados, en parte desarrollados específicamente para este estudio.

“Ahora podemos mirar adelante y ver realmente un futuro en el que, incluso si el virus no se elimina por completo, pueda ser reducido hasta que no cause ningún nuevo contagio en amplias zonas del mundo”, dice Worobey. Las técnicas desarrolladas para este trabajo pueden convertirse en unos ensayos ultrasensibles que puedan detectar el virus en la sangre de personas que no son conscientes de haberse infectado recientemente.


LECCIÓN DE HISTORIALo peor del caso de Gaëtan Dugas, el “paciente cero”, no es que haga agua después de haber leído el genoma de su virus VIH, sino que ya la hacía antes. El historiador de la salud pública McKay, uno de los autores del estudio, tiene aquí casi tanto que decir como su coautor, el evolucionista de los virus Worobey. El historiador no solo ha documentado que el cero era en realidad una letra O y que la atribución al auxiliar de vuelo de haber originado la epidemia americana de sida fue más bien obra de un escritor y algunos periódicos que de los laboratorios de referencia mundial en enfermedades infecciosas, los CDC de Atlanta. Hay más.
En su libro And the Band Played On (y la banda siguió tocando), el periodista del San Francisco Chronicle Randy Shilts pintaba a Dugas como un depredador sexual y un peligroso irresponsable, llegando a insinuar lo posibilidad de que hubiera propagado la enfermedad a propósito. Los periodistas que reseñaron el libro completaron la faena culpando al azafato de haber traído el virus desde África, generando una de las pandemias más mortíferas de todos los tiempos.
Pero Dugas no solo fue uno de los pocos afectados de la época que donó sangre para los análisis, sino también de los poquísimos que pudo aportar a los investigadores los nombres del 10% de las parejas sexuales que había tenido en los últimos años. El historiador McKay sospecha que su papel central en la propagación del virus que detectó aquel estudio de 1984 pudo tener mucho que ver con su buena memoria, en un caso claro de sesgo muestral: el que más parejas recuerda consigue más positivos entre ellas.

miércoles, 26 de octubre de 2016

Increíbles redes de circuitos electrónicos de un chip

Increíbles primeros planos de los chips de ordenador se asemejan a un complejo entramado de las ciudades
Wired




Las personas pasan horas y horas cada día frente a las computadoras y los teléfonos inteligentes, pero rara vez se ven los minúsculos circuitos que los hacen funcionar. Pero si usted hecha una mirada cercana a un microprocesador, verá algo sorprendente. "Se parece a un horizonte de tres dimensiones", dice Christoph Morlinghaus. "Puede uno perderse totalmente en ella."

Morlinghaus descubrió esto hace tres años, mientras que fotografiar placas base para Cisco. Las juntas de modo que él le fascinaban los mantuvo durante una semana más, disparando a los primeros planos que se convirtieron en su serie de la placa base. Volvió a la idea el año pasado, la obtención de los microprocesadores de los foros en línea y disparos en su estudio de Miami.


cámara Sinar P2 de 8 × 10 con - Morlinghaus

Fotografiar algo más grande que un grano de arroz no es fácil. Morlinghaus utiliza un Sinar P2 cámara de 8 × 10 con un fuelle de siete pies y una lente f2.8 50mm. El sistema de iluminación de cada procesador con un par de luces de armario de 12 pulgadas, pero todavía tenía que hacer exposiciones de tres minutos. Esto significaba disparar varias tramas, porque la menor perturbación se ve borrosa la imagen. "Cada vez que había un carro que conduce por el estudio, o alguien en el edificio encendido AC, tendría que hacer toda la cosa de nuevo", dice. Haciendo cada uno de los siete fotos en la serie tomó alrededor de una semana, incluyendo el escaneo de los negativos y cuidadosamente quitar el polvo.

Las imágenes de Computerwelt son ricos en detalle, cada componente claramente definido. Todo tiene un aspecto como si estuviera mirando hacia abajo en una ciudad, los edificios de la proyección de sombras en las calles por debajo de ellos. Es una fascinante mirada a la tecnología que dan por sentado, incluso cuando usted está mirando ahora mismo.

domingo, 23 de octubre de 2016

En busca de las raíces (de las redes) de los mitos ancentrales

Los científicos rastrean mitos de la sociedad a sus orígenes primordiales
El análisis de cómo las historias cambian en el recuento de generación en generación arroja luz sobre la historia de la migración humana va tan lejos como el período Paleolítico
Por Julien d'Huy - Scientific American


Crédito: Ilustración por Jon Foster

La versión griega de un mito familiarizado comienza con Artemisa, diosa de la caza y la feroz protectora de las mujeres jóvenes inocentes. Artemis demandas que Callisto, "la más bella", y sus otras doncellas toman un voto de castidad. Zeus trucos a Calisto en renunciar a su virginidad, y da a luz a un hijo, Arcas. celosa esposa de Zeus, Hera, se vuelve a Calisto en una osa y su destierra a las montañas. Mientras tanto Arcas crece hasta convertirse en un cazador y un día sucede en un oso que le da la bienvenida con los brazos abiertos. Al no reconocer a su madre, que apunta con su lanza, pero Zeus viene al rescate. Él transforma a Calisto en la constelación de la Osa Mayor, o "gran oso", y coloca Arcas cercana como la Osa Menor, el "osito".
A medida que el Iroquois del noreste de EE.UU. dice que, tres cazadores persiguen un oso; la sangre de los animales heridos colores las hojas del bosque otoñal. El oso y luego sube una montaña y salta hacia el cielo. Los cazadores y los animales se convierten en la constelación de la Osa Mayor. Entre los Chukchi, un pueblo de Siberia, la constelación de Orión es un cazador que persigue un reno, Cassiopeia. Entre las tribus ugrofinesas de Siberia, el animal se persigue es un alce y toma la forma de la Osa Mayor.
Aunque los animales y las constelaciones pueden ser diferentes, la estructura básica de la historia no lo hace. todas estas sagas pertenecen a una familia de mitos conocidos como la caza cósmico que se extendió a lo largo y ancho de África, Europa, Asia y América, entre las personas que vivieron hace más de 15.000 años. Cada versión de la caza cósmico comparte una historia central alineación un hombre o un animal persigue o mata a uno o más animales, y las criaturas se transforman en constelaciones.
Folcloristas, antropólogos, etnólogos y lingüistas han intrigado por mucho tiempo sobre qué historias míticas complejos que surgen en culturas muy distantes en el espacio y el tiempo son sorprendentemente similares. En los últimos años ha surgido un enfoque científico prometedor para la mitología comparativa en la que los investigadores aplican herramientas conceptuales que los biólogos utilizan para descifrar la evolución de las especies vivas. En las manos de aquellos que analizan los mitos, el método, conocido como análisis filogenético, consiste en conectar las sucesivas versiones de una historia mítica y construir un árbol familiar que traza la evolución del mito con el tiempo.
Mis estudios filogenéticos hacen uso del rigor extra de técnicas estadísticas y el equipo de modelado de la biología de dilucidar cómo y por qué los mitos y cuentos populares evolucionan. Además de la caza cósmico, he analizado otras familias principales de los mitos que comparten temas recurrentes y elementos de la trama. Pygmalion historias representan un hombre que crea una escultura y se enamora de ella. En los mitos Polifemo, un hombre queda atrapado en la cueva de un monstruo y se escapa al insinuar a sí mismo en una manada de animales, bajo la atenta mirada del monstruo.
Esta investigación proporciona nuevas pruebas convincentes de que los mitos y cuentos populares siguen el movimiento de personas en todo el mundo. Se revela que ciertos cuentos probablemente se remontan al Paleolítico, cuando los seres humanos desarrollaron herramientas primitivas de piedra, y se propagan junto con las primeras oleadas de migración fuera de África. Mis estudios filogenéticos también ofrecen una visión de los orígenes de estos mitos mediante la vinculación de historias orales y las leyendas transmitidas de generación en generación a los motivos que aparecen en las imágenes de arte rupestre paleolítico. En última instancia, espero que mi búsqueda en curso para identificar protomyths prehistóricos pueden incluso ofrecer una visión del universo mental de nuestros antepasados, cuando el Homo sapiens no fue la única especie humana sobre la Tierra.

LA RUTA DE CAZA COSMICA

Carl Jung, el padre fundador de la psicología analítica, cree que los mitos aparecen en formas similares en diferentes culturas, ya que emergen de un área de la mente llamado el inconsciente colectivo. "Los mitos son, ante todo, los fenómenos psíquicos que revelan la naturaleza del alma", sostuvo Jung. Pero la difusión de historias cósmicas caza en todo el mundo no puede ser explicado por una estructura psíquica universal. Si ese fuera el caso, las historias de caza cósmico aparecen por todas partes. En cambio, están casi ausentes en Indonesia y Nueva Guinea y muy raro en Australia, pero presente en ambos lados del estrecho de Bering, que evidencia geológica y arqueológica indica estaba por encima del agua entre 28.000 y 13.000 aC La hipótesis de trabajo es más creíble que los ancestros euroasiáticos de los primeros americanos trajeron la familia de mitos con ellos.
Para probar esta hipótesis, he creado un modelo filogenético. Los biólogos utilizan el análisis filogenético para investigar las relaciones evolutivas entre las especies, la construcción de diagramas de ramificación, o "árboles", que representan relaciones de ancestro común basados ​​en rasgos compartidos. historias míticas son excelentes dianas para tales análisis, ya que, al igual que las especies biológicas, evolucionan poco a poco, con nuevas partes de una historia central y añaden otros perdieron el tiempo a medida que se propaga de una región a otra.
En 2012 construí un modelo de esqueleto basado en 18 versiones del mito cósmico caza previamente recogidos y publicados por folcloristas y antropólogos. Convertí cada una de esas cuentas del mito en elementos de la historia discretos, o "mitemas", un término tomado del antropólogo estructural francés Claude Lévi-Strauss. Como los genes, mitemas son las características hereditarias de "especie" de historias, que pasan de una generación a la siguiente y cambian lentamente. Ejemplos de mitemas caza cósmico incluyen: una mujer rompe un tabú; una persona divina se detiene a un cazador; un dios transforma un animal en una constelación. Mi análisis inicial produjo una base de datos de 44 mitemas. Para cada versión de una historia, a continuación, codificado como 1 mitemas (actual) o 0 (ausente) y se aplicó una serie sucesiva de algoritmos estadísticos para rastrear los patrones evolutivos y establecer árboles genealógicos. En 2013 amplié el modelo para incluir 47 versiones de la historia y 93 mitemas. Con el tiempo he usado tres bases de datos separadas para aplicar diferentes algoritmos y verificación cruzada de los resultados de mi.
Uno de los árboles más arriba actualizada filogenéticas de la caza cósmico [ver ilustración de abajo] sugiere que la familia de mitos llegó a las Américas en varios puntos diferentes. Una de las ramas del árbol se conecta versiones griegas y Algonquin del mito. Otra rama indica paso a través del estrecho de Bering, que luego continuó en el país esquimales y para las Américas del noreste, posiblemente en dos ondas diferentes. Otras ramas sugieren que algunas versiones del mito se extienden más tarde que los otros de Asia hacia África y las Américas.

UNA METAMÓRFOSIS MÍTICA

Los biólogos evolutivos han observado que la mayoría de las especies no cambian mucho durante la mayor parte de sus historias. Cuando se produce el cambio evolutivo significativo, en general se limita a eventos raros y muy rápido de ramificación especiación. Este fenómeno se llama equilibrio puntuado. Lo mismo parece ser cierto con los mitos. Cuando la hermana versiones mitológicas divergen rápidamente debido a los cuellos de botella de migración, los desafíos de las poblaciones rivales o nuevos elementos ambientales y culturales, esos eventos son seguidos por períodos de estabilidad extendidas.
En general, las estructuras de las historias míticas que a veces permanecen sin cambios durante miles de años, son muy similares a la historia de los movimientos migratorios humanos a gran escala. Irónicamente, el análisis filogenético revela que una de las historias míticas más encanto de la repentina transformación de la historia de Pigmalión-es un buen ejemplo de este patrón estable de la evolución.
Historia continúa más abajo gráfico


Crédito: accurat; Fuente: "Una caza cósmico en el cielo Berber: una reconstrucción filogenética de la mitología Paleolítico," Julien d'Huy, en Les Cahiers de l'AARS, N ° 16; 2013

A medida que los griegos dicen que, Pigmalión, un escultor guapo de Chipre, evita la compañía de las mujeres locales relegados a una vida de prostitución sin amor por no pagar homenaje adecuado a Afrodita, la diosa del amor y la deidad patrona de la isla. Dejándose caer en su trabajo, Pigmalión cincela una estatua de marfil de una mujer, a la que los nombres de "Galatea" (o "amor durmiente"). Se viste la escultura en ropa de lujo y joyas, besos y caricias de TI, y habla con él todos los días. Durante una fiesta en honor de Afrodita, Pigmalión va al templo de la diosa, sacrifica un toro y reza por una esposa al igual que su amada estatua. Cuando regresa a casa y besa a Galatea, es sorprendido por el calor de la estatua. Afrodita ha traído a la vida Galatea.
poeta romano Ovidio inmortalizó el cuento popular griega en Metamorfosis e inspirado innumerables escritores, dramaturgos y artistas desde entonces.
Mi investigación sugiere que la evolución del mito de Pigmalión siguió una migración humana desde el noreste al sur de África que los estudios genéticos previos indican tuvieron lugar hace unos 2.000 años. En los cuentos contados por varias tribus a lo largo de esa ruta, un hombre de talla una imagen de una mujer y se enamora de ella; el muñeco cobra vida y se casa con el maestro. De acuerdo con la Venda de Sudáfrica, un hombre esculpe una mujer fuera de la madera. Después de que ella está animado, el jefe de la tribu intenta secuestrarla. El escultor se resiste y se lanza a la mujer al suelo, con lo cual se da la vuelta a la madera.
Un árbol filogenético construí usando la versión griega de Pigmalión y una versión de la gente de Madagascar Bara como puntos de partida arrojaron resultados interesantes. Los mitos griegos y Bara se reflejan entre sí estructuralmente, a pesar de que representan la mayor separación geográfica de cualquiera de las historias incluidas en el modelo de ordenador. Además, el Bara se instaló en una isla que no permitía la gran expansión de la población y la diversificación mitológica, y los griegos permaneció aislado durante gran parte de su historia de la exposición a los cuentos populares africanos. Sin embargo, tanto el Bara y versiones griegas del mito tienen notables similitudes con una versión anterior de la historia de las tribus bereberes del Sahara.
El análisis estadístico y empírica sugiere que las cuentas de los griegos y Baras probablemente conservan una versión de la saga Pigmalión que se originó con los bereberes entre hace 3.000 y 4.000 años y parece encapsular una versión muy antigua del mito: Un hombre hace una estatua de un tronco de árbol para disminuir su soledad; él u otro hombre lo viste; la estatua cobra vida, gracias a un dios, y se convierte en una bella joven; se convierte en la esposa de su creador, a pesar de que otra persona también quiere casarse con ella. Por supuesto, el protomyth real era probablemente tan rico en complejidad a medida que las versiones en que se basa la reconstrucción.

EL MONSTRUO EN LA CUEVA

En el pasado, los estudiosos de la mitología comparativa basó en gran medida en la intuición y el procesamiento manual de la información, lo que limita tanto la amplitud y el detalle granular del trabajo que podían hacer. Con el análisis filogenético asistido por ordenador, ahora podemos probar el impacto de los préstamos mitológicos entre los diferentes grupos culturales. Podemos crear bases de datos grandes y flexibles que incorporan la riqueza de observaciones empíricas por los estudiosos en los últimos años. Y podemos ampliar esas bases de datos para incluir nuevas versiones de historias y resultados de pruebas anteriores.
Construí el modelo inicial para un estudio filogenético del mito de Polifemo en 2012 basado en 24 versiones de la historia de Europa y América del Norte y 79 mitemas. Luego amplié progresivamente el tamaño de la muestra para incluir 56 versiones de la historia y 190 mitemas extraídos de una variedad de estudios previos publicados en Inglés, francés, alemán e italiano. También he creado tres bases de datos separadas y se aplica una variedad de algoritmos evolutivos y estadísticos para calibrar y cotejar los resultados de mi.


Crédito: JEN CHRISTIANSEN; Fuente: JULIEN D'HUY

Polifemo, el monstruoso, número de crías se alimentan de un solo ojo humano de Poseidón, dios del mar, hace una aparición espectacular en la Odisea de Homero. Cuando Odiseo tierras en la isla de Cyclops en busca de comida, él y 12 hombres subrepticiamente entrar en la cueva de Polifemo. Los rendimientos gigantes de pastoreo de sus ovejas, sella la entrada y devora a cuatro de los hombres de Odiseo antes de salir a la mañana siguiente para cuidar su rebaño. Esa noche, después de Polifemo come dos hombres más, Odiseo le pone borracho de vino puro. Polifemo le pide a su generosa invitado a decirle su nombre, y Odiseo responde: "Nadie". Una vez Polifemo se queda dormido, Odiseo le ciega con un palo afilado endurecido en un incendio. Polifemo grita por ayuda, pero cuando otros cíclopes llegan y preguntan quién lo dejó ciego, él responde: "Nadie". Mientras tanto Odiseo y sus hombres restantes escapan al aferrarse a los vientres de las ovejas del monstruo como Polifemo les deja salir a pastar.
Los indios Pies Negros, una tribu Algonquin que dependía de la caza de búfalos para obtener suficiente comida para sobrevivir, aprobó una historia relacionada de generación en generación. El tramposo Crow, que es a la vez humana y de aves, se esconde una manada de búfalos en una cueva. Crow es finalmente capturado y colocado sobre un agujero de humo, lo que explica que, desde entonces, los cuervos son de color negro. Crow promete librar a los búfalos. Pero rompe su promesa. Dos cazadores heroicos se transforman uno en un cachorro, y el otro en una vara de madera. La hija de Cuervo recoge el cachorro y el personal y los lleva a la cueva. Allí, los dos cazadores se transforman de nuevo, uno en un perro grande, la otra en un hombre, para conducir el búfalo sobre el suelo. Consiguen pasado Crow escondiéndose debajo de la piel de un búfalo como el rebaño cobra salir de la cueva.
Un árbol filogenético compuesto de la familia de mitos Polifemo indica que las historias siguieron dos grandes patrones migratorios: La primera, en el Paleolítico, propagan el mito en Europa y América del Norte. El segundo, en el Neolítico, paralelo a la proliferación de la ganadería.
Una versión de la historia Polifemo, conservado en una forma esquemática en Suiza, puede conservar una forma antigua: El monstruo, un enano con un ojo descubierto por un cazador, es un maestro de bestias en una montaña. Pero esta forma de la historia desapareció, probablemente como glaciares avanzaron durante el último máximo glacial, que alcanzó su punto máximo hace alrededor de 21.500 años. A continuación, una nueva versión, en la que el monstruo reside en un refugio, parece que se ha difundido, gracias a las sucesivas migraciones de en el Cáucaso y el Mediterráneo que habían proporcionado refugio para personas y otras especies biológicas de los cambios climáticos severos. Enlaces en el árbol filogenético sugieren las versiones homéricas de Polifemo crearon una tradición oral con una difusión independientes entre muchos grupos, por ejemplo, los ancestros de los pueblos de hoy en día Hungría y Lituania.

BÚSQUEDA DE LA PROTOMITOS ANCESTRALES

reconstrucciones filogenéticas de historias tanto el Polifemo y Hunt cósmico se basan en décadas de investigación por los estudiosos que basan su trabajo principalmente en las versiones orales y escritas de los cuentos populares y leyendas. Los actuales modelos también incorporan observaciones empíricas de los motivos mitológicos en el arte rupestre. Las similitudes en ciertos motivos rupestres y las historias reconstruidas abren una nueva ventana en el universo mental de los primeros humanos que migraron a través del estrecho de Bering hasta el Nuevo Mundo entre hace 30.000 y 15.000 años.
En el mito de Polifemo, como su pública de origen más probable es que lo oyó, un cazador se enfrenta a uno o muchos monstruos que poseen una manada de animales salvajes. Entre en el lugar donde el monstruo mantiene a los animales y encuentra su camino bloqueado por un gran obstáculo. El monstruo se trata de matarlo. El héroe se las arregla para escapar al aferrarse a la parte más vulnerable de uno de los animales.
Este protomyth-revelada por tres bases de datos filogenéticos independientes, muchos métodos estadísticos y etnológicos independientes de datos refleja la creencia, muy extendida por las culturas antiguas, en la existencia de un maestro de los animales que los mantiene en una cueva y la necesidad de un intermediario para libre ellos. También podría ser parte de una concepción de cómo Paleolítico juego emerge de un submundo. En la cueva de los Trois-Frères (o "tres hermanos") en los Pirineos franceses, frecuentados durante el Paleolítico superior, un panel muestra una pequeña criatura con la cabeza de un bisonte y el cuerpo de un ser humano, que parece estar sosteniendo un arco corto. Perdido en medio de una manada de bisontes, otro animal, similar a un bisonte, gira la cabeza hacia el híbrido humano, así como el intercambio de dos criaturas mira. En el examen, el muslo posterior izquierda del "bisonte" no es el muslo de un rumiante; sus proporciones son mucho más pequeños, como un ser humano hasta el muslo hasta el punto de que el arqueólogo André Leroi-Gourhan dio por una silueta humana. Por otra parte, el artista ha dibujado meticulosamente el ano y el orificio vulvar. Estos dos elementos se pueden comparar con algunas versiones amerindias de la historia Polifemo, donde el hombre se esconde en el animal mediante la introducción de su ano.
La primera versión de la caza cósmico, el antepasado de todas las demás cuentas de la historia de Calisto, reconstruido a partir de tres bases de datos diferentes, habría ido así: Un hombre está cazando un ungulado; la caza se lleva a cabo en el cielo o termina allí; el animal está vivo cuando se transforma en una constelación; y esta constelación es la que conocemos como la Osa Mayor.
Esta reconstrucción de la historia cósmica caza podría explicar la famosa paleolítica "así escena" que se encuentra en una cueva de Lascaux, Francia. El punto negro solitario intrigante cerca de la cruz del bisonte lo tanto, sería una estrella. La fijeza del animal, que no da la impresión de que en realidad la carga, tendría sentido si representara una constelación en lugar de una acción. Por otra parte, según algunos expertos, el hombre podría estar en posición vertical y ascendente del bisonte, que se hace eco de la subida al cielo del animal protomythic. Por último, las manchas negras en el suelo bajo el bisonte sugieren las hojas otoñales manchados de sangre del animal cazado.
La vinculación de una historia mítica y una imagen Paleolítico es difícil. Estos ejemplos sirven simplemente para ilustrar el poder interpretativo del método filogenético, lo que hace que sea posible proponer hipótesis plausibles y recuperar historias que desaparecieron hace mucho tiempo.

DRAGONES Y SERPIENTES PRIMEVAL

Mi investigación actual da credibilidad a la teoría fuera de África de los orígenes humanos, afirmando que los humanos anatómicamente modernos se originaron en África y se extendió desde allí a la
resto del mundo. Es un complemento de los estudios filogenéticos por los biólogos que indican la primera gran oleada de la migración humana que irradia de África siguió a la costa sur de Asia, poblado Australia hace unos 50.000 años, y llegado a América desde una fuente de Asia Oriental. Tanto el punto de la investigación biológica y mitológico a una segunda migración llegar a América del Norte en más o menos al mismo tiempo de una fuente de Eurasia norte.
Recientemente he construido un súper árbol filogenético para trazar la evolución de la serpiente y el dragón mitos que surgieron durante esos primeros olas de migraciones. Una protonarrative que lo más probable es anterior a la salida de África incluye los siguientes elementos básicos de la historia: serpientes mitológicas protegen las fuentes de agua, liberando el líquido sólo bajo ciertas condiciones. Pueden volar y formar un arco iris. Ellos son gigantes y tienen cuernos o astas en la cabeza. Pueden producir lluvia y tormentas eléctricas. Reptiles, inmortal como otros que cambian de piel o la corteza y, por tanto rejuvenecer, se contrastan con los mortales y / o se consideran responsables de la muerte de origen, tal vez por su picadura. En este contexto, una persona en una situación desesperada llega a ver cómo una serpiente u otro animal pequeño revive o se cura o de otros animales. La persona que utiliza el mismo remedio y tiene éxito. Construí esta protomyth de cinco bases de datos separadas variando tanto la definición de serpiente / dragón y las unidades de análisis, incluidas las versiones individuales del mismo tipo de cuento, tipos de serpientes y dragones, y zonas culturales o geográficos.
Con el tiempo espero ir aún más atrás en el tiempo e identificar las historias míticas que puedan arrojar luz sobre las interacciones durante el periodo Paleolítico entre las primeras especies de Homo sapiens y especies humanas que se extinguieron. Los biólogos evolutivos han identificado posibles cruces con los neandertales, Denisovanos y tal vez otros humanos arcaicos. intercambios materiales, así como el lenguaje y los préstamos mitológicos, también pueden haber ocurrido. Mi objetivo más inmediato es ampliar y refinar el súper árbol filogenético creciente de los mitos del Paleolítico, que ya incluye historias del sol que da la vida como un gran mamífero y de las mujeres como guardianes primordiales de santuarios sagrados de conocimiento.


Este artículo fue publicado originalmente con el título "Mitos de científicos de la Sociedad de seguimiento a Primordial Orígenes"


sábado, 22 de octubre de 2016

Redes cerebrales para el control mental

Cómo Red de Neurociencia ha creado una nueva era de Control Mental
MIT Technology Review


El cerebro humano es una red compleja. Es por eso que los neurocientíficos esperan usar la teoría de redes para controlar las mentes.

Al salir por la tecnología de la arXiv 19 de de octubre de, el año 2016

Las redes complejas forman la columna vertebral de la sociedad moderna: Internet, la red de aviación, el patrón de conexiones entre los individuos. Y ejemplos más complejos surgen constantemente, la forma en que interactúan los genes en las células, cómo la información fluye a través del sistema bancario y el ecosistema.

Cuanto más complejo es el sistema, más difícil es controlar. Sin embargo, los informáticos, médicos, economistas y el ejercicio como un mínimo de control sobre muchas de estas redes.

Y eso plantea una pregunta interesante: ¿es posible ejercer el mismo tipo de control sobre la red más compleja que conocemos: el cerebro humano?



Hoy en día tenemos una respuesta de tipo, gracias a la obra de John Medaglia en la Universidad de Pennsylvania en Filadelfia y algunos compañeros que evalúan la disciplina que está surgiendo en la intersección entre la neurociencia a la red y la teoría de control de la red. "Una cuestión fundamental ... es cómo modular una red cerebro humano para el tratamiento de los déficits cognitivos o mejorar las capacidades mentales", dicen. "Postulamos que el control de la red refiere fundamentalmente a control de la mente."

La idea básica detrás de este tipo de control es sencillo. La inyección de energía en una parte de una red debe influir en la actividad en otras partes de la red.

En el cerebro, este tipo de manipulación ya se utiliza en las técnicas de estimulación profunda del cerebro, tales como los utilizados para la enfermedad de Parkinson. Esto implica la inyección de energía en una parte del cerebro llamada ganglios basales, que está implicado en el movimiento. Esto luego reduce el deterioro del movimiento.

Una técnica similar se utiliza también para el trastorno obsesivo compulsivo, donde las personas experimentan impulsos abrumadores participar en un comportamiento repetitivo. Esto a menudo se asocia con la actividad eléctrica inusual en los circuitos fronto-estriado del cerebro. La estimulación cerebral profunda puede normalizar esta actividad y mejorar sustancialmente la calidad de vida.

A pesar del éxito de este tipo de técnicas, Medaglia y co señalan que existen retos significativos en el control de otros comportamientos. Un problema es que la estimulación no sólo influye en una parte del cerebro, pero tiende a cascada a través de muchas áreas en formas que son difíciles de caracterizar.

Es por eso que la comprensión de la conectividad en el cerebro es un importante objetivo futuro. Este es el objetivo de los diversos proyectos de "conectoma" en todo el mundo: al mapa de las vías estructurales en el cerebro.

Y es que ya está empezando a sugerir que el cerebro emplea diferentes estrategias de control. Cada una de estas estrategias son objetivos potenciales para el control de la mente.

Por ejemplo, los neurocientíficos piensan que el sistema fronto-parietal controla nuestra capacidad de cambiar entre tareas. Curiosamente, este sistema no está fuertemente ligada a otras partes del cerebro, pero el trabajo teórico ya ha demostrado que parece que funciona moviendo el cerebro en estados difíciles de llegar a lo largo de una especie de panorama energético. Así que una vía para el control de la mente podría ser el uso de inyecciones de energía para guiar el cerebro a través de este paisaje.

Apenas cómo se puede hacer esto no es del todo clara, pero hay varias tecnologías que tienen potencial. Estos incluyen la estimulación magnética transcraneal, que utiliza un campo magnético externo para inducir corrientes en partes del cerebro, junto con diversos estimuladores implantados, que inyectan directamente la energía. La mejora de la resolución de este tipo de inyección de energía es un importante objetivo futuro.

No hay discusión de control cerebral estaría completa sin una mención de la ética. Medaglia y co pasan algún tiempo esbozar las ideas actuales sobre este tema. Ellos basan sus argumentos en los cuatro principios básicos de la ética médica y de investigación: no maleficencia, la beneficencia, la justicia y el derecho a la libre determinación.

Esta es un área que tendrá que evolucionar a medida que surgen nuevas técnicas. "A medida que la ciencia de los avances de control mental, será importante para aclarar las prácticas de control aceptables con respecto a nuestra naturaleza fundamental y la propia identidad", dicen Medaglia y co.

Otro de los objetivos a la reflexión es comprender el vínculo entre el control neural y el control psicológico. "El mapeo entre la dinámica del cerebro y los procesos cognitivos específicos será fundamental para informar a control psicológico (es decir," mente ")," decir Medaglia y co.

Y ahí radica un punto ciego importante en este trabajo el papel de la información. Los procesos de la mente son claramente basada en la información. Y gran parte de la psicología se ha centrado en cómo la información puede cambiar los estados del cerebro. Por ejemplo, cambiar el estado emocional de una persona con un viaje al cine o leyendo un libro.

Este es el control mental basado en la información. Y, sin embargo Medaglia y co no mencionan este tipo de efectos basados ​​en la información.

Tal vez eso es comprensible. El papel de la información en los procesos cerebrales es poco conocida. Los neurólogos no entienden los códigos neuronales en el trabajo en nuestro cerebro.

Hasta que tienen que entender y más, las técnicas actuales parecerán crudo. En comparación, nadie intentaría solucionar el mal funcionamiento de un teléfono inteligente con el zapping con una corriente de un par de electrodos. Tampoco tendrían que reparar un sitio web chocado con un potente campo magnético externo.

De hecho, sólo una pequeña fracción de un posible mal funcionamiento de tecnologías de la información podría ser abordado de esta manera.

Y lo que es probable que sea con el cerebro humano. Un enfoque basado en la información es probable que sea mucho más potente.

El vínculo entre la información y la mente es hoy poco conocida. Si una mejor comprensión es una herencia de este tipo de trabajo, que habrá sido un importante paso adelante.

Ref: arxiv.org/abs/1610.04134: Mind Control: Frontiers in Guiding the Mind

jueves, 20 de octubre de 2016

La paradoja de la amistad: Tus amigos son más populares que vos

¿Por qué sus amigos más populares que usted?
 Por J. P. - The Economist



¿Se siente igual que sus amigos sean más populares de lo que usted lo es? Eso puede ser porque es verdad-para casi todo el mundo. Este resultado extraño, conocido como el "paradoja de amistad", se ha observado más recientemente para aplicar en Twitter. Cuando los investigadores de la Universidad del Sur de California analizaron 5,8 millones de microblogs (194m y vínculos entre ellos) encontraron que, en promedio, tanto a las personas que un usuario sigue y, peor aún, los que le siguen, tienen más seguidores que él. ¿Cómo puede ser esto?

La paradoja de la amistad fue identificado por primera vez en 1991 por Scott Feld, un sociólogo que trabaja en la Universidad Estatal de Nueva York en Stony Brook. En aquel entonces, por supuesto, el Dr. Feld estaba mirando a las redes sociales del mundo real en lugar de los en línea. Luego, el año pasado, los científicos de la Universidad de Cornell confirmaron que el resultado es válido para los usuarios activos de Facebook (721m personas en el momento de la investigación, unidas por 69 mil millones de bonos virtuales de amistad). De hecho, se obtiene para cualquier red en la que algunos miembros son más populares que otros. Y se deriva de la aritmética básica.


Considere la posibilidad de una sencilla red social compuesta por cuatro personas: Alice, Bob, Chloe y Dave. el único amigo de Alice es Bob. Bob es también amigo de ambos Chloe y Dave, que son amigos entre sí, pero no con Alice. Esto quiere decir que Alice tiene un amigo (Bob); Chloe y Dave tienen cada uno dos amigos (uno al otro y Bob); y Bob tiene tres. En promedio, a continuación, cada persona en la red tiene dos amigos (ocho amigos dividido por cuatro personas). Pero ahora considerar la cantidad de amigos amigos de cada persona tienen (en otras palabras, amigos de amigos). Alice tiene un amigo, Bob, que a su vez cuenta con tres amigos. amigos de Chloe son Bob, que cuenta con tres amigos, y Dave, que tiene dos, lo que significa que los amigos de Chloe tienen cinco amigos entre ellos (a pesar de que sus listas de amigos se superponen). La situación es análoga Dave. amigos de Bob, Alice, Chloe y Dave, tienen cinco amigos en todos. Por lo que el número total de amigos de amigos es 18. Sin embargo, el número total de amigos en la red es de ocho, como antes. Por lo que el número medio de amigos de amigos (es decir, la cantidad de amigos amigos de cada persona tienen) es de 2.25 amigos cada uno (18 dividido por ocho), más de los dos amigos, en promedio, de las cuatro personas en la red. La razón, por supuesto, es que Bob, que tiene la mayoría de los amigos, en primer lugar, también se cuenta con mayor frecuencia en la categoría de amigos-de-amigos, elevando el promedio. Lo mismo es cierto para otras redes: algunos individuos bien conectados tienen más amigos que la mayoría de la gente, y sesgar la media para cada uno en cuya red que aparecen (que, debido a su conectividad, es un montón de gente).

Este cálculo numérico, tiene algunas consecuencias interesantes que otros-que no justifica empieza a preocuparse sobre su estatus social relativo. Durante el brote de gripe H1N1 en 2009, por ejemplo, Nicholas Christakis, de la Universidad de Harvard, y James Fowler, de la Universidad de California, San Diego, mantienen control sobre un grupo grande de estudiantes de Harvard elegido al azar. También supervisaron las personas nombradas como aquellos participantes amigos. Sorprendentemente, los amigos se enfermaron aproximadamente dos semanas antes de que los estudiantes al azar, probablemente porque eran, en promedio, mejor conectados. Con el mundo sólo imperfectamente preparado para una pandemia, siendo capaz de detectar las tendencias de esta manera podría ser útil.

martes, 18 de octubre de 2016

Análisis de sentimiento de Twitter en NodeXL

Análisis de sentimiento en Twitter con NodeXL Pro

Mat de Medium

Vamos a bucear en el pozo de la desesperación. Vamos a ver qué piensa acerca de Twitter Donald Trump (#topical). ¿Estás listo? Estoy listo.
Arranca NodeXL Pro. Es posible que desee leer mi artículo anterior acerca del mapeo para conseguir un acercamiento a los fundamentos de la ingestión de datos y limitaciones, pero para nuestros propósitos esto es bastante fácil.
Para esto, estoy más interesado en los tweets que incluyen el término "realdonaldtrump," que yo con él y su red de seguidores, por lo que vamos a ir a la importación:



Y seleccione "From Twitter Search Network,", que le conseguirá esto:


Que el Señor nos ayude

Eso va a chug por un tiempo dependiendo de qué término de búsqueda que ha decidido utilizar. Recuerde que puede utilizar operadores de búsqueda avanzada de Twitter aquí, por lo que puede hacer estallar en algo así como "q = realdonaldtrump% 20near% 3A" Washington% 2C% 20DC "% 20within% 3A15mi & src = typd & lang = es" tirar Tweets cerca de Washington, DC, que incluir la cadena "realdonaldtrump."
Este es un buen punto como cualquier otro para llamar su atención a las herramientas integradas de análisis de los sentimientos de Twitter - :), :(, y lo hacen básicamente lo que dice en la lata, pero también son una especie de caja de negro?. . Hacer esto en NodeXL le da un control más fino.
En cualquier caso, usted va a terminar con algo que se parece a lo siguiente:


38000 filas, no estamos con grandes datos aún 

Una vez que se importan los datos, ir a Graph Metrics, así:



Y desplazarse hacia abajo para marcar la casilla de "Words and Word Pairs" en el cuadro que aparece.



La cabeza en las opciones y seleccionar el botón de radio junto a "On the Edges worksheet," y elija "Tweet". NodeXL se verá en esta columna para parejas sentimiento palabra y palabra. Por defecto, se utiliza el léxico conclusiones, pero si usted está usando esto para identificar una determinada palabra o frase que es positiva o negativa, o una expresión coloquial que significa algo único, que tendrá que añadir manualmente que a la lista.



Un breve interludio de matemáticas, con muy poco de matemáticas: "prominencia" básicamente calcula la "importante" la palabra es - la frecuencia con que se presenta para toda la columna, y la "información mutua" mira pares de palabras y calcula cómo relacionada ese par de palabras es. Los números pequeños son pares de palabras poco comunes, los números más grandes son más comunes.
Un interludio lingüística aún más breve - Sé mucho menos acerca de esto que yo acerca de las matemáticas, la advertencia justa: que estamos viendo pares de palabras aquí, que son "Bigramas."
Tome una frase como "La Escuela McCourt de Políticas Públicas es la escuela noveno y más reciente en la Universidad de Georgetown." Restar las palabras de relleno ( "el", "de", "y", "a"), y poner el resto de esas palabras en una bolsa.
En esa bolsa, tiene 10 unigrams. “McCourt,” “School,” “Public,” “Policy,” “is,” “ninth,” “newest,” “school,” “Georgetown,” “University.”.
 Tiene 9 Bigramas: “McCourt School,” “School Public,” “Public Policy,” “Policy is,” “is ninth,” “ninth newest,” “newest school,” “school Georgetown,” “Georgetown University.”
Tiene 8 trigramas: "McCourt School Public" y así sucesivamente. La agrupación de palabras en conjuntos más grandes le da más información, pero se obtiene hasta el punto en que se está metiendo frases únicas muy rápidamente, y frases únicas son difíciles de analizar.
Hay un montón de explorar en lingüística computacional y procesamiento del lenguaje natural, pero estamos tratando de obtener las bases. Una vez que los parámetros han terminado de calcular, obtendrá dos nuevas hojas: Las palabras y los pares de palabras.
La hoja de Palabras, se muestra a continuación, es donde se puede ver el análisis de los sentimientos por palabra.



Por "realdonaldtrump," las palabras marcan sentimientos positivos y negativos son más o menos iguales para esta muestra de 10.310 tweets a 10.558, con excepción de la palabra "trompeta", independiente, se menciona 1.533 veces y es parte de la lista sentimiento positivo. Los chillidos. Al restar 1.533 de 10.310 nos da 8.777 a 10.558 para una final positiva a la relación de sentimiento negativo de 0,83.

La hoja par de palabras nos muestra los Bigramas más comunes en esta muestra de tweets:



"rt" y "realdonaldtrump" es el par de palabras más común - para la gente que todavía están retweeting manualmente, bendiga sus corazones. Podría ser útil para recortar cualquier par que incluye nombres de usuario obvias. Con 28 días a la izquierda en la elección, "28" aparece un par de veces. "Aparejado" y "sistema" y "donar" y "grande" ambos muestran hasta varios cientos de veces, mostrando que más o menos donde la gente mencionar "realdonaldtrump" tener la cabeza ante, aquí el 10 de octubre de 2016.
Así es como se hace el análisis de opiniones utilizando NodeXL. Bastante sencillo, y los puntos de vista son un poco más digerible que los vectores propios y medidas de centralidad cuando se trata de explicar la cartografía. Por otra parte buena es que estos datos son mucho más amigable para exportar a Tableau, PowerBI, o lo que su herramienta de visualización de datos de elección es, y puede ofrecer un muy amplio conjunto de información acerca de lo que la gente piensa acerca de su búsqueda de una frase de interés es.
Preguntas, quejas, ofertas de trabajo solicitados, pío me @sabrmattrics: - ¡Soy todo oídos.