En la teoría de grafos y análisis de redes sociales, la centralidad Alfa es una medida de centralidad de los nodos de un grafo. Es una adaptación de la centralidad de vector propio con la particularidad de que los nodos están impregnadas de importancia a partir de fuentes externas.
Definición
Dada una gráfica con la matriz de adyacencia la centralidad alfa se define como sigue:
donde es la importancia dada al nodo externo y es un parámetro. [1]
Motivación
Para entender la centralidad alfa primero hay que entender Centralidad del Vector Propio. Un proceso intuitivo para calcular vector propio carácter central es dar a cada nodo de una cantidad positiva al azar a partir de influencia. Cada nodo se divide entonces su influencia de manera uniforme y lo divide entre sus vecinos hacia el exterior, recibiendo de sus vecinos hacia el interior en especie. Este proceso se repite hasta que todo el mundo está dando hacia fuera tanto como que están tomando y el sistema ha alcanzado el estado estacionario. La cantidad de influencia que tienen en este estado estacionario es su centralidad del vector propio. Computacionalmente este proceso se llama el método de la potencia. Sabemos que este proceso ha convergido cuando el vector de influencia cambia sólo por una constante de la siguiente manera.
Donde es la cantidad de influencia que el nodo i lleva, es la matriz de adyacencia y pasa a ser el valor propio director (aunque esto no es muy importante en este caso).
La centralidad Alfa mejora este proceso al permitir que los nodos que tienen fuentes de influencia. La cantidad de influencia que el nodo i recibe en cada ronda se codifica en . El proceso descrito anteriormente ahora debe detenerse cuando
,
Donde es una constante que intercambia la importancia de la influencia externa en contra de la importancia de la conexión. Cuando sólo importa la influencia externa. Cuando es muy grande, entonces sólo importa la conectividad, es decir, reducimos al caso centralidad del vector propio.
En lugar de realizar la iteración descrita anteriormente se puede resolver este sistema para x, obteniendo la siguiente ecuación:
,
Aplicaciones
La centralidad Alfa se lleva a cabo en la biblioteca igraph para el análisis y visualización de red. [2]
Ejemplo
FUna epidemia representa otro tipo de flujo en una red. Una epidemia es un proceso dinámico que, a diferencia del paseo aleatorio, transiciona simultáneamente a todos los vecinos de un nodo dado (y con éxito infecta cada nodo, o sobrevive en ese nodo, con una probabilidad a). La película anterior muestra una propagación de la epidemia en el gráfico Club de Karate. Bajo ciertas condiciones, que alcanza un estado estacionario, dada por centralidad Alfa. La centralidad Alfa fue introducido por Bonacich [1987] como una generalización del índice de Katz de un nodo. Cuando la probabilidad de infección está supeditada a sobrepasar un umbral epidémico, la centralidad Alfa del Vector Propio es proporcional a la centralidad. Esta medida, introducido por Bonacich [2001] está dada por el vector propio que corresponde al valor propio más grande de la matriz de adyacencia del grafo [Ghosh y Lerman, 2011]. Por cierto, el umbral de epidemia está dado por la inversa de la mayor valor propio de la matriz de adyacencia [Wang et al., 2003].
Código de Matlab para calcularla
a=0.1; % damping factor has to be smaller than 1/lambda0, where lambda0 is largest eigenvalue of A
El análisis de la red de 2 modos usando Pajek Parte 3
Intan Dzikria - My Life, My Dreams
Antes de la Parte 1 y la Parte 2 de esta serie de análisis de red de 2 modos usando el software Pajek Ya te dije acerca de cómo una red simplificada y encontrar centralidad de una red. Ahora bien, en esta parte, quiero decirte acerca de cómo hacer la agrupación jerárquica en una red.
Usando el lenguaje humano simple, cluster es algo que la agrupación de varias personas que tienen mismas características. Por lo tanto, puede ser más fácil de averiguar algo en una gran red social.
En primer lugar, abrir su red simplificada
En segundo lugar, de esta instrucción: Cluster - Create Complete Cluster Operations - Network + Cluster - Dissimilarity* - Network based - d5 Correct Euclidian
Llenar la ventana emergente con 0
Guarde el archivo que es archivo EPS que contiene dendograma de la agrupación
Abra el archivo dendograma utilizando Sra Palabra.
Este dendograma a explicar cómo las personas agrupadas en base a sus sueños para el futuro.
Pero también se puede ver el hierarchi través Pajek con clic en File - Hierarchy - Viet/Edit. A continuación, una pequeña ventana de jerarquía será pop-out y se puede desplegar la raíz y ver que hay dos grupos allí.
Para cerrar el árbol, puede hacer clic en Edit - Change Type en la ventana de visualización jerarquía.
Para conocer el resultado, que tiene que hacer la partición primero con hacer clic en Hierarchy - Make Partition. A continuación, se puede dibujar la red con Draw - Network + First Partition
El resultado es como la imagen de abajo. La red agrupados en dos grupos. Cada grupo presenta a la gente que tiene los mismos sueños futuros.
En realidad, una red con dos racimos se puede reducir. Reducir una red da a conocer la forma en clusters están vinculados entre sí y lo bien que la agrupación resultado es.
Usted puede hacer eso cliqueando Operations - Network + Partition - Shrink Network
Una pequeña ventana pop-up y usted tiene que llenar el número mínimo de líneas entre grupos y el número de racimos que no va a ser reducido.
Después de hacer clic en OK, se puede dibujar la Network + First Partition y el resultado es como esto
Se puede ver en los resultados de la red de contracción que los grupos Claire tienen vínculos con otros grupos. Por ejemplo Claire quiere estar orgullosos padres y ese sueño también en los sueños del grupo Niek.
De acuerdo ... eso es por ahora acerca de la red de 2 modos de analizar el uso de Pajek. Espero que pueda ser útil para usted y si usted tiene alguna pregunta puede comentar abajo. :)
El análisis de 205.718 usuarios verificados Twitter Desde el año 2008 se crea visualizaciones de red para comprender mejor cómo funcionan las comunidades. En este artículo voy a echar un vistazo a cómo verificada usuarios de Twitter están conectados y quienes son.
Lo siento por la mala calidad de la imagen. Medio les parece comprimir mucho. Puede descargar el PNG original (5 MB). Para obtener más información sobre el algoritmo, mira la sección de recogida de datos en la parte inferior.
¿Cómo están conectados las cuentas verificadas en Twitter?
Aquí están todas las cuentas de Twitter verificados en una sola imagen. Cada nodo es una cuenta y el tamaño se debe a la cantidad de personas los siguen. Tamaño ajustado con interpolación spline para hacer las cuentas con menos seguidores más visible y reducir los tamaños de los que tienen el mayor número de seguidores. De lo contrario las cuentas con millones de seguidores serían mayores que los de las propias comunidades.
Nombrando las sub-comunidades
La imagen se ve bien, pero se vuelve interesante cuando se va más profundo. En cuanto a cada uno de estos nudos de cuentas para entender de qué se trata. Si tienen algo en común. O si no son más que la gente al azar siguientes entre sí.
En primer lugar tratamos de ver de que se tratan estos grupos
Como se puede ver en la imagen grande más adelante, los grupos no son tan desconectados como se ven sin las conexiones (bordes). Sin embargo, el algoritmo todavía era capaz de encontrar comunidades muy unidas. Y si bien hay muchas comunidades transversales siguientes, la mayoría de los siguientes ocurren entre las propias comunidades.
Todo el gráfico es de US céntrica. Ese gran nodo de color marrón en el medio de todo. Eso es @twitter. Y el azul claro se superpone con, que es @youtube. La otra gran luz azul en la parte inferior derecha media son celebridades. @katyperry, @justinbieber, @theellenshow, @rihanna, @ladygaga y así sucesivamente. Hay mucho más en juego en este sector centro, pero en esta visualización es difícil de ver. Voy a echar un vistazo más de cerca más adelante en este artículo.
Mientras que es posible diferenciar entre grupos de actualidad en el centro, para el resto de las sub-communites se agrupan principalmente regional. Esto tiene que ver con el menor número de cuentas verificadas para los demás países. Si pongo cada uno de estos grupos en su propio gráfico, estoy seguro de que será posible obtener una imagen más clara de cómo están conectados en sí mismo y no sólo una gota.
Alemania, Austria y Suiza están conectados de forma natural por el lenguaje. Canadá es la extensión de Estados Unidos hacia la izquierda, Reino Unido hacia la derecha y Australia en la parte inferior derecha. Una vez más, el lenguaje como un factor para ello. No es la cercanía cultural. Pero esto existe para más grupos.
Otro grupo de lengua española es de color verde en la parte superior. Incluso después de varios intentos, no fue capaz de encontrar otra conexión entre todas las cuentas agrupadas allí. Son de diferentes países de América del Sur, así como los medios de comunicación de Estados Unidos en español y más. Cerca de México, Argentina y España. Brasil, con cierta distancia.
Turquía está lejos de todos los demás. Especialmente la UE, que está justo al lado de la ONU y un poco de política del Reino Unido. Más cerca de la UE no es Israel. Me sorprendió que aparece cerca de Portugal, Finlandia, Suecia y Dinamarca. En el otro lado Rusia. Y justo detrás de Rusia Qatar y Arabia Saudita.
Francia tiene una posición de fuera en la parte superior derecha, alguna conexión con Italia y España. Lejos de la UE y Alemania. Pero no todos Alemania. Hay otro sub-comunidad alemana. Fútbol. O mejor: Bundesliga. Or está cerca de los Países Bajos también. Y, por supuesto, con el fútbol en el Reino Unido. Hay otro grupo de sub-comunidades cercanas: eSport. Y eSport pasa por contracción de los desarrolladores de juegos que se sientan en el borde de la burbuja de los Estados Unidos.
En el borde derecho no es Asia con muchas varias comunidades más pequeñas. Todavía no sé por qué Japón tiene dos sub-comunidades que no están tan bien conectadas entre sí.
205 mil cuentas de twitter verificadas y 19 millones de conexiones entre ellas
Viaje a través de la gráfica [video, alemán]
En el video Voy a través de los grandes sub-comunidades y hablar de lo que creo que son y por qué son exhibidas como un grupo distinto.
Lugares más populares
Top 25 lugares (como las personas que escriban en su biografía)
Twitter no tiene la función de autocompletar para los datos de localización como Facebook lo hace. La gente puede poner en el campo de ubicación de lo que quieran. Como resultado no es tan grande como para trabajar con los datos. Como se puede ver en el gráfico anterior en el Top 25 lugares tienen varias ortografías diferentes. Londres no es más popular que Los Ángeles, pero más personas utilizan el mismo formulario. Y éstas son sólo las formas más populares, para cada ciudad hay muchas formas diferentes de escribir ellos. Algunos añaden el estado, algunos del país, algunos utilizan el barrio y mucho más.
Tal vez voy a tener tiempo para mirar en todas estas formas de un día o encontrar una herramienta que los normaliza. Por ahora creo que la nube de la palabra es suficiente, ya que no se preocupa por la ubicación exacta de la palabra de la cadena.
La recogida de datos
Cuando llegó a mi cuenta de Twitter verificada, he notado que @verified comenzó a seguirme. En cuanto a sus seguidores que es fácil de adivinar que sigue cada cuenta verificada en Twitter. Por lo tanto, puedo decir que hay 206 000 cuentas verificadas en Twitter en el momento. Y comprueben alrededor de 1.000 cuentas cada día. Puede haber algunas cuentas que bloquean @verified y por lo tanto no aparecen en sus seguidores pero supongo que la cantidad es tan pequeña que puedo ignorarlo. El uso de la cuenta como punto de partida que es posible recoger la red de cuentas verificadas en Twitter.
He utilizado una versión modificada del comando Python twecoll herramienta de línea por JP de Vooght para recoger una lista de todas las cuentas seguido por @verified. Luego, la herramienta fue a través de todas estas cuentas 205k y miró a los que siguen. Para un conjunto de datos que he limitado a las cuentas que siguen a menos de 10 000 cuentas y un segundo conjunto de datos de cuentas que siguen a menos de 1 000 cuentas. Hay dos razones para esto. Las personas más administraciones siguen, el menos importante se vuelve cada conexión. La segunda razón es la limitación técnica de mi equipo (4670k i5 a 4,2GHz, 16GB de RAM, 250 GB de Samsung EVO 840, GTX 760). A pesar de que funciona con el conjunto de datos más grande, no es divertido para trabajar, porque todo lleva más tiempo.
La recolección de datos funcionó en una Frambuesa Pi 2 de 7 días a partir de 22. 28/08/2016 con sólo algunas horas de pausa debido a los errores que tenía que corregir manualmente. Debido al tiempo de largo plazo hay algunas inconsistencias en los datos cuando la gente sigue o unfollowed alguien en ese período de tiempo. En esta escala no hace una diferencia. Hay algunas cuentas en el conjunto de datos que no se verifica más. Tomé un vistazo más de cerca a las 36 cuentas. Estas fueron todas las cuentas que han perdido su estado verificado en un día de cada cuentas verificadas. La mitad de ellos elimina su cuenta / suspendieron, la otra mitad fue privado y perdió su estado verificado por eso.
El conjunto de datos grande, <10 000 seguidores, dispone de 205 718 cuentas de Twitter y 45 302 877 conexiones entre ellos. El conjunto de datos más pequeña, <1 000 seguidores, tiene 205.718 cuentas, así y 19 176 260 conexiones.
Yo uso Gephi para visualizar los datos. Pié el proceso de obtención de los datos en un estado útil. OpenOrd (25, 25, 25, 10, 15; cortar 0,8; 500 iteraciones) me dio la disposición más útil. Los colores son calculados por el algoritmo de modularidad. Puedo cambiar el tamaño de los nodos de vez en cuando. Si no se ha señalado que son seguidores.
Algunas Estadísticas generales
Cargué las estadísticas de las cuentas verificadas 205K en Excel e ignore las conexiones. Estos números no ignoran todas las cuentas, no importa cuántas cuentas que siguen.
Cuando presenté mi cuenta para la verificación, me dijeron que por algunos contactos que no tienen suficientes seguidores. De hecho cuentas verificadas tienen un promedio de 117 845 seguidores. Pero hay una gran cola larga. La mediana es a los 9 370 seguidores. Hay más de 100 mil cuentas con menos de 10 000 seguidores. Y el resto no tiene que mucho más. El promedio se sesgada por las cuentas de mega como @katyperry con 92.2m seguidores. Hay 188 cuentas verificadas con más de 10 millones de seguidores y 4 330 cuentas verificadas con más de 1 millón de seguidores. Hay una cuenta verificada con sólo dos seguidores.
Verified Twitter account with fewest followers: @ghisperrier. 2 Followers.
Verified Twitter account with most followers: @katyperry 92.2m
Pero, ¿cuántas cuentas se atienen a las cuentas verificadas? Por término medio se siguen las cuentas de 2031. Pero de nuevo nos dieron algunos seguidores de mega. Una cuenta sigue cuentas 3.6m. La mediana se encuentra en una muy manejables 475 seguidores. Personalmente siento que todo por encima de 5 000 seguidores no se sigue de forma manual. Después de todo el mundo es una táctica frecuentemente usada para generar siguientes. Así que muchas personas hicieron que Twitter introdujo un límite que sólo se puede seguir un cierto porcentaje representa más de lo que sigue (Base Límite 5 000, límite diario 1 000). Esto dio lugar a una nueva táctica seguimiento y no seguir. Las cuentas siguen a tantas personas como sea posible y unfollow todo aquel que no siga de nuevo en x días. Estoy divagando. Hay 3 551 cuentas que siguen a nadie y 33 328 cuentas que siguen a otros a menos de 100. Una cuenta volvió a los siguientes negativos de -28. Supongo que eso es un error con la base de datos de Twitter.
Lo siento por la elección del eje.
Las cuentas verificadas han publicado una cantidad acumulada de 2 488 119 264 actualizaciones de estado. 12 095 en promedio. La mediana de 4 a 191. Sin cuenta la edad, estos números no significan nada. La mayoría de las cuentas son cuentas hablador de apoyo por parte de empresas. AmexOffers ha publicado tweets de 5,2 millones. Por supuesto que hay muchas cuentas verificadas, las cuales no han twitteado en absoluto. O eliminado todo. 131 para darle el número. 25 y 764 cuentas verificadas registraron menos de 500 tweets.
La mayoría de las cuentas de Twitter verificadas fueron creados en 2009. El gráfico anterior es bastante sorprendente si nos fijamos en la popularidad general de Twitter.
De lunes a domingo casi dos veces el número de cuentas se crearon que en el fin de semana. Necesito un conjunto de datos para compararla con antes de que yo puedo decir si esto es más probable que provenga de la pauta general de uso de Twitter o si estas cuentas son cuentas de trabajo es más probable que a menudo son creadas por las agencias.
Siete aprendizajes
Las cuentas verificadas están conectados regionalmente primera, segunda y temáticamente
El lenguaje es una característica importante mutua
Las cuentas más seguidas son las celebridades más populares
La política y la tecnología tienen más seguidores entre cuentas verificadas
Las cuentas de redes son influyentes de todo el mundo
La mayoría de las cuentas verificadas son muy activos, pero siguen pocas personas
Compartir grandes gráficos es complicada
Explora usted mismo y dime lo que has encontrado
Usted puede explorar la gráfica, ya sea como una versión GigaPan, que carga de forma dinámica o ir a por todas y tratar la versión de 30 MB sigma.js, que puede bloquear el navegador y toma algunos minutos en cargar, pero tiene una función de búsqueda. O sin búsqueda, pero es mejor utilizar el zoom. Ambos tienen su versión sigma.js eje Y invertida, lo que está en la parte superior de las capturas de pantalla aquí, está en el fondo allí.
Visualización zoomable en Gigapan
Compartir sus ideas en los comentarios oa través de Twitter.
Colabore conmigo
Quiero escribir artículos acerca de cada sub-comunidades y necesitan la ayuda de personas que ya están conociendo el grupo respectivo. Si quieres colaborar conmigo en uno de estos artículos por favor envíeme un correo electrónico con el grupo está interesado en: lucahammer@gmail.com. Entonces le envía un archivo con los datos establecidos para ese grupo, una breve guía de cómo se puede trabajar con él y un enlace de Google Docs en el que podemos trabajar el artículo juntos. Puede publicar el artículo final en su propio blog / medio / publicación o que publicarla aquí.
Aquí está la guía de cómo alguien puede analizar las redes de Twitter con Gephi
¿Jon Snow es realmente muerto? Tyrion Lannister será continuar su difícil alianza con Daenerys Targaryen y sobrevivir a su hermana la ira de Cersei? Será Sansa Stark escapar de la sádica Ramsay Bolton y tomar su lugar como reina del Norte?
Estas preguntas, en la superficie, no tienen nada que ver con las matemáticas. Sin embargo, según un estudio reciente aplicación de la teoría de redes para el Juego de Tronos, Jon, Tyrion y Sansa son demostrablemente los personajes centrales de la saga.
Para aquellos de ustedes que viven en una cueva, Juego de Tronos (GOT, para abreviar) es uno de los programas más populares de televisión, basada en las novelas muy populares por George R. R. Martin. GOT es un hilo de fantasía ambientado en las tierras de Poniente y Essos. La historia contiene la variedad usual de duelo de reyes y reinas, dragones y magia. A diferencia de señor de los anillos, sin embargo, la historia es completamente adulto de sexo y violencia a raudales. personajes principales mueren. Mucho. Hay gran elenco que emana de las principales familias reales que disputan el Trono de Hierro.
El mundo de GOT
El autor principal del breve documento de la Red de Tronos es un co-autor de la mina, Andrew Beveridge del Macalester College. Andrew es un teórico de la gráfica, con un fondo tanto en matemáticas teóricas y aplicadas.
El Dr. Andrew Beveridge
En el blog de hoy, voy a dar un recorrido por el papel, sus implicaciones, y un poco de discusión sobre por qué los asuntos de trabajo. La cita completa de este documento es:
A. Beveridge, J. Shan, Red de Tronos, Matemáticas Revista Horizontes, 23 (2016) 18-22.
Ver también la página web de la Red de Trono que contiene conjuntos de datos, artículos sobre su estudio, y más. También hay hashtag de Twitter: #NetworkOfThrones
Los datos de GOT
Podemos ver los personajes de GOT como nodos en una red, con los bordes entre ellas si comparten lazos sociales. Este es un ejemplo de una red social, aunque sea ficticia. Las redes sociales se han estudiado durante décadas, con un renovado interés en ellos últimamente debido al predominio de on-line de las redes sociales como Facebook y Twitter.
Lo que está ajustado los datos de redes sociales conseguidos? Se compone de 107 caracteres desde el tercer libro de la serie Tormenta de Espadas (elegidos ya que los personajes y sus relaciones habían madurado para entonces). Los autores utilizaron algoritmos para extraer la versión electrónica del libro, en busca de conexiones entre los personajes. Si sus nombres aparecieron dentro de las 15 palabras de uno al otro, entonces se colocan un borde entre ellos. Esta es la técnica de minería de datos común utilizando la frecuencia de palabras: cuanto más a menudo el co-aparición de dos nombres, el más pesado el borde une.
Aquí está la red descubrieron (una figura del papel):
Este relativamente pequeño ejemplo de red social. científicos de red (como yo) estudian a menudo muy grandes redes como Facebook y Twitter, con la esperanza de explotar sus propiedades globales y locales. Estas redes tienen cientos de millones de nodos. He escrito los blogs anteriores que hablan de tales en el mundo real, las redes complejas. En 2008, escribí un libro sobre una de las redes complejas primeros estudiados: el gráfico de red.
Observe que la red anterior se divide en las comunidades, se centró en los actores clave como Robb, John, Tyrion, etc. Los autores utilizaron varios algoritmos para detectar estas comunidades y enumerarlos. Ellos usan el concepto de modularidad, que compara la red para al azar, donde se espera ninguna estructura de la comunidad. La modularidad da una partición gráfica, lo que resulta en los grupos de colores que se ven más arriba en la figura.
Por cierto, la detección de la comunidad es un importante problema abierto en la ciencia de la red. Tenemos buenos heurísticos para el problema, pero no universalmente aceptada metodología o incluso la definición de lo que comprende una comunidad. La mayoría de los enfoques que saben utilizar las técnicas de la teoría de grafos espectral. A grandes rasgos, las comunidades deben ser subgraphs donde los más bordes interior y luego salir al exterior. La figura anterior recuerda el famoso gráfico de Zachary Club de Karate, que se presentó en uno de los primeros trabajos sobre la detección de la comunidad.
El grafo del club de karate de Zachary, a partir de la tesis doctoral de Wayne Zachary en 1972. Los nodos corresponden a los miembros de un club de karate real, y los bordes representan sus relaciones sociales. Los instructores del club son los nodos en negrilla 1 y 34. Después de una disputa entre ellos, los instructores formados cada uno su propio club. Podemos ver aquí la comunidad formada alrededor de cada uno de los nodos 1 y 34.
Una vez que se detectaron las comunidades, Beveridge y Shan miden la importancia de las personas en cada comunidad GOT por varios métodos. Un enfoque obvio es buscar en grados; el grado de un nodo es el número de bordes se unió a ella. Si los nodos están conectados a muchos otros, entonces es probable importante. Pero grado no siempre es la mejor medida de centralidad.
Puede ser importante al ser conectado a una persona importante. Supongamos que Barack Obama me siguió en Twitter. Eso sería sólo un nuevo seguidor (que sería subir mi título por uno), pero probablemente me habría vuelto muy populares en Twitter como Obama es un individuo tan poderoso en la red social. Otros verían esa conexión importante, y también me siga.
Un enfoque inteligente para evitar los problemas con la centralidad de grado es el uso de PageRank, que es un algoritmo desarrollado por Sergey Brin y Larry Page de Google fama. PageRank permite a Google para clasificar las páginas web y la velocidad de búsqueda en la Web.
Larry Page y Sergey Brin, fundadores de Google.
Las matemáticas subyacentes de PageRank tiene que ver con paseos aleatorios en las redes, similar a la forma aleatoria surfistas se propagan a través de una red. Precisamente, el PageRank es un ejemplo de una cadena de Markov discreta ergódico. surfistas aleatorias siguen los enlaces, pero de vez en cuando teletransportarse a los vértices aleatorios. El PageRank de un nodo es la probabilidad de que es visitado por un surfista al azar con el teletransporte. PageRank es ahora ampliamente reconocido como una forma de detectar los nodos centrales en una red, e incluso tiene aplicaciones en la biología de sistemas.
Lo que la matemática nos dice
Beveridge y Shan al descubierto algunos resultados interesantes. Usando sólo su análisis matemático, las principales conclusiones son que Tyrion, Jon, y Sansa son actores clave en la red social. Tyrion no es ninguna sorpresa para los fans de la serie o los libros, ni Jon. Pero Sansa es un personaje nuevo e interesante. Su apodo es pequeño pájaro, que hace hincapié en su papel hasta el momento como un peón en los planes de los demás. Creo que vamos a ver a Sansa emerger como un jugador de gran alcance en las próximas temporadas. Al menos, espero que ella será, si no fuera matarla, que el espectáculo le gusta hacer a menudo con sus personajes principales!
Otra interesante conclusión deriva únicamente de las matemáticas es que Daenerys Targerion es influyente, pero sólo a nivel local. Cualquier fan de GOT sabe que, pero es fascinante ver como que surge de manera objetiva en el análisis de datos. Ella no ha interactuado mucho con los otros jugadores en la red Poniente. Esto también va a cambiar, creo. Una de mis escenas favoritas de la serie es cuando conoce a Tyrion. ¡Su famosa cita de romper la rueda me dio escalofríos!
La temporada 6 de Juego de Tronos vuelve a HBO el 24 de abril.
La ficción se encuentra con grandes volúmenes de datos
El estudio de Beveridge y Shan es un buen recordatorio de las matemáticas papel tiene que desempeñar en la cultura popular. El uso de herramientas conocidas de las redes, los autores llegan a conclusiones sorprendentes sobre un programa de televisión y la obra literaria. Llamarlo el nuevo campo de los grandes volúmenes de datos de ficción.
Lo bueno es que se puede replicar el estudio con cualquier red social ficticio de su libro favorito o una serie. Los caracteres más el mejor, así que funciona como el señor de los anillos serían buenos candidatos para este tipo de análisis. He encontrado un tal documento, publicado este mes de abril por algunos físicos brasileños, el estudio de personajes del Señor de los Anillos, El Hobbit y El Silmarillion.
La estructura de la comunidad a partir de los 618 personajes y sus 19, 462 vínculos sociales en el universo de Tolkien. M. A. Ribeiro, M.L.P. Andruchiw, S. E. Pinto, The complex social network of the Lord of the Rings, Bras. Ensino, Fis, 28 (1) (2016)
A partir de estos y otros estudios, se nos recuerda una vez más la importancia de la aritmética. Nos frecuente sitios Rotten Tomatoes y Box Office Mojo al comprobar el éxito crítico y financiero importante de películas. ciencia de las redes de datos y grandes nos pueden mostrar mucho más que los rendimientos de taquilla o promedios simples de las puntuaciones del crítico: pueden revelar patrones y los matices de la historia que no se daría cuenta de ordinario. También ofrecen alternativas de apoyo (por supuesto, no sustituir) el análisis literario tradicional.
Matemáticas a través de su uso en grandes volúmenes de datos que ya se utiliza en muchos ámbitos de toma de decisiones como las finanzas y la atención sanitaria. Tal vez la próxima aplicación de las matemáticas es el entretenimiento en forma de análisis de personajes de la literatura, la televisión y las películas.
El análisis de la red de 2 modos usando Pajek - Parte 2
Intan Dzikria - My Life, My Dreams
Antes de la Parte 1, doy alguna introducción acerca Pajek y cómo cambiar de red de 2 modos en el segmento 1-modo antes de hacer la red simplificada. Por lo tanto, en esta parte, te voy a mostrar cómo hacer la centralidad.
La centralidad es un concepto clave en el análisis de redes sociales. Se utiliza comúnmente para medir la importancia o el poder de un nodo. El concepto se basa en el supuesto de que la posición de un nodo afecta a su influencia a los otros nodos en las redes.
Para hacerlo más simple, si usted tiene un amigo que tiene más amigos que usted y su / su posición en la red es influyente, podría ser posible que si él / ella haga algo, la gente va a la gente. Es sólo el ejemplo.
Hay varias centralidades, que son:
1. Centralidad de grado
Significa que es más importante el que reúnen más amigos, él / ella tiene más influencia.
Ejemplo: Hay una noche de baile y necesito ayuda de mis amigos. Sólo los verdaderos amigos que vendrán a ayudar
2. Centralidad de proximidad
Significa que el que tiene en promedio relación más estrecha con toda otra persona es más importante.
Ejemplo: Si hay un voto para el presidente la organización escolar, que favorecen la califican vienen también de amigos indirectos.
3. Centralidad de intermediación
Significa el que es más capaz de invitar a más (a través de múltiples canales).
Ejemplo: Si hay un baile de graduación, el que invita capaz de niñas más caliente es más importante.
4. Centralidad de Bonacich y la centralidad Alfa
Significa que sus amigos están en realidad son bastante importantes a su vez
Ejemplo: Si hay una gran pelea en la escuela entre dos personas. Pero el único que puede escapar es el que tiene mayor relación con el maestro.
Aquí sólo quiero mostrar cómo medir el grado, grado ponderada, la intimidad y la centralidad de intermediación en la red utilizando Pajek.
Abrir su red simplificada como te dije antes en la Parte 1.
Pero si se piensa que es complicado, se puede simplificar de nuevo. Mi red se ha vuelto como este
A continuación, realice la Centralidad con realizar esta acción: Network - Create Vector - Centrality - Degree - All (degree centrality) Network - Create Vector - Centrality - Weighted Degree All (weighted degree centrality) Network - Create Vector - Centrality - Closeness - All (closeness centrality) Network - Create Vector - Centrality - Betweenness (betwenness centrality)
Para dibujar la red tiene que hacer clic en Draw - Network + First Vector
Se puede ver aquí en los resultados entre uno y otro centralidad son diferentes en función de qué método centralidad que queremos saber.
Centralidad de grado
Centralidad ponderada de grado
Centralidad de cercanía
Centralidad de intermediación
Pero después de ver los dibujos, ¿cómo podemos saber la centralidad o la gente mayor influencia en la red? Usted tiene que exportar los resultados usando este comando Herramientas - Exportar a archivo delimitado por tabuladores - vector de corriente - Guardar archivo
Los archivos guardados son archivos .txt que puede abrir el Bloc de notas.
Para hacerlo más fácil, puede pasar los resultados a Excel y ordenar los resultados para cada carácter central de más alto grado en el grado más bajo. Se puede ver en la imagen siguiente de que los resultados que se muestran las personas que tiene una alta influencia en la red son los que tiene el color amarillo (16 personas). Pero ¿por qué el resultado de la centralidad de intermediación es diferente?
En realidad se puede conectar este resultado en lo que significa cada centralidad. Vamos a romper para cada central.
1. Centralidad de grado y centralidad ponderada de Grado
Si hay una noche de graduación en la escuela, los verdaderos amigos vendrán a ayudar. Por lo tanto, en este caso 16 personas en el color amarillo son las personas que más probablemente ayudan a sus amigos que lo necesitan.
2. Centralidad de proximidad
Si hay un voto para el presidente la organización escolar, que favorecen la califican vienen también de amigos indirectos. Por lo tanto, en este caso, si usted es uno de los candidatos, se puede pedir a estas 16 personas a pedir a sus amigos a ver usted.
3. Centralidad de intermediación (betweenness)
Si hay un baile de graduación, el que invita capaz de niñas más caliente es más importante. Pero, en este caso el grado de todas las personas son 0. Creo que nadie puede invitar a niñas / niños calientes jajaja
Pero debido a que el caso es sobre los estudiantes y sus sueños en el futuro, puede conectar el resultado en algo en el futuro. Como por ejemplo, pueden ser socio de la unión. Por ejemplo, debido a Justin Bieber y Norma son los más probable es que tenga la misma preferencia en sus sueños para el futuro, que puede ser socio de la unión, ya que pueden influir en los demás.
En los próximos artículos, vamos a estar hablando de la importancia de la "densidad de la red" como una medida de la salud y la eficacia de la red. Creo que la densidad de la red tiene ramificaciones importantes para el negocio trabaja manera y por hacer del mundo un lugar mejor. Para entender mejor lo que es, este artículo le mostrará cómo calcular fácilmente la densidad de la red. El objetivo no es conseguir que el cálculo de la densidad de la red de Facebook Conecta - Aunque es probable que podría si quisiera. No, la idea es tomar sólo unos minutos para entender este cálculo fácil, como una manera de darle una sensación más intuitiva por lo que la densidad de la red es. Con eso, se le mejor posición para aplicar realmente este concepto importante en su trabajo.
¿Qué es densidad de red?
Primero algunas definiciones rápidas. En una red, las cosas que están conectados generalmente se llaman "nodos". Un nodo puede ser una persona, un ordenador, o incluso un poco de texto con hipervínculos. Las conexiones entre los nodos se denominan a veces "conexiones" y, a veces llamados "enlaces" -, pero no deja de ser la misma cosa. "Densidad de red" describe la parte de los conexiones potenciales en una red de conexiones que son reales. Una "conexión potencial" es una conexión que podría existir entre dos "nodos" - independientemente de si es o no realmente hace. Esta persona podría conocer a esa persona; este equipo puede conectarse a esa. Sea o no lo hacen conectar es irrelevante cuando se está hablando de una posible conexión. Por el contrario, una "conexión real" es la que realmente existe. Esta persona hace conocer a esa persona; este equipo está conectado a aquél. Un par de ejemplos podría ayudar. En una reunión de la familia, las conexiones reales entre las personas son muy numerosos - que incluso puede ser un cien por ciento de todas las relaciones posibles en la habitación. Por el contrario, las conexiones reales entre las personas en un autobús público - el número de personas que se conocen entre sí - es probable que sea bastante bajo en relación con todas las posibles relaciones allí. Una reunión de la familia tiene una alta densidad de la red, pero un autobús público tiene una baja densidad de la red.
Calculando densidad de red:
Por lo tanto, aquí es cómo se calcula la densidad de la red. En la tabla a continuación, "PC" es "posibles relaciones" y "n" es el número de nodos de la red. No deje que los números lo bloqueen; en realidad son bastante sencillos:
En la tabla anterior, los ejemplos "A" y "B" ilustran los casos en que el número de conexiones reales entre los nodos es exactamente el mismo que el número de conexiones posibles. No se puede sacar nuevas líneas para conectar estos nodos; todos están ya conectados. Son perfectamente "densa". Ahora echa un vistazo a ejemplo C. Al igual que el ejemplo B, hay tres nodos. Pero en este caso, dos de los nodos (los superior e inferior) no están conectados entre sí. Esta pequeña red está perdiendo una de sus conexiones potenciales, y como resultado, su densidad de la red se reduce a dos fuera de tres, o 66,7%. Para escalar las cosas con un poco más grande ejemplo, supongamos que una tienda de comestibles tiene una red de clientes con un centenar de personas en ella. El número total de conexiones posibles entre estos clientes es 4,950 ( "n" multiplicado por "n-1" dividido por dos). Así pues, si, de esas conexiones potenciales, sólo hay 495 conexiones reales, la densidad de la red sería 10%. Si el número de conexiones reales fueron 2.475, entonces la densidad de la red sería 50%. Hay que ir. Ahora ya sabe cómo calcular la densidad de la red. A continuación, vamos a ver por qué es importante para la salud y la eficacia de las redes, y por qué una mayor densidad de la red es probablemente bueno para los negocios y para la sociedad.
El análisis de las redes sociales de la literatura del siglo 19 al 20 Derek Greene's Home
El proyecto de investigación Nation, Genre and Gender ("Nación, Género y Género") en la UCD está creando un corpus digital grande de novelas irlandeses e ingleses a partir del período 1800-1922. Nuestro objetivo es comparar el género, el género y la nacionalidad del autor o el ajuste en la conformación de las estructuras sociales en la ficción, sobre la base de las ideas de los investigadores como Franco Moretti que han abogado el enfoque de "lectura distante" para el estudio de la literatura desde una perspectiva a nivel macro. Como parte de esto, estamos viendo cómo las técnicas de Análisis de Redes Sociales (ARS), a menudo se aplican a las redes en línea como Twitter y Facebook, se puede aplicar para proporcionar una nueva perspectiva sobre los textos literarios. Una serie de trabajos recientes interesante ha mirado en el análisis de la ficción de esta manera, a partir de la mapeo de las tragedias de Shakespeare a visualizar el universo de los cómics de Marvel. En nuestro caso, estamos interesados en la exploración de las estructuras sociales en la literatura del siglo 19 y 20. A continuación voy a describir cómo vamos desde el texto original de una novela como Oliver Twist de Charles Dickens a una visualización de la red social definitiva
Corpus de anotación
El primer paso del proceso de análisis consiste en la anotación de las novelas, en los estudiosos de la literatura del Instituto de Humanidades de UCD identifican las referencias de caracteres en el texto de cada novela, como recuperada en el Proyecto Gutenberg. El proceso de anotación en sí consiste en un número de pasos. En primer lugar, un diccionario carácter se construye, que incluye una única entrada para cada carácter único en la novela, con su nombre definitivo y una lista completa de todos sus alias. Por ejemplo, el personaje de Bill Sikes en Oliver Twist se conoce por varios alias, incluyendo "Mr. Sikes "," William Sikes ", y" el asesino ". También se van registrando personajes con atributos tales como el género, la clase, la ocupación y la religión. Esta tarea se lleva a cabo no sólo para los personajes principales, sino también para los personajes secundarios que componen la sociedad en general de la novela. Una vez que el diccionario se ha recopilado, todas las instancias de los alias de un personaje en la novela de texto se reemplazan con su nombre definitivo.
Construcción de la red
Una vez que una novela se ha anotado, creamos redes de caracteres detallados para conocer mejor la sociedad de la novela. Un nodo se crea para cada carácter en el diccionario de personaje de la novela. Luego tokenise cada capítulo en el texto anotado previamente de la novela, y el recuento de todos los co-ocurrencias de pares de nombres definitivos de caracteres. Tenga en cuenta que utilizar todas las co-ocurrencias en lugar de considerar sólo la conversación directa entre un par de caracteres, ya que esto nos permite capturar una amplia variedad de tipos de interacciones y asociaciones entre los personajes. entonces se crea una red de carácter ponderado para el capítulo, donde existe una arista entre un par de caracteres, si ellos co-produjeron al menos una vez durante el capítulo. El peso en el borde corresponde al número de co-ocurrencias entre el par. Un ejemplo de una pequeña red de caracteres para el Capítulo 6 de Oliver Twist se muestra a continuación. Un borde más grueso indica que eso es dos personajes co-produjeron con mayor frecuencia en ese capítulo.
Una vez que hayamos procesado cada capítulo, se construye una red de carácter general para toda la novela mediante la combinación de las redes de todos los capítulos. En esta red global, el peso en un borde corresponde al número total de co-ocurrencias entre el par a través de todos los capítulos.
Visualización de la red
Realmente visualizar las redes de caracteres resultante, usamos la herramienta de código abierto Gephi, aplicando una fuerza dirigida diseño. Un número de diferentes redes de ejemplo se muestran a continuación para cuatro conocidas novelas de Charles Dickens, Bram Stoker, de Arthur Conan Doyle, y James Joyce, respectivamente. En cada caso, mostramos los 20 mejores personajes más destacados, según la clasificación de su grado ponderada (es decir, la suma de los pesos de las aristas conectadas a ellos). El tamaño y el color de cada nodo también es proporcional al grado ponderado.
Análisis mas extenso
En representación de obras literarias en forma de red nos permite explorar los textos de autores como Joyce y Dickens de una manera que es independiente del lenguaje y nos dan una visualización "ojo de pájaro" que es accesible para los no expertos. También nos permite beneficiarnos de las investigaciones existentes, en áreas tales como la detección de la comunidad y el análisis de redes ego, lo que podría proporcionar nuevas herramientas en la práctica de la lectura distante. Mediante la adición de información de atributos, como el género y la clase, a los nodos y aristas, también podemos hacer comparaciones interesantes entre las novelas de diferentes autores y géneros. Nuestro objetivo es utilizar estas redes de caracteres para explorar y poner a prueba una serie de hipótesis literarias existentes, y también hacer estas novelas más accesible a los estudiantes e investigadores.