sábado, 25 de julio de 2015

Las nuevas leyes de redes explosivas

Las Nuevas Leyes de Redes explosivas
Los investigadores están descubriendo las leyes ocultas que revelan cómo crece Internet, cómo se extienden los virus, y cómo las burbujas estallan financiera.
Quanta Magazine

Paolo Ceric / PATAKK


Las redes crecen a medida que nodos individuales se conectan entre sí. Al ajustar las reglas que rigen cuando los nodos se conectan, los investigadores pueden dar forma a las propiedades de la red.
Por: Jennifer Ouellette


La semana pasada, United Airlines a tierra cerca de 5.000 vuelos cuando su sistema informático se estrelló. El culpable: un router de red defectuoso. Más tarde en la misma mañana, otro error de computadora detuvo cotización en la Bolsa de Nueva York durante más de tres horas.

Algunos vieron la mano siniestra de un hacker en estos apagones, pero son mucho más propensos a ser una coincidencia, una característica intrínseca del sistema en lugar de un error. Redes bajan todo el tiempo, como consecuencia de niveles sin precedentes de interconexión. Las interrupciones pueden ocurrir incluso en las redes más robustas, si se trata de las redes eléctricas, los mercados financieros globales, o su red social favorita. Como el ex reportero del Atlántico Alexis Madrigal observó cuando un error de la computadora cerró la bolsa de valores Nasdaq en 2013: "Cuando las cosas funcionan de nuevas maneras, se rompen en nuevas formas."

Una nueva comprensión fresca de tales sistemas - la forma en que crecen, y cómo se rompen - ha surgido de la física de café.

Los investigadores piensan generalmente de conectividad de red como sucede de una manera lenta y continua, similar al agua manera mueve a través de los granos de café recién molidos, lentamente saturar todos los gránulos para convertirse café en el recipiente por debajo. Sin embargo, en los últimos años, los investigadores han descubierto que, en casos especiales, la conectividad podría emerger con una explosión, no un gemido, a través de un fenómeno que han denominado "percolación explosivo."


Cortesía de Raissa D'Souza
Los clusters cultivan a través de percolación explosivo.

Esta nueva comprensión de cómo emerge über-conectividad, que se describió a principios de este mes en la revista Nature Physics, es el primer paso hacia la identificación de signos de alarma que pueden producirse cuando estos sistemas van mal - por ejemplo, cuando las redes de energía comienzan a fallar, o cuando una enfermedad infecciosa comienza a multiplicarse en una pandemia global. Percolación explosivo puede ayudar a crear estrategias eficaces de intervención para controlar esa conducta y, quizás, evitar consecuencias catastróficas.

Un giro explosivo

Modelos matemáticos tradicionales de percolación, que se remontan a la década de 1940, ven el proceso como una transición suave y continua. "Pensamos en la percolación como el agua que fluye a través de la tierra", dijo Robert Ziff, un físico de la Universidad de Michigan que ha estado estudiando las transiciones de fase en los últimos 30 años. "Es una formación de conectividad de largo alcance en el sistema."

La formación de conectividad puede ser entendido como una transición de fase, el proceso por el cual el agua se congela en hielo o hierve lejos en vapor.

Transiciones de fase son ubicuos en la naturaleza, y también proporcionan un modelo útil para cómo nodos individuales en una red aleatoria unir de forma progresiva, uno por uno, a través de conexiones de corto alcance en el tiempo. Cuando el número de conexiones alcanza un umbral crítico, un cambio de fase hace que el más grande grupo de nodos a crecer rápidamente, y los resultados über-conectividad. (Visto así, el proceso de percolación que da origen a su taza de la mañana de Joe es un ejemplo de una transición de fase de agua caliente pasa a través de granos tostados y los cambios en un nuevo estado -.. Café)

Raissa D'Souza, una física de la Universidad de
 California, Davis, está explorando cómo las
intervenciones a pequeña escala pueden alterar
una red grande, compleja. Kevin Tong, UC Davis

Raissa D'Souza, un físico de la Universidad de California, Davis, está explorando cómo las intervenciones a pequeña escala pueden alterar una red grande, compleja.
La Percolación Explosiva funciona un poco diferente. La idea surgió durante un taller en 2000 en el Instituto de Campos de Investigación en Ciencias Matemáticas en Toronto. Dimitris Achlioptas, un científico de la computación en la Universidad de California, Santa Cruz, propuso un posible medio para retrasar una transición de fase en una red mejor conectada, mediante la fusión de la noción tradicional de percolación con una estrategia de optimización conocido como el poder de dos opciones. En lugar de limitarse a dejar que dos nodos se conectan al azar (o no), se tiene en cuenta dos pares de nodos de azar, y decidir qué par prefiere conectarse. Su elección se basa en criterios predeterminados - por ejemplo, puede seleccionar el que sea par tiene el menor número de conexiones preexistentes a otros nodos.

Debido a un sistema aleatorio normalmente favorecería los nodos con las conexiones más pre-existentes, esta elección forzada introduce un sesgo en la red - una intervención que altere su comportamiento típico. En 2009, Achlioptas, Raissa D'Souza, un físico de la Universidad de California, Davis, y Joel Spencer, un matemático en el Instituto Courant de la Universidad de Nueva York de Ciencias Matemáticas, encontraron que ajustar el modelo de percolación tradicional de esta manera cambia radicalmente la naturaleza de la transición de fase resultante. En lugar de surgir de un proceso lento, marcha continua constante hacia una mayor y una mayor conectividad, conexiones surgen a nivel mundial de una sola vez en todo el sistema en una especie de explosión - de ahí el apodo de "percolación explosivo."

El concepto se ha disparado en su propio derecho, generando un sinnúmero de papeles en los últimos seis años. Muchos de los documentos de debatir si este nuevo modelo constituye una transición de fase verdaderamente discontinua. De hecho, en 2011 los investigadores mostraron que para el modelo en particular analizada en el estudio original de 2009, transiciones explosivos sólo ocurren si la red es finito. Mientras que las redes como Internet tienen como máximo alrededor de mil millones de nodos, transiciones de fase son los más comúnmente asociado con materiales, que son celosías intrincados de tantas moléculas (aproximadamente 1.023 o más) que los sistemas sean efectivamente infinito. Una vez extendido a un sistema verdaderamente infinito, filtraciones explosivas parecen perder parte de su auge.

Sin embargo, D'Souza y sus cohortes no han estado inactiva tampoco. Ellos han descubierto muchos otros modelos de percolación que producen transiciones verdaderamente abruptos. Estos nuevos modelos comparten una característica clave, según D'Souza. En percolación tradicional, los nodos y los pares de nodos son elegidos al azar para formar conexiones, pero la probabilidad de que la fusión de dos grupos es proporcional a su tamaño. Una vez que un gran grupo se ha formado, que domina el sistema, absorbiendo las agrupaciones más pequeñas que de otra manera podrían fusionarse y crecer.

Sin embargo, en los modelos de explosivos, que la red crece, pero el crecimiento de la agrupación grande se suprime. Esto permite que muchos grupos grandes pero desconectados a crecer, hasta que el sistema realiza el umbral crítico en el que la adición de sólo uno o dos enlaces adicionales desencadena un interruptor instantáneo para über-conectividad. Todos los grandes grupos se combinan a la vez en una sola fusión violenta.

Un nuevo paradigma para el control

D'Souza quiere aprender cómo controlar mejor las redes complejas. La conectividad es una espada de doble filo, de acuerdo con ella. "Para los sistemas normales de funcionamiento [como Internet, redes aéreas o la bolsa de valores], queremos que se pueden conectar en gran medida", dijo. "Pero cuando pensamos en las epidemias de difusión, queremos restringir el alcance de la conectividad". Incluso cuando la alta conectividad es deseable, a veces puede ser contraproducente, provocando un colapso potencialmente catastrófico del sistema. "Nos gustaría ser capaces de intervenir en el sistema fácilmente para mejorar o retrasar su conectividad", dependiendo de la situación, dijo.

Percolación explosiva es un primer paso para pensar en el control, de acuerdo con D'Souza, ya que proporciona un medio de la manipulación de la aparición de la conectividad a larga distancia a través de interacciones de pequeña escala. Una serie de intervenciones a pequeña escala puede tener consecuencias dramáticas - para bien o para mal.

Profesionales de las relaciones públicas a menudo preguntan cómo el trabajo de D'Souza podría ayudar a que sus productos van viral. Ella normalmente responde señalando que sus modelos realmente suprimen el comportamiento viral, al menos en el corto plazo. "¿Quieres ganarse todas las ganancias tan rápido como puedas, o quiere suprimir [el crecimiento] así que cuando esto ocurre, más personas aprenden acerca de inmediato?", Dijo. Lo mismo es válido para las campañas políticas, según Ziff. Siguiendo este modelo, podrían pasar gran parte de su tiempo a principios de la campaña en los esfuerzos locales de base, la creación de grupos localizados de conexiones y la supresión de la aparición de conexiones de largo alcance hasta que la campaña estaba listo para ir nacional con una gran bienvenida medios.

En otros sistemas, como los mercados financieros o de las redes de energía eléctrica, cuando se produce un colapso, es probable que sea catastrófico, y este enfoque mosaico podría utilizarse para revertir el proceso, rompiendo el sistema über-conectada en una colección de grupos inconexos , o "islas", para evitar fallos en cascada catastróficos. Lo ideal sería que uno esperaría encontrar un "punto dulce" para el nivel óptimo de intervención.

En las redes de energía, las empresas de servicios públicos pierden dinero cada vez que una línea de baja, por lo que idealmente se deben tratar de evitar cualquier tiempo de inactividad. Sin embargo, actuar para evitar cualquier interrupción en absoluto puede conducir inadvertidamente a muy grandes cortes que son mucho más costosos. Por lo tanto, el fomento de las pequeñas "fallas" en cascada puede disipar los desequilibrios de energía que de otro modo habrían causado fallas masivas más adelante, una estrategia potencialmente inteligente a pesar de que se come en los márgenes de beneficio. "Si suele disparar pequeñas cascadas, nunca te acontecimientos realmente masivas, pero [el sacrificio] todo lo que los beneficios a corto plazo", explicó D'Souza. "Si evita cascadas a toda costa, es posible hacer un montón de beneficios, pero al final una cascada va a suceder, y será tan masiva que [podía] acabar con toda su beneficio."

El siguiente paso es identificar los signos que pueden indicar cuando un sistema está a punto de crítica. Los investigadores entienden transiciones de fase como los que suceden cuando el agua se convierte en hielo, y puede identificar signos de un cambio inminente. Lo mismo no puede decirse de percolación explosivo. "Una vez que tengamos una mejor comprensión, vamos a ser capaces de ver cómo nuestras intervenciones de control están afectando el sistema", dijo D'Souza. "Vamos a tener estos datos podemos analizar en tiempo real para ver si estamos viendo la firma de las señales de alerta temprana de muchas clases diferentes de transiciones."

Transiciones de fase tienen los físicos y matemáticos fascinado por igual durante décadas, ¿por qué se ha encontrado este comportamiento explosivo sólo ahora? D'Souza cree que es debido a que el avance requiere la fusión de ideas de varios campos, especialmente idea Achlioptas 'para mezclar los algoritmos y la física estadística, creando así un nuevo y emocionante fenómeno modelado. "Realmente es un nuevo paradigma de percolación", dijo Ziff.

viernes, 24 de julio de 2015

Marketing: ARS en análisis de hiperenlaces

El uso de redes de hipervínculos a los datos de las minas de la Web

Junio ​​de 2015, página 26
Autor: Michael Lieberman - Quirks


Michael Lieberman explora el proveedor VOSON datos, un plug-in para el análisis de las redes de hipervínculo.

Nota del editor: Michael Lieberman es fundador y presidente de Multivariate Solutions, una firma de consultoría estadística de Nueva York.

Muchos grupos de investigación y empresas de nueva creación han desarrollado herramientas para el análisis de redes de medios sociales y la visualización. Hoy en día, las métricas de la red se han convertido en un lugar común y la funcionalidad de diseño de algoritmos de clustering y ha expandido dramáticamente, produciendo avances que han elevado radicalmente la calidad de lo que es posible visualizar.

El gráfico de la red más grande, cuando las páginas web enlazan entre sí, es la World Wide Web. Las decenas de miles de millones de páginas en la Web pueden cada uno ser vistos como un vértice en un grafo cuyas aristas son hipervínculos URL de conexión de una página a otra. No hay mayor fuente de información interrelacionada.

El profesor Robert Ackland de la Universidad Nacional de Australia ha pasado mucho tiempo en este tema. Él escribe: "Estos hipervínculos pueden apuntar a otras páginas en el mismo sitio web o con sitios de otras organizaciones, empresas, instituciones y naciones. El resultado es, literalmente, una red de conexiones que se menciona a menudo, pero rara vez vistos. La red de sitios web relacionados, aunque basado en 'Web 1.0' tecnologías básicas, representa importantes relaciones sociales, económicas e institucionales que pueden revelar importantes conocimientos para investigadores, responsables políticos y estrategas corporativos ".

Ha habido un gran despliegue publicitario acerca de Twitter, Facebook y Flickr, pero las páginas web siendo la mina de oro sin explotar de la información grande de datos. Toda una industria, marketing en buscadores, ha crecido en torno a la explosión de Internet. Pero quién es su sitio Web está conectado a, y que se conecta a su sitio web, es realmente la veta madre de comida para llevar de la red. Con la nueva tecnología, estos vínculos han llegado en línea usando software libre de código abierto y pueden ser analizados mediante gráficos de Excel.

Recopilación y análisis de datos de red hipervínculo le permite responder preguntas críticas como: ¿Cómo su presencia en la web de la organización se compara con su línea de marca presencia? ¿Cómo su presencia en la Web de la organización en comparación con el de sus competidores? Datos de hipervínculo también pueden ayudar a identificar nuevos competidores. Si usted está entrando en un nuevo mercado, estos datos le puede dar una sensación de que los jugadores actuales son y cómo están relacionados. Si su organización está en el área de los asuntos públicos, lo que otras organizaciones están vinculadas a ella? Si ejecuta una sin fines de lucro, que vincula a usted? En otras palabras, ¿dónde está la mejor fuente de recaudación de fondos?

El proveedor de datos VOSON

El Proveedor VOSON datos es un plug-in de importación de datos de Excel para la recogida y análisis de datos de la red hipervínculo. Proporciona una interfaz a una colección de datos y servicio de procesamiento que forma parte del Observatorio Virtual para el Estudio de las redes en línea (VOSON). Este servicio de recolección y procesamiento de datos consiste en un rastreador web que rastrea sitios semillas nominados por el usuario, la extracción de hipervínculos a otros sitios. El servicio también encuentra hipervínculos entrantes a los sitios de semillas dadas.



Uno tiene una cuenta con VOSON sino una versión gratuita está disponible para un máximo de 10 bases de datos. Por supuesto, rastreo web es nada nuevo: Los spammers han estado haciendo desde la web se tejió primero. Veo VOSON como particularmente útil, ya que es un servicio de búsqueda hipervínculo especializado que trabaja en el marco de Excel. Los resultados, que se entregan en un formato muy similar, por ejemplo, enlaces de Twitter, hace que sea fácil para los no programadores con un poco de Excel astuto para editar, forma y en última instancia, visualizar y analizar los datos.

Un examen de los efectos visuales de hipervínculo revela que los mapas vienen en diferentes grados. Un mapa de un grado - conocida también como una red ego - muestra el resultado cuando sólo un sitio de semilla ha sido rastreado. La Figura 1 es un ejemplo de un mapa hipervínculo de un grado sin etiquetas. Me gusta llamarlo "el puercoespín".

Un mapa 1,5 grados tiene en cuenta cada página a la que un sitio Web está conectado y si estas páginas están conectados a otro. Es decir, por Quirks.com, quisiéramos ver a todos los puntos, además de flechas para los puntos que están conectados entre sí.

Un mapa de los dos grados recoge todas las páginas a las que un sitio Web se conecta y cada página a la que están conectados. Aquí es donde las inmersiones profundas reales mienten. Sin embargo, los puntos de datos mapa de dos grados se expanden exponencialmente. Si un sitio Web está conectado a otros 100 sitios y cada uno de los que está conectado con otros 100 sitios, habría 10.000 puntos. La mayoría de los sitios web más importantes están conectados a mucho más de 100 sitios web o blogs.


Un mapa de la industria de la investigación de mercados

La figura 2 muestra un mapa social hipervínculo de la industria de investigación de mercados. Comenzó con Quirks.com. Sin embargo, he añadido unos 10 otros sitios de semillas, organizaciones de investigación de marketing importante (por ejemplo, el ARM, CASRO) y algunas de las más grandes firmas internacionales de investigación de mercados (Kantar, Yougov).

La base de datos resultante tenía más de 1.000 enlaces. Por razones de espacio y claridad, esta red es propensos a sufrir de un desbordamiento de etiquetas y puede ser difícil de analizar. La forma más común para contrarrestar esto es crear una subred que consiste solamente en sitios de semillas además de enlaces importantes. Esto requiere el filtrado de la base de datos en Excel y etiquetado de esos sitios que producirán la mayor claridad para la red. Esto requiere calcular visualmente y el filtrado de la base de datos en Excel o el empleo de una función VLookup. Sin embargo, el proceso de filtrado no está más allá de las habilidades de cualquier usuario moderado Excel.

Lo hemos hecho para nuestra red hipervínculo investigación de mercados. Entonces nos encontramos con la red a través de un algoritmo de agrupamiento (en concreto, el multi-escala rápida Harel-Koren). La visualización resultante se muestra en la Figura 2.

El grafo describe varios puntos que ilustran el poder de la técnica. Se resumen a continuación.

  • La mayoría de las principales organizaciones de investigación de marketing están conectados.
  • PMRG.org, no un sitio de la semilla, está conectado a Kantar Health, que se especializa en la investigación farmacéutica.
  • El sitio Web de WPP, propietaria de Kantar, se conecta a la mayoría de los sitios Web de Kantar.
  • Quirk de sienta lleno en el medio del espacio Web de investigación de mercados, teniendo también en cuenta los sitios de información como Rockstar Investigación y Marketing Profs.

Estudio de caso: restaurantes de comida casual

A continuación, he intentado una red hipervínculo para una industria para la que hago un montón de trabajo, los restaurantes de comida casual (CDR). Los sitios de semillas fueron varios de los restaurantes más populares, como el Olive Garden, el Cheesecake Factory, Buffalo Wild Wings y Applebee, entre algunos otros.



En la Figura 3 he círculo algunos de los sitios de siembra y etiquetados algunos de los enlaces más interesantes. Varios elementos de la gráfica vienen a nuestra atención.

  • Hay un vínculo entre Applebee y el equipo de hockey Detroit Red Wings. Como resultado, los Red Wings y Applebee ha tenido un esfuerzo co-branding para que los fans Red Wings disfrutarían de una comida en Applebee antes del partido de hockey.
  • The Cheesecake Factory tiene un enlace a Craigslist. Una nueva ubicación Cheesecake Factory en la lista de oportunidades de empleo en Rochester, Nueva York, en Craigslist.
  • MoneyTalksNews.com está conectado a varios de los principales CDRs.
  • Muchos sitios de la vida estudiantil universitaria conectan a CDR restaurantes.
  • HarryandDavid.com, el sitio Web de caja de regalo, está conectado a CheesecakeFactory.com.
  • On The Border está conectado a Groupon, lo que indica un esfuerzo de esa cadena para atraer a los clientes a través del sitio web de Groupon.
  • Darden.Com/Careers conecta con el jardín de oliva, que es propiedad de restaurantes Darden.

El resultado de este grafo pesadamente filtrado y marcado con es que el espacio Web de la industria de comida casual conecta a las sociedades matrices y para muchos medios de comunicación que cubren la industria. Hay blogs de Urbanspoon.com, escritos nutricionales de CNN Health, etc.

El análisis de redes de hipervínculos carece de la fluidez, de, por ejemplo, Twitter, y ahí radica su utilidad. Se puede ejecutar un rastreo Web para un espacio de la industria y estar bastante seguro de que la estructura estará intacta por un período de un mes o más. Por otra parte, los rastreos de hipervínculo se pueden filtrar para mostrar sólo los blogs, medios de comunicación y otros medios especificados.

Todavía un aspecto vital

Las redes de hipervínculos han existido desde los albores de la Web y que siguen siendo un aspecto vital del comportamiento en línea de las entidades comerciales, particulares y el gobierno. Los datos de hipervínculo se han utilizado para la investigación de marketing y para la inteligencia empresarial competitiva. Por ejemplo, los investigadores han construido redes de sitios web de las compañías de telecomunicaciones a partir de datos de co-link y mostrar que la visualización de estas redes los mapas correctamente las empresas en los sectores de la industria.

Esperamos que la disponibilidad de herramientas como VOSON para tener un impacto positivo en la investigación hipervínculo. Como se mencionó anteriormente, el análisis hipervínculo dinámico es un área fructífera de estudio, ya que es la investigación de enfoques para analizar conjuntamente los datos de hipervínculo y el texto de contenido. Muchas empresas han aprendido a aprovechar el poder de los líderes de opinión, expertos y personas influyentes para promover sus productos y con visualizaciones espaciales Web hipervínculo, los investigadores pueden visualizar fácilmente y analizar estas relaciones a menudo complejos.

jueves, 23 de julio de 2015

Tunnard nos cuenta la multiplicidad de usos del ARS

Christopher R. Tunnard

Por Jessica Daniels - The Fletcher School (Tufts University)

¿Cuál es la conexión entre la identificación de la competencia y la cooperación entre los señores de la guerra somalíes, el descubrimiento de patrones de colaboración en el mercado mundial de armas (foto de abajo), encontrar las personas adecuadas para ayudar a iniciar un negocio en Tanzania, la conformación de la cobertura mediática del conflicto en Siria, y ayudando a adolescente niñas de los países islámicos a encontrar formas de conectarse y compartir información sobre cuestiones de género? Además de ser muy "estilo Fletcher" por su amplitud geográfica e intelectual, todos estos son temas que han sido abordados por los estudiantes de mi clase en redes sociales en organizaciones, un curso que he estado enseñando a Fletcher desde 2011.


 Rusty, Si usted me hubiera dicho hace diez años que me gustaría escribir una tesis doctoral sobre el desarrollo de las redes de resistencia en Serbia durante la era Milosevic mediante análisis de redes sociales (ARS) y más tarde crear cursos en esta disciplina incipiente apropiadas para un graduado la escuela de las relaciones internacionales, me podría haber sugerido que busque ayuda profesional. Pero eso es exactamente lo que hice, y doy gracias a mis estrellas de la suerte-y mis asesores y estudiantes-para lo que es posible que yo emprendo este viaje.

Una de las muchas cosas fascinantes sobre ARS es que es verdaderamente multi-disciplinario. En la reunión anual de los profesionales del SCN, encontrará médicos, de inteligencia y analistas militares, matemáticos, físicos, sociólogos, antropólogos consultores de negocios, analistas financieros, científicos políticos, y muchos más. Todos, al parecer, está interesado en examinar cómo las personas se conectan, cómo influyen las redes que están, y cómo esas redes a dar forma a los de pensamiento, el comportamiento y las acciones de los individuos que las componen. ARS ha jugado un papel importante en el descubrimiento de la ubicación de Bin Laden, la reducción de la propagación del SIDA en África, y la identificación de los actores clave en los esquemas financieros poco fiables (empezando por el caso Enron.) Aunque ARS ha existido en el mundo académico desde hace algunas décadas, se fue un muy simple mapa de la red de los terroristas del 11/09 que dispararon a la prominencia. Este mapa, construido a partir de datos de código abierto, mostró que todos los secuestradores terroristas estaban a un paso, o directamente vinculados, a dos individuos con vínculos directos a bin Laden, a quien el gobierno había estado investigando durante un año antes del ataque.



Desde 2005, el increíble crecimiento de los medios sociales como Facebook, LinkedIn y Twitter se ha redoblado el esfuerzo por entender cómo las redes sociales forma y se puede utilizar para promover la acción política (piense Twitter y la resistencia egipcia) y aumentar la efectividad del marketing viral (creo que Facebook, Google y Amazon). Rusty, 3Images como el ilustrado aquí representan cómo los usuarios de Twitter se difunden ideas y problemas rápidamente en todo el mundo a través de menciones y retweets. En este caso, se trata de un hashtag conferencia que tiene, al mediodía de una sesión de todo el día, se extendió mucho más allá del grupo básico de asistentes a la conferencia y seguidores agrupados en el centro.



Dos acontecimientos recientes ilustran la omnipresencia de la ARS. Las revelaciones Snowden tienen, para bien o para mal, llevado a una comprensión más amplia de cómo los analistas de redes pueden identificar a las personas de interés potenciales observando los patrones de llamadas de teléfonos móviles sin utilizar ninguno de los contenidos. En otros lugares, la gente está utilizando una combinación de ARS y análisis de los sentimientos (rankea la "temperatura" relativa de las palabras usadas para describir algo) a mirar tanto la extensión y la intensidad de las ideas en aplicaciones tan diversas como la comercialización de nuevos productos en los medios sociales y la identificación posibles puntos calientes políticos antes de que desarrollen, mediante el examen de cómo se están discutiendo cuestiones y mapear su velocidad y la geografía.

Mientras ARS es sólo una herramienta de diagnóstico en el arsenal de técnicas analíticas, que se está convirtiendo en una habilidad imprescindible para los analistas y gerentes por igual. Su gran atractivo puede ser debido al hecho de que se emplea tanto las habilidades izquierdo y derecho del cerebro primero en visualizar y luego de analizar menudo redes contra-intuitivas de conexiones que no pueden ser fácilmente tratados por otros medios. Y ARS puede hacerse utilizando los datos que los gobiernos, las ONG y las empresas ya recogen.

Este es un campo emocionante para habitar, tanto académica como profesionalmente, y Fletcher me brinda la oportunidad tanto para enseñar este nuevo conjunto de habilidades y aprender de los estudiantes cuyas pasiones e intereses abarcan toda la gama de las relaciones internacionales.

miércoles, 22 de julio de 2015

Grafos dinámicos en javascript y R

Creación de gráficos de red usando javascript directamente de R
por Andrie de Vries - Revolutions

En mi post anterior sobre la estructura de la red de CRAN demostré cómo utilizar rango y comunidades página a visualizar la estructura de un grafo.

En UseR!2015 discutí mi trabajo con Gabor Csardi, el mantenedor del paquete igraph. Gabor me dio un montón de consejos útiles.

Una pepita era cómo utilizar el paquete networkD3 (disponible en CRAN) para visualizar un gráfico dinámicamente usando javascript.

Una vez que tenga un objeto igraph, es bastante trivial para utilizar networkD3 para trazar la gráfica:

  • Utilice igraph :: get.data.frame () para crear un marco de datos del objeto igraph
  • Utilice networkD3 :: simpleNetwork () para trazar la gráfica

Si utiliza RStudio como su IDE, a continuación, su trama se muestra directamente en el visor RStudio. Esto se debe a networkD3 utiliza marco htmlWidgets para mostrar javascript objetos en R, y RStudio apoya esta muy bien. Si utiliza un IDE diferente, a continuación, su trama se muestra en una ventana del navegador externo

Aquí está mi código. Puedo importar un gráfico pre-guardado directamente desde github, donde guardé mis scripts y objetos intermediado para la estructura de la red de presentación CRAN. Para simplificar, primero se crea un subconjunto de paquetes influyentes, sólo aquellos con más de 50 enlaces:


1234567891011121314151617
library("networkD3")
library("igraph")
 
# Download prepared igraph file from github
url <- "https://github.com/andrie/cran-network-structure/blob/master/pdb/depGraph-CRAN.rds?raw=true"
datafile <- tempfile(fileext = ".rds")
download.file(url, destfile = datafile, mode = "wb")
gs <- readRDS(datafile)
 
# Remove all nodes with fewer than 50 edges
deg <- degree(gs, mode = "out")
idx <- names(which(deg > 50))
gn <- induced.subgraph(gs, idx)
 
# Extract into data frame and plot
gd <- get.data.frame(gn, what = "edges")
simpleNetwork(gd, fontSize = 12)
view rawnetworkD3.R hosted with ❤ by GitHub
Y este es el resultado. Note que el dibujo es dinámico - se puede arrastrar cualquier nodo para rearticular la red:
clusterHmiscdigestggplot2httrshinyforeachglmnetFormulajsonlitelatticeapecodalme4maptoolsMatrixnlmespzooMASScarigraphmgcvnnetplyrreshapereshape2scalesRColorBrewerRcppdplyrRcppArmadilloRCurldata.tablerasterrgdalstringrsurvivalxtable

martes, 21 de julio de 2015

Redes de lenguaje en redes sociales

Cuando más grande no es mejor
Por R.L.G. | Berlin - The Economist


¿Cómo calificaría usted a las lenguas "importantes"? Si se le pregunta los ordene, muchas personas comienzan con Inglés, pero después de eso son reacios a ir más allá. Cuán importante, se preguntan. Un enfoque sería mirar a la gente y el dinero: sin duda una lengua es importante si se habla de un montón de gente, en los países con gran riqueza (y es de suponer, por lo tanto, poder).

Pero en diciembre llegó un nuevo enfoque. Un grupo de estudiosos * acercó a la tarea por primera mirando cómo las lenguas se conectan entre sí, en lugar de verlas de forma aislada. Entonces decidieron ver si esto era un buen predictor de la cantidad de gente famosa hablaban una lengua dada. Si una lengua está bien conectado con los demás (un lenguaje de "hub" con muchos bilingües), sus hablantes tienden a ser famosa. Y los nombres de los idiomas conectados resultan ser bastante interesante.

Para encontrar vínculos entre las lenguas, los investigadores crearon una "red global de lenguaje" (GLN) de tres maneras diferentes (véase el gráfico). Uno era editores de Wikipedia: un wikipedista bilingüe que edita artículos en árabe y en Inglés que cuenta como el fortalecimiento de los lazos entre el árabe y el Inglés. El segundo era Twitter: usuarios que habían twitteado al menos seis frases completas en un segundo idioma se trataron como fortalecer el vínculo entre esos dos idiomas. El tercero era un, más formal métrica antigua: traducción libro. La UNESCO, la organización cultural de las Naciones Unidas, mantiene una base de datos de libros traducidos, y cada uno de los 2,2 millones de traducciones se contó como un bono fortalecimiento de los dos idiomas. (Estos bonos, por supuesto, son asimétricos: algunas lenguas tienen más libros traducidos de ellos que a ellos y viceversa.)




Las redes resultantes son notables en muchos aspectos. Inglés es fundamental para todos ellos. Pero con muchos otros idiomas, su conectividad tiene poco que ver con el poder moderno de su país de origen. Tome la red implica libro-traducción. Los datos provienen de 1979-2011, por lo que Rusia es un nodo importante en la red. No sólo se tradujeron libros entre ruso y otros idiomas de la antigua Unión Soviética (Armenia, kirguís y el letón, dicen), pero el ruso se conecta de manera significativa a las lenguas del sur y el sudeste de Asia y el Medio Oriente. El contraste con Wikipedia y Twitter, que sesgar mucho más moderno, es sorprendente: ruso repente se convierte en un nodo periférico.

China, también, es periférica en las redes de los autores. En la red de libro-traducción, el idioma más hablado del mundo está aislado, conectado principalmente a otras lenguas chinas más unos pocos en el sudeste de Asia, en particular vietnamitas. Esto puede tener sentido dado el marco temporal de la base de datos de libros de traducción, sesgado a décadas antes espectacular ascenso de China. Pero China también es un jugador poco en Twitter, como resultado de la popularidad de Sina Weibo, un servicio similar a Twitter competir, en China. Lo mismo puede decirse de la Wikipedia: aquí china está mejor conectado un poco, pero todavía es mucho menor que su tamaño o el PIB podría predecir, posiblemente gracias a la existencia de una Wikipedia-como Baidu Baike enciclopedia colaborativa.

La conclusión es clara: las grandes lenguas no son necesariamente global, y viceversa. El árabe y el hindi-dos otros idiomas con cientos de millones de hablantes son los periféricos como el chino y el ruso. Los grandes nodos en las redes, además de Inglés son predecibles: francés, español y alemán, sobre todo. Los dos primeros fueron arrojados con éxito a lo largo y ancho por el colonialismo. Alemán tiene siglos de prestigio en la ciencia, la filosofía y la literatura, a pesar de los fracasos de los esfuerzos coloniales de Alemania.

Sin embargo, estos resultados deben ser manejados con cuidado, señalan los autores. El documento no dice nada acerca de las cualidades inherentes de cualquier lengua, o la astucia de sus hablantes. César Hidalgo, uno de los autores, señala que el artículo es realmente acerca de las élites. Los bilingües con tiempo para editar la Wikipedia no son personas normales, ni son los traductores de libros (o incluso los usuarios bilingües de Twitter). Pero lo hacen jugar un papel desmesurado en la transmisión de la cultura a través de fronteras. El principal hallazgo del estudio es que las personas son más propensos a convertirse en mundialmente famosa (medida, en parte, en las personas con las entradas de Wikipedia en al menos 25 idiomas) si hablan uno de los idiomas más en red. Persona más brillante del mundo puede ser un representante de la etnia hmong o náhuatl, pero el camino a la fama conduce a través de otros idiomas.

Hay una naturaleza "¿qué más se puede esperar?" Para el papel descomunal de las lenguas occidentales en tres productos occidentales nacido: la industria del libro-publicación masiva, Wikipedia y Twitter. Pero los resultados siguen siendo significativa: Twitter es de importancia mundial realmente (sólo pide a los mulás iraníes o el ex presidente de Túnez). Sina Weibo y VK (de Rusia Facebook) no lo son. Su naturaleza hecha en casa puede ser un motivo de orgullo, sin duda mantiene censores feliz, pero también significa reducir la influencia cultural de un país.

Para el estudiante de idiomas, la naturaleza en red de las lenguas plantea un dilema interesante: en caso de que aprender un lenguaje popular entre las élites globales? La tradición de aprendizaje del francés todavía se ve como una buena apuesta aquí. ¿O hay que aprender un idioma cuyo número de bilingües trotamundos es pequeño en relación a su importancia? La oferta y la demanda dice que esto será valioso. Este es el caso real para aprender chino: no porque es el idioma mundial en aumento, pero debido a que no-es-al menos por cierto todavía no. Dada enorme papel de China en la economía mundial, el número de extranjeros con fluidez en chino es todavía demasiado pocos.

"Links que hablan: La red de idioma global y su asociación con la fama mundial," por Shahar Ronen, Bruno Gonçalves, Kevin Z. Hu, Allesandro Vespignani, Steven Pinker y César Hidalgo, Actas de la Academia Nacional de Ciencias, diciembre 2014

lunes, 20 de julio de 2015

Historia: Encontrando la red social de Paul Revere

Mapeo de redes sociales: Las fuentes de Paul Revere

wright bryan @wrightbryan3
lori todd @loritodd

Social Media Desk



En los últimos meses, me he convertido en cada vez más interesados ​​en el aprendizaje de cómo analizar las redes sociales para encontrar nuevas fuentes y las conexiones que existen entre ellos. Por desgracia, yo no sabía mucho sobre el análisis de redes sociales. Así que decidí empezar a enseñar a mí mismo algunos conceptos básicos.

¿Por qué molestarse con esto? En pocas palabras: es posible que no se dan cuenta que tiene una mina de oro de nuevas fuentes que ocultan a la vista de las fuentes que ya conocen.

Por ejemplo, lea Uso de metadatos de Kieran Healy encontrar Paul Revere. Por referencias cruzadas de datos de los bostonianos coloniales y sus membresías a clubes sociales del siglo 18, mostró cómo los británicos podría haber encontrado Paul Revere sin saber que existía. Él no era bien conocido por ellos, pero él parecía saber todos los demás involucrados en el inicio de la revolución, justo en el medio de toda la red.

Pensé en empezar a experimentar con mi cuenta de Facebook, que actualmente cuenta con poco menos de 1.800 amigos. Yo estaba seguro de que muchos de estas personas se conocían entre sí, pero me caen en grupos distintos? ¿Alguno de ellos sirven como "constructores de puentes" entre ellos, de una manera que Paul Revere hizo?

Para ello, he utilizado dos herramientas: Netvizz y Gephi. Netvizz es una aplicación de Facebook que mira a todos tus amigos de FB y comprobaciones para ver si alguno de ellos son amigos entre sí. A continuación, guarda los resultados en un archivo que se puede importar en la herramienta de análisis de redes de código abierto conocido como Gephi. Puede descargarlo y algunos tutoriales básicos en Gephi.org.

Después de un poco de retoques, me ocurrió con este mapa, lo que representa 1.785 FB amigos y más de 37.000 conexiones entre sí. Resulta que forman sus propios grupos de redes distintas.



He aquí un desglose de los principales clusters y el "Paul venera" entre ellos.

En la parte superior del mapa es un grupo de mis amigos de la secundaria. Dado que están generalmente desconectadas de mi vida profesional, aparecen como su propia comunidad distinta.



Algunos de esos "hilos" en el plano de la escuela secundaria lidera a otra agrupación que representa a mi familia:



Dado que la mayoría de mis familiares también no están conectados con mis redes profesionales, o bien, aparecen como un clúster aislado. La gran excepción a esto es mi hermano Eric, quien es editor de los medios de comunicación social a la Associated Press. Por la naturaleza de su trabajo, se pasa a conectar con mis amigos de Facebook que son periodistas y profesionales de Internet.

Liderando la baja de mi hermano es un gran número de bloggers, muchos de los cuales están activos en Global Voices Online, una red internacional de blogs fundada por Ethan Zuckerman y Rebecca MacKinnon. Ellos fundaron el grupo en el Centro Berkman de Harvard, y un número de esas personas acaban de conectar con la gente que conozco que trabajan en una serie de cuestiones de política de Internet.



A medida que nos desplazamos hacia la derecha en el mapa, algunas de esas personas que participan en la política de Internet se convierten empataron específicamente a Washington DC:



Gente como Shireen Mitchell, Shana Glickfield y Jill Foster, fueron involucrados en DC Medios Creadores, un grupo de entusiastas de Internet me ayudó a lanzar en 2006; todos están bien conectados en red en su propio derecho. Ellos, a su vez, tienen conexiones con otras luminarias altamente conectados en red de la comunidad de tecnología DC, entre ellos Peter Corbett, Geoff Livingston y Shashi Bellamkonda.

DC Medios Creadores era un spin-off de un grupo similar en Boston fundada por vídeo pionera blogs Steve Garfield, que ayuda a conectar a mi red a un grupo más amplio de los bloggers de vídeo:



Junto con Steve, está Chuck Olson, Amanda Congdon, Kenyatta Cheese y Andrew Baron, todos los involucrados en el video blog temprana Rocketboom. Junto a ellos son gente como Dina Kaplan, Mike Hudack y Charles Hope, quien lanzó blip.tv.

Abajo ya la izquierda de los video bloggers son varias personas que han sido líderes de Internet durante muchos años, incluyendo Susan Mernit, Craig Newmark, David Weinberger y Howard Rheingold y JD Lasica. Todos están muy bien conectados en red a tantas otras personas:



A modo de Kevin Dando de PBS y pionero EdTech Bonnie Bracey Sutton es un grupo de educadores que solía trabajar con cerca en la primera parte de mi carrera. Yo no tengo la oportunidad de interactuar con ellos muy a menudo más, lo que explica algunas de la separación de su grupo del resto de mi red global.



La partida a la izquierda a través de Kevin Dando de nuevo es un gran grupo que representa ampliamente los medios públicos:



Este grupo, el más grande en mi Facebook mapa de la red, incluye una mezcla de gente de NPR, PBS y emisoras locales. Lo más interesante de este mapa es que muestra lo bien que algunos de mis amigos de Facebook están muy conectados en red en la comunidad de los medios públicos, incluyendo Doug Mitchell y Michel Martin.

Continuando hacia la derecha por el mapa, se llega a un grupo de personas que representan escritorio exterior de NPR:



Entre ellos se encuentran algunos de nuestros periodistas más conocidos que han informaron desde el Medio Oriente, incluyendo Deb Amos, Kelly McEvers y Lulu Garcia-Navarro. Sus propias redes de Facebook se extienden más arriba en el mapa hasta llegar a nuestro último grupo, que representa a mis contactos en el mundo árabe:



Algunas de estas personas, entre ellas Sultan al Qassemi, Ahmed al Omran y Jenan Moussa, son periodistas. Tienen muchas conexiones entre los activistas en el mundo árabe, como Nasser Weddady y Wael Abbas. Y muchos de ellos están bien conectados con Jillian York, que anteriormente fue editora de Global Voices, volver a conectar tanto este grupo con el grupo Global Voices.

Estos son sólo algunos de los aspectos más destacados que pude encontrar en menos de una hora jugando con Gephi. Algunas de las personas más conectadas en red en el mapa no me sorprendió, pero otros lo hicieron. Yo simplemente no me di cuenta de lo bien conectados están a tanta gente que ya conozco. Profundizando en los datos, sin duda voy a encontrar aún más conexiones que aun no se dieron cuenta que existían, o las personas que están mejor conectadas de lo que pensaba.

Mi siguiente experimento es explorar las conexiones de red en Twitter. Trabajo con mi colega NPR Noticias Apps Jeremy Bowers, hemos creado un script para exportar datos de Twitter en Gephi. Comenzando con cualquier nombre de usuario de Twitter, se crea un registro de todas las personas a las que siguen, a continuación, hace lo mismo para todos los usuarios de esas personas siguen. El resultado es un archivo repleto de radios y centros: las personas y sus conexiones entre sí. ¿Podemos analizar estos radios y bujes de encontrar nuevas fuentes de potencial - Paul venera - que se esconden otra cosa a la vista? Espero que informe sobre ese experimento en un futuro próximo. -Andy