viernes, 3 de abril de 2015

Una red social para la depresión

Una red social diseñada para combatir la depresión

Kyle Vanhemert - Wired



Las redes sociales aspiran a conectar a las personas, lo cual es un objetivo noble pero ingenuo. Cuando aceptamos acríticamente la conexión como una cosa buena, pasamos por alto difíciles e importantes preguntas: ¿algunas formas de comunicación virtual son más nutritivas que otras? ¿Podría alguna, de hecho, puede ser perjudicial? ¿Es posible que Facebook, por ejemplo, deja algunas personas se sientan más solos? Nadie sabe a ciencia cierta. Tenemos la tendencia a construir cosas primero y preocuparse por los efectos que tienen sobre nosotros más tarde.

Robert Morris está tomando el camino contrario. Comenzando con el efecto deseado de ayudar a las personas a lidiar con la depresión, desarrolló Panoply, un sitio web de crowdsourcing para mejorar la salud mental. El sitio, que fue el tema central de su tesis doctoral en el MIT Media Lab, los usuarios a replantear y volver a evaluar los pensamientos negativos, la incorporación de una técnica establecida llamada terapia cognitivo-conductual en una interfaz atractiva unthreatening entrenado. Después de un estudio confirmó la eficacia del sitio, Morris formó una compañía y ahora está trabajando en convertir la idea en una aplicación de consumidor pulido.

Otras redes sociales como, Panoply ocupará ese noble objetivo de la conexión, pero de una manera más específica, estructurada. Como software va, es algo de una novedad de producto que tiene como objetivo enriquecer la vida a través de los medios precisos y clínicamente probados, en lugar de limitarse a asumir el enriquecimiento como un subproducto de su existencia.

Un desbordamiento para la mente

Morris, de 34 años, estudió psicología en Princeton bajo premio Nobel Daniel Kahneman. Un breve período de trabajo clínico después de la graduación le dejó impaciente. "Los esfuerzos para ajustar la salud mental eran un poco más gradual de lo que me hubiera gustado, sobre todo cuando se trata de utilizar la tecnología para abordar el problema", dice.

Aunque la depresión se cree que afecta en algún lugar entre el 6 y el 10 por ciento de la población de Estados Unidos, las personas a evitar la búsqueda de tratamiento por muchas razones. Puede ser costoso e inconveniente. Es también en muchas formas tabú. Como sociedad, no es más fácil que la gente hable acerca de la salud mental. Como Morris ve, la tecnología tiene el potencial de superar todos esos obstáculos.

Esa creencia le llevó al grupo afectivo Computación en el MIT Media Lab, donde Panoply nació, irónicamente, durante una ola de baja autoestima. Al llegar a Cambridge, Morris rápidamente llegó a sentirse como un impostor, era un psicólogo en un mar de programadores altamente capaces. "La expectativa era que se podía codificar a un nivel de clase mundial", dice. "Me sentí muy, muy inseguro."

Luchando para avanzar en sus chuletas de codificación, Morris comenzó a pasar tiempo en Stack Overflow, una comunidad de programadores altamente activa. Se convirtió en un recurso muy valioso. Morris pediría pregunta elemental acerca de la depuración de código, y en pocos minutos, alguien podría responder. "Fue tan increíble tener este grupo de personas", dice. "Es simplemente una maravilla de la inteligencia crowdsourced."



La experiencia generó una "secuencia de intuiciones" sobre su propio trabajo. Morris estaba familiarizado con el paisaje de software de la salud mental, incluyendo apps "teleterapia" que permiten a los usuarios conectarse remotamente con terapeutas y herramientas de auto-guiados que incluyen ejercicios usuarios practican ellos mismos. Pero las aplicaciones de teleterapia son caros y llevan a menudo un tufillo de estigma, y ​​los recursos autoguiados sólo son eficaces si los usuarios pueden mantener su compromiso y "comer su brócoli", como Morris pone.

El romance de Morris con Stack Overflow sugirió otro enfoque. Sabía que había muchas técnicas sencillas para ayudar a las personas manejar la depresión, y su comunidad de codificación le enseñó lo útil que es tener el apoyo de un grupo en el aprendizaje de una nueva habilidad. Él recuerda haber pensado: "Así como hay toda esta gente ayudando a identificar errores en mi código, tal vez podría crear un sistema similar de acoplamiento y social para ayudar a identificar errores en mi pensamiento."

Doblar un músculo Cognitiva

Si alguna vez ha tranquilizado un amigo recientemente objeto de dumping de que hay un montón de peces en el mar, que haya practicado una forma simple de la terapia cognitivo-conductual. CBT es el término general para una serie de técnicas que ayudan a las personas a identificar pensamientos negativos y verlos más objetivamente, un proceso que se refiere a menudo como "reevaluación". Como Morris dice, "Es realmente acerca de tratar de reajustar su pensamiento para traer una mejor salud ".

Panoply fue inteligentemente diseñado para ayudar a las personas interiorizan esta habilidad. El sitio, que Morris construyó con un psicólogo clínico de la Universidad Northwestern, invitó a los usuarios anonimizados para describir una situación que trastornaba ellos. Por ejemplo: "Mi compañero de piso acaba de llegar a casa, y me dijo 'Hola', pero él caminó al lado sin mirarme." La aplicación entonces pedir que el usuario para escribir interpretaciones de este evento. Se podría decir: "Yo no creo que mi compañero de piso nunca me ha gustado. No soy popular. Yo no soy lo suficientemente fría ".


Una pantalla de identificación de "bugs" en un post. PANOPLY

Mensajes como estos desencadenaron una ola de tres niveles de acción crowdsourced. La primera persona o dos, simplemente vino a prestar apoyo y simpatía (por su estudio de tesis, Morris capacitó a un grupo de trabajadores de Mechanical Turk para rellenar la base de usuarios). Una segunda oleada leer la entrada y etiquetado lugares específicos donde el cartel estaba distorsionando la realidad o pensamiento ilógico. Entonces, un tercer grupo llegó y reescribió por completo la historia inicial, echando los eventos en una luz menos grave. El sistema produce reevaluación multitud generados única para cada pensamiento oscuro. Un profesor de psicología de Stanford dijo MIT cree que es un "enfoque prometedor."

Fundamentalmente, sin embargo, Panoply fue diseñado para funcionar en ambos sentidos. Además de la publicación, se anima a los usuarios para ayudar a dar apoyo, errores de etiquetas, y, finalmente, volver a escribir entradas de sí mismos. De esta manera, la plataforma no sólo dispensar reevaluación; se convirtió en un lugar para practicarlo.

Morris piensa que esto es vital. "Usted realmente aprender estas técnicas mejor no mediante la absorción de la retroalimentación de la multitud, pero enseñándoles a otras personas", dice. "Ayudar a otra persona evalúe nuevamente una situación negativa es una tarea tamaño de bocado que sólo toma un par de minutos, pero estás realmente flexionando ese músculo cognitiva y otra vez." A medida que Morris lo ve, si usted puede conseguir a la gente a practicar la habilidad suficiente , con el tiempo se convertirá en una segunda naturaleza.

Construyendo a Koko

Estudio inicial de Morris en Panoply se publica esta semana en la revista Journal of Medical Internet Research. En comparación con un grupo control que hizo un ejercicio de escritura expresiva genérico, los usuarios que inicialmente mostraban signos de depresión mostraron mejoras significativas para la depresión y habilidades de reevaluación después de usar la plataforma durante tres semanas.

Recientemente, Morris formó una empresa llamada Koko para convertir Panoply en una aplicación del consumidor. Él está tomando su tiempo con él. Por un lado, él ha estado pensando cuidadosamente acerca de cómo empaquetar la aplicación, él no quiere que pueda desempeñar el lenguaje estigmatizado de la depresión. Él es también el perfeccionamiento de la respuesta de tres pasos, trabajando para asegurar el sistema de retroalimentación será efectiva a escala. El desafío es preservar el efecto deseado mientras que los préstamos del lenguaje interactivo de stickiest aplicaciones de consumo de hoy en día. "Realmente queremos asegurarnos de que estamos recibiendo las cosas bien", dice.

Queda por ver si la gente va a gastar su precioso tiempo en una plataforma que podría ser visto como un repositorio de anécdotas deprimentes. Pero aplicaciones anónimos como Yik Yak and Whisper llaman nuestra atención, y lo que es diferente aquí es que la gente se les da la oportunidad de ayudar activamente a esos desconocidos. Morris señala que muchos de los jornaleros de Mechanical Turk pidió para registrarse en el sitio después de que se completó el estudio. Él piensa que el sitio podría tener un atractivo principal, que apunta a la popularidad de los libros de autoayuda y todo lo relacionado con la vida sana. "Sabemos mucho sobre cómo ajustar la dieta y la forma en que comemos, pero no tenemos un buen marco colectivamente para nuestra salud emocional", dice. Y él podría estar en lo cierto. Hay decenas de plataformas de medios sociales por ahí, pero la verdadera felicidad es una característica tremendamente convincente.

jueves, 2 de abril de 2015

Distribución de redes sexuales: La implícita centralidad de grado masculina

Cuántas parejas sexuales una persona promedio tiene
 Sexo y Psicología
Justin Lehmiller,



Todos los viernes en el blog, me contesta preguntas de la gente sobre el sexo, el amor y las relaciones. La pregunta de esta semana viene de un lector que quería saber:

"¿Cuántas parejas sexuales los hombres y las mujeres por lo general dicen que han tenido?"

¡Muy buena pregunta! Echemos un vistazo a un par de encuestas representativas a nivel nacional de los Estados Unidos para la respuesta. En concreto, vamos a comparar la Encuesta Nacional de Salud y Vida Social (NHSLS), que tomaron muestras de más de 3.000 personas mayores de 18 y 59 durante la década de 1990, y la Encuesta Nacional de Crecimiento Familiar (NSFG), que encuestó a más de 13.000 personas de 15 a 44 entre 2006 y 2008. Diferentes encuestas preguntan por parejas sexuales en diferentes formas y el uso de diferentes muestras, por lo que es útil tener en cuenta un par de conjuntos de resultados.

Comencemos con la NHSLS. Estos resultados revelan que la mayoría de los adultos en Estados Unidos tienen una vida sexual activa. De hecho, el 97% de los hombres y las mujeres encuestadas declararon haber tenido al menos una pareja sexual durante su vida. La gran mayoría de los participantes masculinos (67%) informó tener 10 o menos socios en total, y la gran mayoría de las mujeres participantes (70%) informó que tiene 4 o menos parejas. Para una visión más detallada de los resultados, echa un vistazo a la tabla de abajo.

NHSLS: Número de Parejas Sexuales a los Largo de la Vida


Fuente: Encuesta Nacional de Salud y Vida Social
FUENTE DE DATOS: NACIONAL DE SALUD Y VIDA SOCIAL ENCUESTA

A continuación, vamos a echar un vistazo a la más reciente NSFG. Aquí, vemos un patrón muy similar de resultados. Sin embargo, es importante tener en cuenta que las edades de los participantes se diferenciara a través de estos dos estudios (de 15 a 44 en el NSFG frente a 18 a 59 en el NHSLS), y los investigadores utilizaron ligeramente diferentes opciones de respuesta cuando le preguntamos sobre el número de parejas. Aunque estos dos conjuntos de resultados no son del todo comparables, pintan un cuadro bastante similar. Una vez más, la gran mayoría de los participantes eran sexualmente activos (más del 90% de los hombres y mujeres), y la mayoría de los hombres (57,3%) y mujeres (74,55) informaron menos de 6 por vida socios totales. Consulte la tabla siguiente para obtener resultados más detallados.

NSFG: Número de Parejas Sexuales en la Vida


Fuente: Encuesta Nacional de Crecimiento Familiar
DATOS Fuente: Encuesta Nacional de Crecimiento Familiar

Una cosa que se destaca en ambos conjuntos de resultados es una diferencia sexual consistente: las mujeres son más propensas a reportar haber tenido una sola pareja, mientras que los hombres tienen más probabilidades de haber tenido 10 o más parejas. ¿Por qué es este el caso? Una posibilidad es que tal vez los hombres y mujeres definen "sexo" o "pareja sexual" de maneras muy diferentes y por lo tanto están contando cosas muy diferentes. Una posibilidad alternativa es que los hombres sienten la presión social a la sobre-informe y las mujeres se sienten presionados para no informar, en otras palabras, la presión social puede llevar a la gente a ser menos veraz. Como cierto apoyo a esta idea, la investigación ha encontrado que cuando se pregunta a los hombres y mujeres acerca de sus historias sexuales mientras estaban conectados a un supuesto dispositivo detector de mentiras, la diferencia entre los sexos es mucho menor.

En resumen, aunque las estadísticas anteriormente pueden representar la mejor información disponible que tenemos en el número de parejas sexuales, la realidad es que la diferencia entre los sexos puede no ser tan grande como parece a primera vista.


miércoles, 1 de abril de 2015

La polarización bolivariana en Twitter

El uso de Twitter para investigar la polarización política
Analizando 16 millones de tweets de más de 3 millones de usuarios tras la muerte de Hugo Chávez en Venezuela, los investigadores españoles cuantificar el alcance de la polarización en Caracas

American Institute of Physics
Eurekalert


Este mapa muestra los resultados políticos de las 2013 elecciones locales de Venezuela (Libertador, en rojo, por el oficialismo; Chacao, Sucre, Baruta y El Hatillo en azul para la oposición). El blanco representa las zonas despobladas, áreas urbanizadas amarillo y rosa de los barrios más pobres. Las curvas de nivel se muestran representan las funciones de densidad de la probabilidad de que un tweet asociado con el oficialismo o de la oposición había sido publicado por un usuario geolocalizada en una determinada posición.


CRÉDITO: AJ MORALES / UNIVERSIDAD POLITÉCNICA DE MADRID

WASHINGTON, DC- Nos gustaría creer que nuestras opiniones son matizadas, equilibradas, nobles, sabias y, sobre todo, únicas, pero por desgracia no lo son - o eso dice Twitter. Muy a menudo, los que nos involucramos con el sitio de medios sociales populares son como de mente, y la vorágine electrónica subsiguiente de misivas de 140 caracteres más a menudo sirve para reforzar, nosotros y ellos tirando más a lo largo en la dirección que ya estábamos en tendencia hacia - de modo que al final del día, todos tweet a los conversos.

Todo lo que el sonido y la furia pueden significar algo, sin embargo: los investigadores de la Universidad Politécnica de Madrid, en España han desarrollado recientemente un modelo para detectar el grado en que una conversación en Twitter - y por lo tanto el argumento sin conexión real y el clima político - está polarizado.

Según los investigadores, un grupo está "perfectamente polarizada" sobre un tema determinado cuando se ha dividido en dos grupos de igual tamaño que sostiene opiniones contrarias. La muerte en 2013 del presidente de Venezuela, Hugo Chávez, conocido por sus seguidores como El Comandante, a condición de un estudio ideal caso, con los opositores del político fallecido repentinamente envalentonados para hablar y simpatizantes agitaron para elogiar y venerar.

"Una sociedad políticamente polarizada implica varios riesgos, como la aparición de radicalismo o guerras civiles. Estábamos interesados ​​para averiguar cómo se puede detectar la polarización política, y por lo tanto ser fijado", dijo Rosa María Benito, profesor de la Universidad Politécnica de Madrid .

Esta semana en la revista Caos, desde AIP Publishing, Benito y sus colegas describen la construcción y las implicaciones de su modelo, que ahora se puede aplicar a cualquier red para detectar su grado de polarización.

Benito y sus colegas desarrollaron por primera vez un modelo computacional para estimar el efecto que una minoría de individuos influyentes, o "usuarios de élite," tuvo en la opinión de cualquier usuario dado en base a la opinión promedio de sus vecinos. Como era de esperar, la mayoría de estos usuarios de élite eran los políticos, los periodistas y las cuentas de los medios de comunicación con posiciones políticas muy conocidas. El modelo produjo una distribución opinión, que da la probabilidad de que un individuo al azar tiene una opinión dado. Luego, los investigadores propusieron un índice para cuantificar el grado de la polarización de la distribución resultante.


Esquema de la influencia proceso de expansión en el modelo de estimación opinión. (A) muestra los nodos en la red de semillas, de color de acuerdo con su respectiva ideología. (B) muestra la red en t = 0, antes de que las semillas empiezan a propagar su influencia. (C) muestra el estado de la red en t = 1. (d) muestra el estado de la red en t = n / 2. (E) Muestra el estado final de la red en t = n. (F) y (g) Las visualizaciones de dos ejemplos del resultado del modelo de formación de opinión al conjunto de datos venezolano por días no polarizada (f) y polarizadas (g).

"El índice se inspira en el momento dipolar eléctrico de una molécula", dijo Benito. "Estamos cuantificar la distancia entre las dos opiniones mediante la determinación del centro de gravedad de las opiniones positivas y negativas."

Benito y sus colegas descargaron más de 16.383.490 mensajes escritos por 3.173.090 usuarios de Twitter desde un mes antes y un mes después de la muerte de Chávez el 5 de marzo de 2013, un total de 56 días. Utilizaron estos mensajes para crear redes de retweet, en el que retweets podrían considerarse un indicador de la influencia y la adopción de las ideas, y aplicaron su modelo de índice y la polarización de las redes.

Una vez montado, esta confluencia de datos les dio un desglose del día a día de la medida de la polarización política en Venezuela en el transcurso de 56 días. Los investigadores encontraron que durante los días más críticos de la conversación - entre la muerte y el funeral de estado de Chávez - polarización cayó a sus niveles más bajos, debido al hecho de que los usuarios extranjeros se unieron a la conversación. Esto causó temporalmente la estructura polarizada de la red a desaparece hasta la campaña política electoral comenzó seis días después.

Benito y sus colegas luego trazan los tweets geolocalizados en un mapa de Caracas, la capital venezolana, y compararon la polaridad expresó - oficialismo o de la oposición - con los registros de votación y las afiliaciones políticas de cada municipio, encontrando una fuerte correlación entre la dos. Este mismo enfoque podría aplicarse para hacer "mapas de polarización" políticos de otras ciudades también.

El trabajo futuro para Benito y sus colegas incluirá la generalización de la metodología de la polarización para su aplicación a las situaciones con más de dos polos, y la medición de la aparición de la polarización en un ámbito más amplio de situaciones políticas. En última instancia, Benito y sus colegas explorarán estrategias que podrían ayudar a reducir la polarización en las sociedades.


El artículo, "Measuring Political Polarization: Twitter shows the two sides of Venezuela," es escrito por A. J. Morales, J. Borondo, J. C. Losada, y Rosa M. Benito. Aparecerá en el journal CHAOS el 31 de Marzo de 2015 (DOI: 10.1063/1.4913758). Luego de esa fecha puede ser accesado en : http://scitation.aip.org/content/aip/journal/chaos/25/3/10.1063/1.4913758

viernes, 27 de marzo de 2015

Tutorial de SEO: Visualización de palabra clave para la optimización de motor de búsqueda

Grafos para SEOs: mejorar la visibilidad de ranking de páginas web

Nodus Labs

   

Red Texto visualización de los resultados de búsqueda de Google puede ser muy útil para chequeos de optimización de motores de búsqueda (SEO). Los fragmentos de texto que los motores de búsqueda muestran en sus resultados de búsqueda son considerados como los más relevantes para la consulta de búsqueda. Por lo tanto, sería muy útil saber qué otras palabras contienen esos fragmentos, para que podamos crear contenido que es más relevante, tanto para Google y para el público.

Vamos a demostrar nuestro enfoque utilizando el ejemplo de este artículo en el análisis de redes de texto y visualización de datos para la optimización de motores de búsqueda.



Paso 1: Identificar las pertinentes consultas de búsqueda - SEO Contexto

Queremos que este artículo sea leído por aquellos que están interesados ​​tanto en SEO, análisis de redes de texto y visualización de datos. Así que el primer paso es entender mejor lo que la gente está realmente buscando cuando están buscando esos términos - el contexto. Una búsqueda rápida en función auto sugerencia Google Palabras clave Herramienta y de Google revela las siguientes frases de búsqueda más importantes se utilizan en este contexto:



en todos los casos los usuarios están buscando
"Herramientas", "técnicas", "software" y "Tutorial"

Por lo tanto, vemos que hay un gran interés para el software y tutoriales relacionados con la optimización del Search Engine, así como la visualización de datos.

Lo que significa que este artículo será escrito específicamente para incluir las palabras clave tanto en su título principal (etiquetas) y destacó en todo el texto.



Paso 2: El texto de análisis de red de los resultados de Google - Visualización de Datos SEO

Ahora que sabemos lo que los usuarios están realmente buscando, tenemos que ver cuáles son los resultados de búsqueda que realmente ven. Esto es importante por dos razones diferentes:

1) Los fragmentos de los resultados de búsqueda contienen el texto que los motores de búsqueda consideran que son relevantes para la consulta de búsqueda. Por lo tanto, vamos a saber qué otras palabras clave de nuestro texto deben incluir a aparecer en los resultados de búsqueda.

2) El uso de la visualización de redes texto vamos a identificar los vacíos - o las zonas vacías entre los grupos de palabras clave que tienden a co-ocurrir en los fragmentos de texto. Estas brechas nos mostrarán lo que falta en los resultados de búsqueda, por lo que podemos incluir aquellas partes que faltan en nuestro texto y asegúrese de que aparece en la parte superior de los resultados de búsqueda de Google.

Vamos a utilizar InfraNodus herramienta de visualización de la red de texto para visualizar fragmentos de texto de diferentes resultados de búsqueda. Este instrumento nos mostrará un gráfico de las palabras que tienden a co-ocurrir junto a la otra en los mismos fragmentos (de las 5 primeras páginas de resultados). También nos mostrará las palabras clave más relevantes que se utilizan con la consulta de búsqueda que estamos estudiando.

Uso de la función "Importar" de InfraNodus creamos una red de visualización de texto de los siguientes términos de búsqueda:

“search engine optimization seo”



Los propios términos de búsqueda son excluidos de la gráfica, por lo que podemos ver el contexto real en que aparecen en los resultados de búsqueda.

Hay tres grupos prominentes en este gráfico, lo que significa que esas palabras tienden a co-ocurrir más a menudo juntos:

1.  "mejorar", "visibilidad", "sitio", "ranking"



2. "optimizar", "google", "rango"



3. "servicio", "marketing", "agencia"



Esto demuestra que los resultados de búsqueda de Google, básicamente, tienen 3 temas principales: mejorar la visibilidad de un sitio web, optimización de rango de página web de Google, así como las proposiciones de / para agencias de marketing.

Lo que significa que si vamos a encajar muy bien en esa constelación con nuestro artículo, tenemos que hacer dos cosas.

En primer lugar, tenemos que incluir todos esos términos en este artículo (en especial en los, y otras etiquetas). Lo hicimos un poco de forma automática, ya que hemos estado escribiendo acerca de esas palabras anteriores.

En segundo lugar, el gráfico muestra lo que los usuarios realmente encontrar. Necesitamos proponerlos algo original, algo que no encuentran todavía. Esto se puede hacer, cerrando las brechas en el gráfico entre los grupos de términos de búsqueda que hemos identificado.

Usted puede jugar con el gráfico por sí mismo utilizando la interfaz de abajo. Haga clic en el icono gráfico superior esquina derecha para eliminar fragmentos de texto, haga clic en los nodos en el gráfico para ver qué resultados de búsqueda que aparecen y cómo se relacionan los unos a los otros.

.











Paso 3: Mejorar la visibilidad y Google Ranking de Tus Páginas Web - Escribir algo original

Es importante notar aquí que Google tiene en cuenta el número de páginas externas enlace a su página y esto afectará el ranking. Sin embargo, las palabras clave, especialmente para los sitios web que ya tienen un alto rango, son muy importantes.

Ahora vamos a demostrar cómo se puede mejorar la visibilidad y la clasificación de esta página

1) cerrando las brechas entre los distintos grupos de palabras clave que aparecen en el gráfico y también
2) proponer algo nuevo (que nuestros competidores en los resultados de búsqueda no escriben sobre).

El primer punto es un tanto completa ya porque este artículo contiene todas las posibles agrupaciones de palabras (contextos) que aparecen en los resultados de búsqueda ya. No vamos a correr el riesgo de repetir una vez más para evitar pena de Google para enviar spam.

En cambio, puede ser interesante mencionar unas cuantas veces más algunos términos que los usuarios están buscando, junto con "seo" y "optimización del Search Engine", pero que no aparecen realmente en los resultados de búsqueda. Estos se mencionarán más adelante.

El segundo punto se cumple también por el hecho de que estamos escribiendo sobre un nuevo tema de visualización de la red de texto de los resultados de búsqueda de Google, que usted no encontrará en ningún otro lugar.

Es importante tener esto en cuenta al crear textos SEO optimizado: cerrando las brechas entre diferentes temas y traer otros nuevos aumentará sus rankings en los motores de búsqueda.

Paso 4: InfraNodus como herramienta SEO - Software para la visualización de la red del texto

Hemos demostrado anteriormente cómo InfraNodus herramienta de visualización de la red de texto se puede utilizar para obtener resultados de búsqueda de Google.

Crea una cuenta (obtener un código de invitación de nosotros), haga clic en "Importar", selecciona "Google Search", escriba su consulta de búsqueda, seleccione el nombre del contexto (la categoría / lista en donde se guardan los resultados), elija el número de los resultados de búsqueda de fragmentos que quieres ver en el gráfico (preferimos 50), haga clic en "Guardar" y visualizar el gráfico.



También puede utilizar el análisis de redes de texto para sus textos, de modo que usted puede ver su pertinencia con respecto a las consultas de búsqueda y resultados de búsqueda en su tema. Para ello, basta con copiar y pegar el texto en InfraNodus (o utilizar la función de importación) y se visualiza como una red:



Si excluimos a los términos como "buscar", "seo", "optimización" que tienen que estar en este texto, vemos que las palabras clave, como "número", "google" y "palabra clave" son los más destacados. Tal vez los dos últimos son bien, pero el primero de ellos, "número", no era prominente en las consultas de búsqueda y en la búsqueda ... err ... respuestas. Así que tendría sentido que pasar por este artículo y eliminar esa palabra clave, así que no es tan prominente.



Paso 5: Salir del filtro burbuja - Mejorar el Discurso Online

Hemos demostrado anteriormente cómo el análisis de redes de texto se puede utilizar para optimizar páginas web para la búsqueda. El enfoque no es nuevo, sin embargo esperamos que las herramientas y técnicas que propusimos serán de utilidad para todos aquellos interesados ​​en SEO y visualización de datos.

Una cosa interesante a añadir es que la mayoría de las páginas en la web son en realidad crean con motores de búsqueda en mente, lo que significa que más a menudo vemos lo que ya esperábamos encontrar. Por lo tanto, si usted está interesado en dar a sus usuarios un poco de un valor añadido y ayudarles a salir de la búsqueda de la burbuja filtro motor tratar de identificar los temas que serían novela al discurso disponibles en línea ya existente. Gráficos de redes de texto pueden ser muy útiles para que y que ofrecen una metáfora visual ordenada para la interacción digital.

miércoles, 25 de marzo de 2015

La minería de datos de Twitter encuentran a los más fervientes seguidores de ISIS

La minería de datos de Twitter revela los orígenes del apoyo al Estado Islámico
El estudio de los tweets de personas del pre-Estado Islámico que terminaron respaldando a la organización presenta un panorama revelador de cómo surge el apoyo, dicen los científicos de la computación.



Ya en mayo de 2014, surgieron noticias de que un egipcio llamado Ahmed Al-Darawy había muerto en los campos de batalla de Irak, mientras que luchaba por el Estado Islámico de Irak y el Levante, también conocido como Estado Islámico o ISIS.

En la cara de él, su muerte parecía algo de un rompecabezas. Al-Darawy era un padre de 38 años de edad de tres años, un ex policía y gerente en una empresa multinacional en Egipto. Él también había sido un jugador clave en el movimiento no violento democracia que derrocó al presidente egipcio Hosni Mubarak en 2011 durante la Primavera Árabe. Incluso Al-Darawy había asociado siempre a cargos de elección popular después de los levantamientos.

Muchos observadores preguntaron qué había hecho de esta activista no violenta en un partidario endurecido del movimiento ISIS violento. Pero la historia de Al-Darawy no es tan inusual.

Los estudios de las personas que se han unido a este tipo de organizaciones sugieren que tienden a estar mejor educados, mejorar su situación financiera, más expuestos a la cultura occidental y, en general más logrado que el promedio. Tampoco estos individuos muestran evidencia de trastornos psicológicos. Por el contrario, parecen ser psicológicamente más robusta que la media.

Estas características son apenas inusual. Mucha gente en muchas sociedades comparten características similares. ¿Así que lo que distingue a los que eligen luchar por grupos violentos como ISIS de aquellos que no lo hacen?

Hoy en día, tenemos una idea de esta pregunta gracias al trabajo de Walid Magdy y amigos en el Instituto de Investigación Informática Qatar en Doha. Estos chicos han estudiado tweets en árabe generados por personas que apoyan ISIS y los que se oponen a ella para determinar cuáles son los factores de personas en cada grupo tienen en común.

Luego buscaron a través de la historia de cada individuo de tweets para ver si sus tweets pre-ISIS revelaron factores comunes que pueden predeterminar su apoyo fuera de plazo o de la oposición.

Magdy y coautores comienzan recogiendo unos 3,1 millones de tweets que mencionan árabes ISIS creado por más de 250.000 usuarios entre octubre y diciembre de 2014. De estos usuarios, 165.000 tenían cuentas activas que se remontaban a pre-ISIS veces.

Para determinar la diferencia entre los usuarios de favor o en contra de ISIS, pidieron un hablante nativo árabe para juzgar la polarización de una muestra aleatoria de 1.000 tweets.

Esto reveló una tendencia clara. Tweets que demuestran el apoyo a ISIS tienden a usar su nombre completo, el Estado Islámico en Irak y el Levante, o alguna variación de este. Tweets que se opusieron a ISIS tendían a utilizar la abreviatura.

Luego escogieron todos aquellos usuarios que habían escritos 10 o más tweets sobre ISIS, ya sea en favor o en contra. Esto produjo un total de 11.332 usuarios pro-ISIS y 45.628 usuarios de anti-ISIS.

A continuación, Magdy y coautores estudiaron la forma en que los tweets favor o en contra ISIS varía en el tiempo. "Tuits anti-ISIS generalmente alcanzaron su punto máximo cuando la noticia de ISIS violaciónes de derechos humanos surgió como el asesinato de rehenes, las cuentas de tortura, o informes de la esclavitud de las mujeres yazidi", dicen. "Por otro lado, los tweets pro-ISIS generalmente alcanzaron su punto máximo en conjunción con el lanzamiento de videos de propaganda y los principales logros militares".

También estudiaron los hashtags relacionados con estos tweets, encontrar vínculos con varios eventos de noticias que parecen desencadenar interés en ISIS. Como era de esperar, la mayoría de estos tweeters, parecía que se originan en el Medio Oriente

Por último, Magdy y coautores estudiaron la cronología histórica de los tweets de más de 7.000 usuarios pro-ISIS y un número igual de usuarios anti-ISIS. El objetivo era buscar características en común que podrían predecir su futuro apoyo o la oposición.

Magdy y colegas entrenaron un algoritmo de aprendizaje automático para detectar los usuarios de ambos tipos y dijo que era capaz de clasificar a otros usuarios de probabilidades de convertirse en pro- o anti-ISIS con gran precisión. "Formamos un clasificador que puede predecir el apoyo o la oposición de ISIS con 87 por ciento de precisión futuro", dicen.

Los hashtags estas personas usan dar una visión interesante sobre el origen de su apoyo u oposición. "En cuanto a los hashtags discriminatorios sugirió que una fuente importante de apoyo a ISIS surge de la frustración con los pasos en falso de la Primavera Árabe", dicen Magdy y colegas. "En cuanto a la oposición a ISIS, que está vinculada con el apoyo de otros grupos rebeldes, la mayoría en Siria, que han sido blanco de ISIS, el apoyo a los regímenes de Oriente Medio ya existente, y Shia sectarismo".

Eso es interesante investigación que revela la complejidad de las fuerzas que actúan en la determinación de apoyo u oposición a movimientos como ISIS- y de por qué la gente como Ahmed Al-Darawy terminan muriendo en el campo de batalla. Una mejor comprensión de estas fuerzas es sin duda un paso adelante en la búsqueda de soluciones a la enmarañada red que existe en esta parte del mundo.

Sin embargo, vale la pena que termina con una nota de precaución. La capacidad de clasificar las personas como potenciales partidarios de ISIS plantea la peligrosa perspectiva de una especie de policía del pensamiento, como la representada en películas como Minority Report. Es evidente que gran parte del pensamiento se debe dar forma en para que este tipo de información se debe utilizar.

Ref:  arxiv.org/abs/1503.02401 : #FailedRevolutions: Using Twitter to Study the Antecedents of ISIS Support



domingo, 22 de marzo de 2015

Redes de viñetas para análisis de información




Mejora de la memoria: desde listas de viñetas a grafos de red
Consideremos un ejemplo sencillo: queremos hacer un seguimiento de los fondos de riesgo y la puesta en marcha aceleradores de semillas. ¿Cómo organizar esta información de una manera que siempre podemos recuperarlo y compartirlo con los demás?
El enfoque tradicional - ir a algún sitio, como TechCrunch, elegir los más interesantes, y hacer una lista de viñetas (guardarlo en Evernote después):

• Y Combinator
• Sequoia
• Founders Fund
• Andreessen Horowitz
• Google Ventures,
• Founders Fund
• Index Ventures
• TechStars
• AngelPad
• Primera Ronda de Capital
• Betaworks
• Atlas Ventures,

Esta es una buena lista, pero carece de contexto. Algo que carece de contexto carece de significado.
Por lo general, este problema se resuelve mediante la adición de las categorías, pero esto es una cosa muy difícil de hacer con la mayoría de las cosas hoy en día, especialmente con fondos, que funcionan a través de la diversificación (así, de hecho, un buen fondo debería ser inclasificable).

Otro enfoque - hacer un grafo de la red.


La sola observación de esta imagen ya nos da una buena idea de quién es quién en la industria y hace que sea mucho más fácil de recordar los principales jugadores. Tiene mucho que ver con los efectos de memoria, como cebado (es más fácil de recordar las cosas cuando están relacionados) y el reconocimiento de patrones incrustado en la percepción humana.
El grafo fue recuperado utilizando InfraNodus: encuentra las entidades que la gente busca juntos y los visualiza en el gráfico. Algunas conexiones se han añadido manualmente si los fondos de co-invertidos en la misma empresa.
Los nodos en el gráfico fueron alineados utilizando iterativo algoritmo de fuerza Atlas: los nodos más conectados son empujados el uno del otro, mientras que los nodos conectados a ellos se tiran más cerca. Cuantas más conexiones de los nodos tienen, cuanto más grandes son en el gráfico.
El grafo resultante muestra los fondos, y ofrece dos beneficios adicionales: contexto e importancia relevante de cada elemento.
El contexto se produce a través de las conexiones entre los nodos: podemos ver fácilmente que los fondos con mayor frecuencia se buscó (y mencionó) juntos, así que esto indicará algo acerca de su posición relevante en el mundo del capitalismo de riesgo.
La importancia relevante se produce a través del número de conexiones que cada fondo (nodo) tiene en la red. Cuantas más conexiones, más grande que es. Cuanto más el nodo está conectado a los nodos más conectados en la red, el más central que va a ser.
Por lo tanto, vemos que todos los fondos más conocidos, como Sequoia, Andreessen Horowitz, Google Ventures tienen una alta relevancia y tienen una ubicación céntrica, por lo que tipo de conformar el núcleo del mercado de capital de riesgo.
Entonces tenemos un montón de fondos que aún están en el centro, pero un poco en el lado, como Y Combinator, TechStars, AngelPad y Seedcamp. Quienes tienen una preferencia por las inversiones de semillas y son diferentes de los grandes como Sequoia. Sin embargo, Y Combinator, por ejemplo, a veces también hace inversiones más grandes, por lo que es más cerca del pelotón principal.
Por último, hay algunos fondos en la periferia, como Atomic, Atlas Ventures, Betaworks, Horizon Ventures, así como Yuuwa capitales y Sparkbox ventures. Esos fondos son menos conocidos pero pueden ser interesantes, ya sea debido a su posición geográfica única o una cartera más especializada.
Como podemos ver, una imagen vale sobre 480 palabras (hasta ahora), que ya es un buen resultado.
Una imagen interactiva puede ser aún más interesante. Haga clic en los nodos en el gráfico a continuación para ver cómo los fondos están relacionadas específicamente y que las empresas que financian. Haga clic en la esquina superior derecha para mostrar / ocultar el texto.
.