viernes, 21 de noviembre de 2014

La actividad en Twitter nos habla del desempleo en España

La "huella" de Twitter  revela patrones de desempleo
La minería de datos de Twitter revela sorprendentes detalles sobre los indicadores socioeconómicos, pero a una fracción del costo de los métodos de recopilación de datos tradicionales, dicen los sociólogos computacionales.

MIT Technology Review



El comportamiento humano está estrechamente ligada a la condición social y económica. Por ejemplo, la forma en que un individuo se desplaza alrededor de una ciudad se ve influenciada por su trabajo, sus ingresos y su estilo de vida.

Así que no debería ser una sorpresa que la situación económica también podría reflejarse en los patrones de comportamiento de los medios sociales. De hecho, eso es exactamente lo que, dice Alejandro Llorente en la Universidad Autónoma de Madrid en España y unos pocos amigos. Hoy en día, estos chicos demuestran que el amplio patrón de tweets a través de ciudades y condados en España revela detalles fascinantes acerca de las tasas de desempleo en estas áreas.

Estos chicos comenzaron con una base de datos de 19,6 millones de tweets geolocalizados en España publicados entre noviembre de 2012 y junio de 2013. Llorente y colegas querido correlacionar estos tuits con las regiones de la actividad económica, pero estos no son fáciles de determinar. Eso es debido a que no se corresponden bien a los límites administrativos en España, que reflejan las fronteras históricas y políticas, más que las económicas.

Así que el equipo analizó la velocidad a la que se intercambian mensajes entre regiones utilizando un algoritmo estándar de detección de la comunidad. Esto reveló 340 áreas independientes de la actividad económica, que coinciden en gran medida con otras medidas de la distribución geográfica y económica. "Este resultado muestra que la movilidad de los tweets geolocalizados detectado y las comunidades obtenidos son una buena descripción de las zonas económicas", dicen.

Por último, se analizaron los datos de desempleo en cada una de estas regiones y luego minado su base de datos para las correlaciones con Twitter actividad.

Los resultados muestran diferencias claras entre las regiones con desempleo alto y bajo. Por ejemplo, la tasa de twitteando entre las 9 am y el mediodía de lunes a viernes es significativamente mayor en las zonas de alto desempleo. Estos tuits tienen más probabilidades de contener palabras tales como trabajo o el desempleo. Y los mensajes son también más propensos a contener errores de ortografía, quizás reflejando un menor nivel de educación entre los desempleados.

"Demostramos que las características de comportamiento relacionados con el desempleo pueden ser recuperados de los gases de escape digitales dejado por la red de microblogging Twitter," decir Llorente y compañía.

Eso es importante porque este tipo de análisis es rápido y sencillo en comparación con los métodos tradicionales de recolección de datos, como las encuestas. Estos son caros, tanto es así que algunos países han considerado abandonar en tiempos de dificultades económicas para ahorrar dinero.

Por tanto, la posibilidad de que los datos de Twitter pueden proporcionar una visión general rápida y barata de desempleo es una alternativa interesante. Lo que es más, permite que los gobiernos y los responsables de las políticas para monitorear los cambios en la población, más o menos en tiempo real.

"La inmediatez de las redes sociales también puede permitir a los gobiernos a medir y comprender mejor el efecto de las políticas, los cambios sociales, los desastres naturales o hechos por el hombre en el estado económico de las ciudades en casi en tiempo real", dicen Llorente y coautores, y agregó que su técnicas deben estar en cualquier lugar aplicable en el mundo.

Trabaja como esto muestra cómo la naturaleza de la recopilación de datos económico está cambiando. Va a ser interesante ver lo rápido que los gobiernos y otras organizaciones a adaptarse.

Ref: arxiv.org/abs/1411.3140 Social Media Fingerprints Of Unemployment

No hay comentarios:

Publicar un comentario