Mostrando entradas con la etiqueta redes telefónicas. Mostrar todas las entradas
Mostrando entradas con la etiqueta redes telefónicas. Mostrar todas las entradas

sábado, 13 de julio de 2019

Políticas de infraestructura a través de datos de conexiones de celulares en países no desarrollados

El potencial de los datos de los teléfonos móviles para informar la planificación de la infraestructura en los países en desarrollo

Hadrien Salat, Zbigniew Smoreda, Markus Schläpfer
ArXiv





Los datos del censo de alta calidad no siempre están disponibles en los países en desarrollo. En cambio, los datos de los teléfonos móviles se están convirtiendo en un proxy para evaluar la densidad de la población, la actividad y las características sociales. Ofrecen ventajas adicionales para la planificación de la infraestructura, como la actualización en tiempo real, incluida la información de movilidad y el registro de la actividad temporal de los visitantes. Combinamos varios conjuntos de datos de Senegal para evaluar el potencial de los datos de teléfonos móviles para reemplazar datos de censos insuficientes para la planificación de infraestructura en países en desarrollo. Como un caso aplicado, probamos su capacidad para predecir con precisión el consumo doméstico de electricidad. Mostramos que, contrariamente a lo que se cree, la actividad promedio de los teléfonos móviles no está bien correlacionada con la densidad de población. Sin embargo, puede proporcionar mejores estimaciones de consumo de electricidad que los datos del censo básico. Más importante aún, utilizamos con éxito las técnicas de agrupación de redes y curvas para mejorar la precisión de las predicciones, recuperar un buen potencial de mapeo de la población y reducir la recopilación de datos informativos para la planificación a muestras sustancialmente más pequeñas.


miércoles, 28 de junio de 2017

Status económico y posición en la red

Infiriendo el estatus económico personal desde la ubicación de la red social

Shaojun Luo, Flaviano Morone, Carlos Sarraute, Matías Travizano y Hernán A. Makse
Nature Communications 8, Número del artículo: 15227 (2017)
Doi: 10.1038 / ncomms15227


Resumen -
Se cree comúnmente que los patrones de lazos sociales afectan la situación económica de los individuos. Aquí traducimos este concepto en una definición operativa a nivel de red, lo que nos permite inferir el bienestar económico de los individuos a través de una medida de su ubicación e influencia en la red social. Analizamos dos fuentes de gran escala: las telecomunicaciones y los datos financieros de la población de todo un país. Nuestros resultados muestran que la ubicación de un individuo, medida como la influencia colectiva óptima para la integridad estructural de la red social, está altamente correlacionada con la situación económica personal. Los patrones de influencia social observados imitan los patrones de desigualdad económica. Para el uso pragmático y la validación, llevamos a cabo una campaña de marketing que muestra un aumento de tres veces en la tasa de respuesta dirigida a los individuos identificados por nuestras métricas de red social en comparación con la orientación aleatoria. Nuestra estrategia también puede ser útil para maximizar los efectos de las políticas de estímulo económico a gran escala.


Introducción

El problema de larga data de cómo la red de contactos sociales1,2,3 influye en la situación económica de los individuos ha llamado la atención debido a su importancia en una diversidad de temas socioeconómicos que van desde la política al mercadeo4,5,6,7. Los análisis teóricos han señalado la importancia de la red social en la vida económica5 como medio para difundir las ideas8,9 a través de los efectos de los "agujeros estructurales" 10 y los "lazos débiles" en la red4. Del mismo modo, la investigación ha reconocido el efecto económico positivo de ampliar los contactos de un individuo fuera de su propio grupo social estrechamente conectado1,11,12,13. Mientras que el trabajo previo ha establecido la importancia de la influencia de la red social a la situación económica, el problema de cómo cuantificar dicha correspondencia a través de las redes sociales o métricas3,14 permanece abierto.

Los estudios que emplean datos de comunicación telefónica móvil y otros indicadores sociales han encontrado una variedad de efectos en la red sobre indicadores socioeconómicos como oportunidades de empleo15,16, movilidad social17,18,19, desarrollo económico6,20,21,22 y comportamiento del consumidor23,24. Un trabajo reciente también proporciona evidencia de tales efectos sobre la riqueza de un individuo y destaca la necesidad de mejores indicadores25. Recientemente, un estudio numérico ha probado el efecto de la diversidad de redes en el desarrollo económico6. Este estudio analizó el desarrollo económico definido a nivel comunitario. Sin embargo, la cuestión de cómo se pueden utilizar las métricas de redes sociales para inferir la situación financiera a nivel individual, necesaria, por ejemplo, para las campañas de mercadotecnia o de intervención social, sigue sin respuesta. La dificultad se debe, en parte, a la falta de datos empíricos que combinen la información financiera de un individuo con el patrón de sus lazos sociales a nivel de red en gran escala de toda la sociedad.

En este trabajo abordamos este problema directamente combinando dos grandes conjuntos de datos: una red social de toda la población de un país latinoamericano y datos bancarios financieros a nivel individual. Descubrimos que la optimalidad de la localización de un individuo en la red, medida por la influencia colectiva (CI) métrica26, está altamente correlacionada con la situación económica del individuo a nivel de población: cuanto mayor es el CI, mayor es el nivel socioeconómico. La bondad de ajuste de esta correlación puede ser tan alta como R2 = 0,99 cuando también se incluye la edad. Estos resultados indican que la optimización de la ubicación en la red social medida por la métrica CI puede predecir con precisión los indicadores socioeconómicos a nivel personal.

El 1% superior del estrato económico tiene patrones de red precisos de formación de enlaces que muestran relativamente baja conectividad local rodeada por una jerarquía de centros estratégicamente ubicados en esferas de influencia de creciente tamaño en la red. Este patrón no se observa en el resto de la población, en particular, en el 10% inferior caracterizado por bajos valores de CI. Así, la influencia medida a partir de patrones de redes sociales imita la desigualdad observada en el estado económico27.

También encontramos una alta correlación entre la diversidad de vínculos de los individuos y su situación financiera (R2 = 0,96), empleando el análisis basado en la ubicación de la red y la edad. El análisis de la covarianza sugiere que el efecto de la influencia de la red es significativo e independiente de otros factores. Validamos estos resultados llevando a cabo una campaña de marketing dirigida en la que comparamos la tasa de respuesta para diferentes grupos de personas con diferentes ubicaciones de red. Al dirigir el grupo con los valores CI superiores, la tasa de respuesta puede llegar hasta 1%; Aproximadamente tres veces la tasa de respuesta encontrada por orientación al azar y cinco veces la tasa de respuesta de las personas de CI baja.

Así, los individuos con alto nivel socioeconómico (1% superior) desarrollan un patrón muy característico de lazos sociales en comparación con el 10% inferior. Si bien este resultado se puede esperar, es notable que la diferencia en el patrón de las interacciones sociales entre los ricos y los pobres pueden ser capturados con precisión por una métrica de red midiendo su CI en la red social26. La capa socioeconómica superior de la sociedad también representa el conjunto mínimo de personas que proporciona integridad a toda la red social a través de su gran CI. El hecho de que los individuos de mayor estatus económico estén ubicados en regiones de gran CI en la red eleva la evidencia anecdótica anterior a un principio de organización de la red a través de la optimización de la influencia de las personas afluentes que afectan la integridad estructural de la red social. Al mismo tiempo, sugiere la aparición del fenómeno de CI en la sociedad como resultado de la optimización de las interacciones socioeconómicas.


Resultados

Construcción de redes

La red social se construye a partir de datos móviles (llamadas y metadatos SMS) y de comunicaciones residenciales recopilados por un período de 122 días (Nota complementaria 1, datos agregados en kcorelab.com). La base de datos contiene 1.10 × 108 usuarios de teléfono. Después de filtrar los nodos no humanos activos mediante un modelo aprendido por la máquina y entrenado en el comportamiento de la comunicación natural humana (Nota Complementaria 2, con Figuras 1-4 adicionales), construimos una red final de 1,07 × 108 nodos en un componente conectado gigante hecho de 2,46 × 108 enlaces. Los lazos, o enlaces, en la red corresponden a comunicaciones telefónicas, ya que esperamos que los patrones de comunicación sean indicativos de la ubicación de un individuo en la red social28,29,30. El costo financiero del uso de los servicios telefónicos hace posible que exista un sesgo sistemático en la cantidad de personas ricas que utilizan los servicios telefónicos en relación con las personas que tienen menos dinero para gastar en llamadas telefónicas. Aunque el efecto podría ser limitado (nota complementaria 1), no podemos descartar esta posibilidad con los datos actuales.

La situación financiera se obtiene del límite de crédito combinado de las tarjetas de crédito asignadas por las instituciones bancarias a cada cliente. El límite de crédito se basa en factores compuestos de ingresos e historial de crédito y, por lo tanto, refleja la situación financiera del individuo (ver discusión en la Nota Suplementaria 1). El límite de crédito se extrae de una base de datos de bancos cifrados e identificado por los números de teléfono de los clientes cifrados registrados en el banco. Por lo tanto, somos capaces de correlacionar precisamente la información financiera de un individuo con su ubicación social en la red de llamadas telefónicas a nivel de país. Hay 5.02 × 105 clientes bancarios que han sido identificados en la red móvil cuyo límite de crédito oscila entre USD $ 50 a $ 3.5 × 105 (convertido desde el país de estudio). Por lo tanto, los conjuntos de datos están conectados con precisión proporcionando una oportunidad sin precedentes para probar la correlación entre la ubicación de la red y el estado financiero.

A pesar de la gran escala de nuestra fuente de datos, observamos que trabajar en un solo país específico como en el presente estudio no es suficiente para otorgar generalidad a nuestros resultados. Para probar la validez general de los resultados actuales, se necesitaría el acceso a conjuntos de datos bancarios y de comunicaciones a nivel de toda la población de otros países. A medida que más conjuntos de datos estén disponibles, la generalidad de nuestros resultados puede ser probada a través de diferentes sistemas económicos y sociales.

La Figura 1a, b muestra los patrones de comunicación geolocalizados en todo el país de los individuos en el 1% superior y el 10% inferior de los límites de crédito, respectivamente. La desigualdad en los patrones de comunicación entre la clase económica superior y la más baja es sorprendente y imita la desigualdad económica a nivel de país27. Es visualmente evidente que el 1% superior (que representa el 45,2% del crédito total en el país) muestra un patrón de comunicación completamente diferente que el 10% inferior; El primero se caracteriza por vínculos más activos y diversos, especialmente conectando ubicaciones remotas y comunicándose con otras personas igualmente afluentes. Otros resultados utilizando el análisis de entropía también sugieren que la estructura de la red puede ser significativamente diferente entre las personas en el ranking de cuantil superior e inferior del límite de crédito (nota complementaria 3, cuadro complementario 1). Ejemplos particulares de las redes de ego ampliadas para dos individuos (con el mismo número de lazos) que ocupan el 1% superior y el 10% inferior proporcionan una imagen ampliada de tales diferencias (Fig. 1c, d, respectivamente). Los 1-por ciento más ricos tienen una mayor diversidad de contactos móviles y están ubicados centralmente, rodeados por otras personas altamente conectadas (hubs de red). Por otro lado, los individuos más pobres tienen una diversidad de contacto baja y están débilmente conectados a menos centros. El quid de la cuestión es encontrar una métrica de red social confiable para cuantificar esta diferencia visual en los patrones de estructura de red entre los ricos y los pobres, como se muestra a continuación.

Figura 1: Los patrones de influencia de la red imitan patrones de desigualdad de ingresos.

Visualización de la actividad de comunicación de la población en el primer 1% (con límite de crédito superior a USD $ 25.000, convertido, en el país de estudio) y (b) inferior 10% (con límite de crédito inferior a USD $ 600) del total Clases de límite de crédito. Los enlaces están entre los clientes del banco que han registrado su código postal. La resolución de ambas parcelas es de 1.700 × 1.000. El número de clientes bancarios dentro de cada comunidad se refleja en el tamaño del nodo. El límite de crédito promedio se indica mediante la escala de grises de un nodo. El color y grosor de los bordes refleja el número de eventos de comunicación entre diferentes comunidades. (C) Ejemplos de la red de ego (extendida a dos capas) para un individuo en la clase rica superior del 1% y (d) un individuo en la clase inferior del 10%. Las redes muestran dos patrones distintos de lazos sociales de acuerdo con la alta y baja situación económica: la primera se caracteriza por una IC grande, la segunda por CI baja. (E) Representación esquemática de una red bajo la descomposición de k-shell33. (F) Ejemplo de cálculo de CI. El CI Bola de radio alrededor del nodo i es el conjunto de nodos contenidos dentro de la esfera y ∂Ball es el conjunto de nodos en el límite (marrón). CI es el grado-menos-uno del nodo central veces la suma del grado-menos-uno de los nodos en el límite de la esfera de influencia.


Influencia de la red y situación financiera

Se han considerado muchas métricas o centralidades para caracterizar la influencia o importancia de los nodos en una red3,14,31. Aquí consideramos sólo aquellas centralidades que pueden ser escaladas hasta el tamaño de la red grande considerado aquí (figura 1e, nota adicional 4): (a) la centralidad del grado ki (número de lazos del individuo i) es una de las más simples3, (B) PageRank, de Google fame32, es una centralidad de vectores propios que incluye la importancia no sólo del grado, sino también de los vecinos más próximos, (c) el índice ks  del k-shell de un nodo (Figura 1e), es decir, La localización de la cáscara obtenida mediante la poda iterativa de todos los nodos con un grado k<ks (referencia 33), y (d) la CI de un nodo de grado ki  (figura 1f) en una esfera de influencia del tamaño  definido por la frontera de la bola de influencia , y se prevé que sea  por la teoría de percolación óptima26. A diferencia de las otras centralidades heurísticas, CI se deriva de la teoría de la maximización de la influencia en la red34. Por lo tanto, los nodos CI superiores se identifican como influenciadores o distribuidores superiores de información, y lo son colocándose en ubicaciones estratégicas en el centro de esferas rodeadas por cubos situados jerárquicamente a distancias (figura 1d). Estos influyentes colectivos constituyen también un conjunto óptimo que proporciona integridad al tejido social: son el número más pequeño de personas que, al salir de la red (proceso matemáticamente conocido como percolación óptima26), desintegraría la red en pequeñas piezas desconectadas.

Por definición, todas las métricas tienen similitudes (por ejemplo, son proporcionales a k, y PageRank y CI se basan en los autovalores más grandes de las matrices de adyacencia y no retroceso, respectivamente26), y de hecho, encontramos que sus valores en La red de comunicaciones telefónicas están correlacionadas (Tabla 2 suplementaria). Más interesante, la Fig. 2 proporciona evidencia de correlación de las cuatro métricas de la red con el estado financiero (límite de crédito clasificado) cuando controlamos por edad, lo que indica que la ubicación de la red se correlaciona con la situación financiera. En esta figura, se representa la fracción de individuos ricos (definida como el cuarto cuantil superior, equivalente a un límite de crédito superior a USD $ 4.000, véase la Nota Complementaria 5 para detalles sobre los métodos de validación y la referencia 30) en una cuadrícula de muestreo para un valor dado De edad y métrica social como se indica.


Figura 2: Fracción de individuos ricos versus edad y métricas de red.

Correlación entre la fracción de individuos ricos frente a la edad y (a) grado k  (R2=0.92), (b) k-shell (R2=0.96), (c) PageRank (R2=0.96) y (d) log10CI (R2=0.93). Sólo se muestran en la parcela los grupos con población> 20. Las cuatro métricas se correlacionan bien con la situación financiera cuando se consideran con la edad. Otras correlaciones se estudian en la Nota Suplementaria 6, indicando que CI podría ser considerada como la métrica más conveniente de los cuatro debido a su alta resolución.

Si bien todas las métricas sociales muestran correlaciones con el estado financiero cuando se consideran con la edad (figura 2), la pregunta sigue siendo cuál métrica es el predictor más eficiente. Se observan correlaciones fuertes con el bienestar económico para los pares de características (edad, k-shell, R2 = 0,96, Fig. 2b) y (edad, CI; R2 = 0,93, Fig. 2d). La Nota Suplementaria 6 (Figuras Adicionales 7-9) proporciona una comparación adicional cuando se consideran las métricas por sí solas, indicando que k-shell y CI mejor captan la correlación con el límite de crédito. Entre estas dos métricas, CI garantiza un requisito para una correlación fuerte y suficiente resolución. K-shell no puede capturar más detalles debido a su limitación de valores (k-shell varía de 1 a 23, dividiendo a toda la población en este pequeño número de conchas con una típica concha conteniendo decenas de millones de personas), mientras que CI abarca más de siete órdenes de magnitud; Véase la Fig. 5. Esta alta resolución implica que CI es una firma social más precisa para la situación financiera de los individuos. Según su definición (figura 1d), un nodo CI superior es un hub moderado a fuerte rodeado por otros centros jerárquicamente situados a distancia. Sin embargo, enfatizamos que CI es sólo una estrategia útil por las razones expuestas anteriormente, y de ninguna manera la única o mejor estrategia para correlacionar la riqueza de los individuos y su influencia en la red.

Si bien la teoría detrás de CI es una maximización global de la influencia, CI representa la aproximación local a esta optimización global. Así, CI representa un equilibrio entre una optimización global y su aproximación local, teniendo en cuenta las primeras 2 o 3 capas de vecinos a través del parámetro , que representa el tamaño de la esfera de influencia utilizada para definir la importancia de un nodo. 1d. Al cambiar , descubrimos que CI con es suficiente para capturar la correlación entre la influencia de la red y la riqueza (Figura 10).

Para realizar un seguimiento del efecto de la IC independientemente de la edad, se investigan los efectos de la CI dentro de dos grupos de edad específicos en la Fig. 3a, b. En ambos grupos de edad, la CI alta siempre está acompañada por una población más alta de personas ricas. Una pendiente relativamente menor en el grupo de edad <30 sugiere que el efecto de la red de CI es más sensible para las personas mayores con niveles económicos más maduros y estables que para los jóvenes (Figura 6). Cuando combinamos la edad y la clasificación de cuantil CI en un compuesto de edad-red: ANC=αAge+(1−α) CI, con α = 0,5, se logra una notable correlación (R2 = 0,99, Fig. 3c). Al combinar la información de la red con la edad, la probabilidad de identificar a las personas con un límite de crédito alto alcanza el ~ 70% al nivel más alto de ingresos. Este nivel de precisión hace que el modelo sea práctico para inferir la aptitud financiera de los individuos usando la CI de la red como se muestra a continuación.

Figura 3: Fracción de individuos ricos en diferentes edades y grupos de clasificación compuestos.

Correlación entre la fracción de individuos ricos dada por el límite máximo de crédito del 25% y CI en diferentes grupos de edad de (a) 18-30 y (b)> 45. Las correlaciones entre la situación económica superior y la IC grande determinada por los valores de CI en diferentes edades son significativas en todos los grupos de edad, mientras que la pendiente de la regresión lineal es mayor en el grupo de mayor edad (0,053 comparado con 0,037). (C) Clasificación compositiva edad-red ANC = 1/2 Edad + CI 1/2, y (d) clasificación mixta edad-diversidad ADC = 1/2 Edad + 1/2 DR. Mediante la combinación de las métricas de red con la edad en un índice compuesto, la posibilidad de identificar a las personas de alto nivel financiero alcanza ~ 70% para valores altos del compuesto. Ambos R2 muestran un alto nivel de correlación (R2 = 0,99 y 0,96 para ANC y ADC, respectivamente), haciendo ambos compuestos buenos predictores de la riqueza en aplicaciones prácticas.

Validación por campaña de marketing

Para validar nuestra estrategia, realizamos una campaña de marketing social cuyo objetivo es la adquisición de nuevos clientes de tarjetas de crédito, mediante el envío de mensajes a las personas afluentes (identificadas por sus valores de CI) e invitando a los destinatarios a iniciar una solicitud de producto (nota complementaria 8) . Observamos que en este experimento usamos un conjunto de datos independiente de un marco de tiempo diferente, y usamos solamente los valores de CI extraídos de la red para clasificar las personas objetivo. En concreto, utilizamos la red de comunicaciones resultante de la agregación de llamadas y SMS intercambiados entre usuarios durante un período de 91 días. La red social resultante contiene 7,19 × 107 personas y 3,51 × 108 enlaces. La campaña se llevó a cabo en un total de 656.944 personas que fueron objeto de un mensaje SMS ofreciendo el producto de acuerdo a sus valores de CI en la red social. También enviamos mensajes a un grupo de control de 48.000 personas, elegidas al azar. Para evaluar la campaña, se midió la tasa de respuesta, es decir, el número de receptores que solicitaron el producto dividido por el número de personas objetivo, en función de la CI. En el grupo de control, la tasa de respuesta a los mensajes fue 0,331%. Nuestros resultados muestran que los grupos de IC creciente muestran un aumento en su tasa de respuesta, con una triple ganancia sana en la tasa de respuesta de los principales influenciadores (identificados por los valores superiores de CI) en comparación con el caso aleatorio. Cuando comparamos la respuesta de la IC alta con la de CI más baja, la tasa de respuesta se quintuplica. Los resultados del experimento se resumen en la Tabla 1 y en la Fig. 4.


Tabla 1: Resultados de la campaña de marketing de la vida real.


Rango CI CuentaCuantilRespuestasTasa de respuesta
(0, 48)66,4950.11700.26%
(48, 246)65,1640.22180.33%
(246, 600)65,9610.33160.48%
(600, 1,144)65,3760.43320.51%
(1,144, 1,992)65,4770.53630.55%
(1,992, 3,408)65,4770.64580.70%
(3,408, 6,032)65,7360.74930.75%
(6,032, 11,772)65,6410.85550.8%
(11,772, 28,740)65,6830.96571.0%
(28,740, 2,719,354)65,6831.05730.87%
  1. Los individuos ('Cuenta') fueron apuntados según su ranking de cuantil CI en toda la red social obtenida de la actividad de comunicaciones telefónicas. Se calculó la respuesta a la campaña ("Sí contestó") para calcular la tasa de respuesta.

Figura 4: Tasa de respuesta versus cuantil de CI en la campaña de marketing de la vida real basada en CI.

La tasa de respuesta aumenta aproximadamente linealmente con la clasificación CI. La campaña de CI-targeting muestra una ganancia triple para los principales influyentes con CI alta, en comparación con una campaña dirigida a un grupo control aleatorizado.


Análisis de la covarianza

Observamos que nuestra validación es indirecta ya que no es una predicción directa de la situación financiera, sino una tasa de respuesta exitosa a una campaña de marketing. Esta tasa de éxito puede depender en realidad de una serie de otros factores que pueden correlacionarse con la centralidad de la red. Por lo tanto, la métrica de CI puede no ser necesariamente la única causa de la tasa de éxito de la campaña específica (por ejemplo, la ubicación geográfica puede ser también importante). Para abordar este punto, realizamos un análisis de la covarianza35 sobre todas las características a las que tenemos acceso (edad, sexo y código postal registrado) para probar la varianza causada por las métricas de la red y otros factores (detalles en la Nota Complementaria 5 y Tabla 3). El análisis de la covarianza muestra que los efectos de las métricas de la red son independientes de los de los otros factores. La correlación entre el CI y la fracción de personas adineradas es positiva y significativa (P <0,001) en todos los grupos de comunidades geográficas, entre géneros y entre todas las edades mayores de 24 años (Figura 6). Los mismos resultados significativos también se obtienen bajo diferentes umbrales de riqueza. Estos efectos de red significativos y sólidos implican que las métricas de red pueden ser un indicador potencial de la situación financiera.

Diversidad de la red y situación financiera

Nuestros conjuntos de datos combinados también ofrecen la posibilidad de probar la importancia de la diversidad de vínculos, medida por lazos con comunidades distantes de la red que no están directamente conectadas con la comunidad de un individuo, a nivel de individuos individuales4,5,6. Para ello, primero detectamos las comunidades en la red social mediante la aplicación de algoritmos rápidos de detección de la modularidad de los pliegues (Nota Suplementaria 7, Figura 11) 36,37. La diversidad de los vínculos de un individuo puede ser cuantificada a través de la relación de diversidad DR = Wout / Win, definida como la proporción de eventos de comunicación total con personas fuera de su propia comunidad, Wout, con aquellos dentro de su propia comunidad, Win. Esta relación está débilmente correlacionada con CI (R = 0,4), lo que sugiere que captura una característica diferente de la influencia de la red. Implementamos las mismas estadísticas de clasificación compuesta como antes, resultando en un compuesto de diversidad de edades ADC = αAge + (1-α) DR, con un peso α = 0.5. El resultado (Fig. 3d) muestra que ADC se correlaciona con el bienestar financiero individual, generalizando los resultados agregados en ref. 6 a nivel individual. Así, las métricas sociales consideradas, DR y CI, expresan el hecho de que los niveles económicos más altos se correlacionan con la capacidad de comunicarse con individuos fuera de la comunidad social local estrechamente unida, una medida del principio de fuerza de los lazos débiles de Granovetter En ubicaciones de red particulares de CI alto que son óptimas para la difusión de la información y la estabilidad estructural de la red social. Observamos que no se puede establecer una inferencia causal con los datos actuales.

Discusión

Este resultado destaca la posibilidad de predecir el estado financiero y los beneficios de las políticas socialmente orientadas basadas en métricas de red, lo que conduce a mejoras tangibles en las campañas de marketing social. El alto rendimiento de la CI entre las métricas de la red también sugiere el posible papel de acceder y mediar información en la oportunidad financiera y el bienestar5. Esto tiene un impacto inmediato en el diseño de campañas de marketing óptimas mediante la identificación de los objetivos ricos sobre la base de su posición influyente en una red social. Este hallazgo puede también elevarse al nivel de un principio, que explicaría la aparición del fenómeno de CI mismo como resultado de la optimización de las interacciones socioeconómicas.


Referencias

1. Newman, M. E. The structure and function of complex networks. SIAM Rev. 45, 167–256 (2003).
2. Vespignani, A. & Caldarelli, G. Large Scale Structure and Dynamics of Complex Networks: from Information Technology to Finance and Natural Science World Scientific (2007).
3. Wasserman, S. & Faust, K. Methods and Applications, Vol. 8 (Cambridge Univ. Press, 1994).
4. Granovetter, M. S. The strength of weak ties. Am. J. Sociol. 78, 1360–1380 (1973).
5. Granovetter, M. The impact of social structure on economic outcomes. J. Econ. Perspect. 19, 33–50 (2005).
6. Eagle, N., Macy, M. & Claxton, R. Network diversity and economic development. Science 328, 1029–1031 (2010).
7. Singh, V. K., Freeman, L., Lepri, B. & Pentland, A. S. in 2013 Internation Conference on Social Computing (SocialCom) 174–179 (Washington, DC, USA, 2013).
8. Powell, W. W. & Smith-Doerr, L. The Handbook of Economic Sociology, Vol. 368, 380 (eds Neil J. Smelser & Richard Swedberg) (Princeton University Press, Princeton, NJ, USA, 1994).
9. Strang, D. & Soule, S. A. Diffusion in organizations and social movements: from hybrid corn to poison pills. Annu. Rev. Sociol. 24, 265–290 (1998).
10. Burt, R. S. Structural Holes: the Social Structure of Competition Harvard Univ. Press (2009).
11. Page, S. E. The Difference: how the Power of Diversity Creates Better Groups, Firms, Schools, and Societies Princeton Univ. Press (2008).
12. Fernandez, R. M. & Weinberg, N. Getting a job: networks and hiring in a retail bank. Graduate Business School Research Paper No. 1382, 1 (University of Stanford, CA, USA, 1996).
13. Zimmer, C. The Art and Science of Entrepreneurship 3–23 (Ballinger, 1986).
14. Freeman, L. C. Centrality in social networks conceptual clarification. Soc. Networks 1, 215–239 (1978).
15. Toole, J. L. et al. Tracking employment shocks using mobile phone data. J. R. Soc. Interface 12, 2015.0185 (2015).
16. Seidel, M.-D. L., Polzer, J. T. & Stewart, K. J. Friends in high places: the effects of social networks on discrimination in salary negotiations. Admin. Sci. Q. 45, 1–24 (2000).
17. Cho, E., Myers, S. A. & Leskovec, J. in Proceedings of the 17th ACM (International Conference on Knowledge Discovery and Data Mining) 1082–1090 (San Diego, CA, USA, 2011).
18. Phithakkitnukoon, S., Smoreda, Z. & Olivier, P. Socio-geography of human mobility: a study using longitudinal mobile phone data. PLoS ONE 7, e39253 (2012).
19. Deville, P. et al. Scaling identity connects human mobility and social interactions. Proc. Natl Acad. Sci. USA 113, 7047–7052 (2016).
20. Pappalardo, L. et al. An analytical framework to nowcast well-being using mobile phone data. Int. J. Data Sci. Anal. 2, 75–92 (2016).
21. Pan, W., Ghoshal, G., Krumme, C., Cebrian, M. & Pentland, A. Urban characteristics attributable to density-driven tie formation. Nat. Commun. 4, 1961 (2013).
22. Gutierrez, T., Krings, G. & Blondel, V. D. Evaluating socio-economic state of a country analyzing airtime credit and mobile phone datasets. Preprint at https://arxiv.org/abs/1309.4496 (2013).
+ Show context
23. Salah, A. A., Lepri, B., Pianesi, F. & Pentland, A. S. in International Workshop on Human Behavior Understanding (eds Salah, A. & Lepri, B.) 1–15 (Springer, 2011).
24. Decuyper, A. et al. Estimating Food Consumption and Poverty Indices with Mobile Phone Data. Technical Report (United Nations Global Pulse, New York, USA, 2014). Preprint at https://arxiv.org/abs/1412.2595 (2014).
25. Blumenstock, J. in Proceedings of 20th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) (New York, NY, USA, 2014).
26. Morone, F. & Makse, H. A. Influence maximization in complex networks through optimal percolation. Nature 524, 65–68 (2015).
27. Stiglitz, J. E. The Price of Inequality: how Today’s Divided Society Endangers our Future W. W. Norton & Company (2012).
28. Onnela, J.-P. et al. Structure and tie strengths in mobile communication networks. Proc. Natl Acad. Sci. USA 104, 7332–7336 (2007).
29. Gonzalez, M. C., Hidalgo, C. A. & Barabasi, A.-L. Understanding individual human mobility patterns. Nature 453, 779–782 (2008).
30. Eagle, N., Pentland, A. S. & Lazer, D. Inferring friendship network structure by using mobile phone data. Proc. Natl Acad. Sci. USA 106, 15274–15278 (2009).
31. Pei, S. & Makse, H. A. Spreading dynamics in complex networks. J. Stat. Mech. Theor. Exp. 2013, P12002 (2013).
32. Page, L., Brin, S., Motwani, R. & Winograd, T. The Pagerank Citation Ranking: bringing Order to the Web. Technical Report 422 (Stanford InfoLab, Palo Alto, CA, USA, 1998).
33. Kitsak, M. et al. Identification of inuential spreaders in complex networks. Nat. Phys. 6, 888–893 (2010).
34. Kempe, D., Kleinberg, J. & Tardos, É. in Proceedings of 9th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) 137–146 (Seattle, WA, USA, 2003).
35. Wildt, A. R. & Ahtola, O. Analysis of Covariance, Vol. 12 (Sage Publications, 1978).
36. Blondel, V. D., Guillaume, J.-L., Lambiotte, R. & Lefebvre, E. Fast unfolding of communities in large networks. J. Stat. Mech. Theor. Exp. 2008, P10008 (2008).
37. Newman, M. E. Analysis of weighted networks. Phys. Rev. E 70, 056131 (2004).




jueves, 5 de marzo de 2015

La red de escuchas telefónicas del caso Nisman

Las llamadas del caso Nisman

Las escuchas telefónicas del caso Nisman que se han hecho públicas fueron transformadas en una red social asociando los números entrantes y salientes.


Las líneas intervenidas se corresponde con los números 1132384699 y 1162240263 para las llamadas salientes.

http://chusmearemos.sicarul.com/#/



viernes, 17 de enero de 2014

Cómo fluye la información en las crisis

Cómo fluye la información durante emergencias
La minería de los datos del teléfono móvil de 10 millones de personas mayores de 4 años revela los sutiles cambios que se producen en el flujo de información cuando ocurre un desastre , dicen los científicos de la red.




Los teléfonos móviles han cambiado la manera como los científicos estudian la humanidad. Los registros electrónicos de estas llamadas ofrecen una visión sin precedentes de la naturaleza de la conducta humana que revela los patrones de viajes, estrategias de reproducción humana e incluso la distribución de la riqueza en el África subsahariana.

Todo ello implica seres humanos que actúan en situaciones ordinarias que han experimentado muchas veces antes. ¿Pero de que manera los seres humanos se comportan en condiciones extraordinarias, como por ejemplo durante los terremotos, conflictos armados o incidentes terroristas?

Ahora Liang Gao en la Universidad Jiaotong de Beijing en China y algunos amigos dicen los registros de teléfonos móviles ofrecen el mismo tipo de lente para el estudio de cómo los seres humanos les fue en estas condiciones extremas . En particular , dicen estos registros muestran que los patrones de comunicación, y por lo tanto la forma en que fluye la información, el cambio de formas sutiles pero importantes en situaciones de emergencia .

Los datos que Liang y coautor del estudio consta de los metadatos asociados a las llamadas de voz y textos de 10 millones de personas de más de 4 años en un país europeo no identificado. Los metadatos incluye la persona que llama y el receptor , una marca de tiempo y la ubicación de la torre que enruta la llamada .

Luego utilizaron las noticias de Google para identificar las emergencias que se produjeron en esta región durante el período objeto de examen y buscaban las llamadas realizadas cerca de estos lugares en esa época. Los expertos estudiaron a tres eventos de emergencia que Liang y co refieren a “Jet Scare”, “Plane Crash” y “Bombing”.

En particular, estudiaron el comportamiento de las comunicaciones o de dos grupos de personas . La primera consiste en la gente lo suficientemente cerca de la situación de emergencia que estar directamente influenciados por él. El segundo es el grupo de personas llamadas por el primer grupo, presumiblemente compuesta en gran parte de los amigos cercanos y familiares .

Dado que la cuestión Liang y co quieren examinar es cómo el comportamiento de la comunicación de ambos grupos cambia durante la emergencia, sino que también estudian cómo las personas se comportan en circunstancias normales, como durante un concierto.

Cuando se produce una emergencia, hay un repunte inmediato en la actividad del primer grupo , como lo llaman o texto a sus amigos y familiares acerca de la situación. Al mismo tiempo, la actividad del segundo grupo también espigas.

Eso es algo de un enigma, ya que sería razonable esperar que este aumento de la actividad a seguir el primer pico después de un breve retraso. "Es un tanto desconcertante que el cambio de volumen de llamada de [el segundo grupo de usuarios] tiene un pico, que es instantánea y muestra casi de inmediato a la subida de [el primer grupo]", dice Liang y co, que no pueden llegar a una explicación.

Más interesante, sin embargo, es lo que sucede después. Es fácil imaginar que lo primero que el grupo de amigos y parientes hacer a continuación es contactar con otras personas para difundir la noticia de que un desastre ha golpeado.

Pero en cambio, la siguiente llamada que hacen tiende a ser directamente de vuelta a la persona involucrada en la situación de emergencia . Esto es completamente diferente al comportamiento normal en el que la probabilidad de devolver una llamada es significativamente menor . De hecho , una llamada realizada durante un concierto es menos probable de lo habitual para conseguir una llamada de vuelta .

Liang y co concluyen que la necesidad de una correspondencia con los testigos es más importante que la difusión de la conciencia de la situación en caso de emergencia ". En otras palabras, el deseo de querer saber más triunfa sobre la necesidad de transmitir lo que ya saben. Al menos en situaciones de emergencia .

Esa es una nueva arruga en nuestra comprensión de los patrones de comunicación. Liang y co dicen que tiene implicaciones para la forma en que la información se propaga durante eventos extraordinarios y puede influir en la forma en que las autoridades deben responder en caso de emergencia.

Ref : arxiv.org/abs/1401.1274 : Cuantificación del flujo de información durante emergencias

MIT Technology Review

viernes, 20 de diciembre de 2013

NSA: La centralidad como herramienta de espionaje

¿Cómo la NSA hace "Análisis de Redes Sociales"?

Es como el juego de Kevin Bacon.

Por Alexander Dryer

El jueves pasado, US Today informó que la NSA ha estado recogiendo los registros telefónicos de millones de estadounidenses. La agencia está al parecer utilizando técnicas de "minería de datos" para recorrer estos registros para las conexiones entre los terroristas. De acuerdo con un funcionario de inteligencia entrevistados por US Today hoy en día, la NSA está analizando estos datos mediante "análisis de redes sociales." ¿Qué es el análisis de redes sociales?

Una técnica para cartografiar y estudiar las relaciones entre las personas o grupos. El concepto básico de la red social es familiar para cualquiera que haya usado Friendster o jugado Seis grados de Kevin Bacon. El análisis de redes sociales formaliza este juego de sociedad, utilizando los detalles sobre la red para interpretar el papel de cada persona o grupo.

En un análisis básico, las personas son vistas como "nodos" y las relaciones entre ellos son "enlaces". Mediante el estudio de la enlaces - en el caso del programa de NSA, llamadas telefónicas - es posible determinar la importancia (o "centralidad") de cada nodo .



Hay varias formas para determinar que miembros de una red son importantes. La técnica más sencilla es averiguar el "grado" de un país miembro o el número de conexiones directas que tiene con otros miembros de la red. Con los grupos son descentralizados y complejos, como las células terroristas, otras medidas de centralidad son importantes también. Los analistas de redes también estudian la "intermediación" y la "cercanía" de los miembros. Un miembro con relativamente pocas conexiones directas aún podría ser importante porque sirve como un conector entre dos grandes grupos. Un miembro también puede ser importante porque sus vínculos, directos e indirectos, lo puso más cerca de todos los demás miembros del grupo (es decir, tiene que ir a través de un menor número de intermediarios para llegar a otros miembros que cualquier otra persona).

El analista de redes Valdis Krebs propuso demostrar después del 9/11, que las redes podrían ayudar a descubrir células terroristas. Trabajando a partir de información de dominio público, Krebs mostró que los 19 secuestradores estaban dentro de dos conexiones de los miembros de Al Qaeda que la CIA conocía a principios de 2000. El mapa de terroristas de Krebs también mostró que Mohamed Atta era una figura central. No está claro si tal análisis podría haberse realizado con antelación, cuando los investigadores no habrían tenido la certeza de que los vínculos eran conexiones significativas a otro terrorista y que eran las conexiones casuales a un conocido. (También hay controversia en torno informes de que una unidad militar de EE.UU. llamada Able Danger utilizó el análisis de redes para identificar Mohamed Atta antes del 9/11.)

Hay dos escuelas de pensamiento acerca de si grandes conjuntos de datos, como la base de datos de registros de teléfono -ayuda o dificulta el análisis de la red de la NSA. Un grupo sostiene que la adición de gran cantidad de datos inocuos (las llamadas telefónicas de estadounidenses comunes y corrientes) nublan el panorama, y que es mejor para la construcción de una red de mirar sólo a las llamadas realizadas desde y hacia los terroristas conocidos. Otro grupo sostiene que grandes conjuntos de datos son útiles para establecer una "línea de base" de la conducta normal.

El análisis de redes sociales se ha utilizado en muchas áreas además de vigilancia de terroristas. El sistema de PageRank de Google se basa en la teoría de redes y el concepto de "centralidad". Los médicos utilizan el análisis de redes para rastrear la propagación del VIH. Y algunos académicos han aplicado la teoría de redes a los registros de correo electrónico de Enron en un intento de entender las relaciones dentro de la empresa.

Slate