Mostrando entradas con la etiqueta economía. Mostrar todas las entradas
Mostrando entradas con la etiqueta economía. Mostrar todas las entradas

sábado, 13 de julio de 2019

Políticas de infraestructura a través de datos de conexiones de celulares en países no desarrollados

El potencial de los datos de los teléfonos móviles para informar la planificación de la infraestructura en los países en desarrollo

Hadrien Salat, Zbigniew Smoreda, Markus Schläpfer
ArXiv





Los datos del censo de alta calidad no siempre están disponibles en los países en desarrollo. En cambio, los datos de los teléfonos móviles se están convirtiendo en un proxy para evaluar la densidad de la población, la actividad y las características sociales. Ofrecen ventajas adicionales para la planificación de la infraestructura, como la actualización en tiempo real, incluida la información de movilidad y el registro de la actividad temporal de los visitantes. Combinamos varios conjuntos de datos de Senegal para evaluar el potencial de los datos de teléfonos móviles para reemplazar datos de censos insuficientes para la planificación de infraestructura en países en desarrollo. Como un caso aplicado, probamos su capacidad para predecir con precisión el consumo doméstico de electricidad. Mostramos que, contrariamente a lo que se cree, la actividad promedio de los teléfonos móviles no está bien correlacionada con la densidad de población. Sin embargo, puede proporcionar mejores estimaciones de consumo de electricidad que los datos del censo básico. Más importante aún, utilizamos con éxito las técnicas de agrupación de redes y curvas para mejorar la precisión de las predicciones, recuperar un buen potencial de mapeo de la población y reducir la recopilación de datos informativos para la planificación a muestras sustancialmente más pequeñas.


miércoles, 20 de febrero de 2019

Big Data sobre Linkedin: Flujos de migración laboral revelan el mercado laboral mundial

La red de flujo de trabajo global revela la organización jerárquica y la dinámica de los clusters geoindustriales en la economía mundial

Jaehyuk Park, Ian Wood, Elise Jing, Azadeh Nematzadeh, Souvik Ghosh, Michael Conover, Yong-Yeol Ahn





Los grupos de empresas a menudo logran una ventaja competitiva a través de la formación de agrupaciones geoindustriales. Aunque muchos grupos ejemplares, como Hollywood o Silicon Valley, se han estudiado con frecuencia, los enfoques sistemáticos para identificar y analizar la estructura jerárquica de los grupos geoindustriales a escala global son raros. En este trabajo, utilizamos las historias de empleo de LinkedIn de más de 500 millones de usuarios a lo largo de 25 años para construir una red de flujo de mano de obra de más de 4 millones de empresas en todo el mundo y aplicar un algoritmo recursivo de detección de comunidades de redes para revelar la estructura jerárquica de los clústeres geoindustriales. Mostramos que los grupos geoindustriales resultantes muestran una asociación más fuerte entre la afluencia de trabajadores educados y el desempeño financiero, en comparación con las unidades de agregación existentes. Además, nuestro análisis adicional de los conjuntos de habilidades de trabajadores educados complementa la relación entre el flujo laboral de trabajadores educados y el crecimiento de la productividad. Argumentamos que las agrupaciones geoindustriales definidas por el flujo de trabajo proporcionan una mejor comprensión del crecimiento y el declive de la economía que otras unidades económicas comunes.

viernes, 8 de febrero de 2019

Redes de coautorías de economistas argentinos en un congreso principal

Redes de coautorías de economistas argentinos

Author(s):
Juan M.C. Larrosa , (Universidad Nacional del Sur, Bahia Blanca, Argentina and Instituto de Investigaciones Económicas y Sociales del Sur (IIESS), Altos de Palihue Bahia Blanca, Argentina)


Propósito

Este documento tiene como objetivo proporcionar información sobre la estructura del trabajo colaborativo entre las economías argentinas. El estudio proporciona investigación aplicada específica de análisis de redes sociales centrada en esta profesión en este país específico.

Diseño / metodología / enfoque

La contribución optó por aplicar herramientas de análisis de redes sociales a los documentos presentados en un congreso y publicados en sus actas. Los autores se centran en la detección de actores principales, grupos de coautoría, profesionales que actúan como puentes entre grupos y diferencias entre los géneros.


Recomendaciones

El documento proporciona información empírica sobre cómo ha evolucionado la coautoría entre los economistas argentinos. Los autores encuentran que las propiedades estructurales de la red, los principales actores, tanto hombres como mujeres, las principales universidades o el centro que los afilia, una brecha de género que podría estar cerrando.

Limitaciones / implicaciones de la investigación

El documento se centra en la red para el período 1964-2014 sin una dinámica más detallada. Tampoco explica los principales temas trabajados por los autores.


Implicaciones prácticas

El trabajo proporciona conocimiento sobre cómo se crean los grupos en Economía en Argentina, cómo ha evolucionado la cooperación y cuál ha sido el papel de las mujeres en este desarrollo. También muestra cómo diferentes departamentos y entidades colaboran con éxito diverso en la creación de nuevos conocimientos en Economía en Argentina.

Originalidad / valor

El documento trabaja con datos de una fuente de información no estudiada anteriormente y contribuye a explicar un tipo particular de trabajo colaborativo en una profesión en Argentina.



Juan M.C. Larrosa, (2019) "Coauthorship networks of Argentine economists", Journal of Economics, Finance and Administrative Science, https://doi.org/10.1108/JEFAS-06-2018-0062


domingo, 30 de diciembre de 2018

Redes, enfermedades y la difusión de innovaciones para el crecimiento económico

Crecimiento, enfermedad y el toque personal.

Las conexiones sociales conducen a un mayor crecimiento económico a través de la difusión de la tecnología. Pero las redes también propagan patógenos, con efecto contrario.

Douglas Clement | Federal Reserve Bank of Minneapolis



"La difusión de una innovación se convierte en un proceso formalmente similar a la propagación de una enfermedad infecciosa".
Premio Nobel Kenneth Arrow


Si no hemos aprendido nada más de las redes sociales, es que las redes transmiten el bien y el mal. Las redes sociales desempeñan un papel similarmente ambivalente en la economía. Al difundir ideas y tecnología, las redes ayudan a transformar las economías de subsistencia a prosperidad. Pero las conexiones sociales también propagan enfermedades, desde el resfriado común hasta el ébola endémico.

Las interacciones de la enfermedad, el ingreso, la innovación y las redes son multidireccionales. La tecnología puede proteger y curar con mejores medicamentos y dispositivos médicos. La enfermedad generalizada reduce el crecimiento económico al perjudicar la productividad. Las redes están conformadas por la tecnología y la enfermedad. Crecen a través de nuevos métodos de transporte y comunicación. Pero para sobrevivir al contagio, las sociedades pueden restringir las redes para reducir la transmisión de enfermedades; la cuarentena es un claro ejemplo.

Comprender cómo las redes afectan el progreso tecnológico y el crecimiento económico es, por lo tanto, un intrincado rompecabezas, acosado por los desafíos de la causalidad inversa. Pero "Germs, Social Networks, and Growth", un informe reciente del personal (SR572) de Alessandra Fogli, directora asistente de investigación de desigualdad y asesora monetaria de la Fed de Minneapolis, y Laura Veldkamp de la Universidad de Columbia ofrece una solución elegante: desenmarañamiento de enfermedades, desarrollo , y datos demográficos y proporciona un modelo analítico que cuantifica el efecto de las redes en el ingreso nacional, pero también explica por qué las sociedades adoptan estructuras que inhiben el crecimiento.
Al difundir ideas y tecnología, las redes ayudan a transformar las economías de subsistencia a prosperidad. Pero las conexiones sociales también propagan enfermedades, desde resfriados hasta ébola.

Su modelo muestra que las pequeñas diferencias iniciales en el entorno epidemiológico de una nación (tasas de enfermedad o capacidad de contagio) pueden dar lugar a grandes y persistentes diferencias en la estructura de la red que, a su vez, generan niveles muy diferentes de difusión tecnológica y de producción económica. Cambiar la red social de una nación puede aumentar su productividad y crecimiento hasta en un 100 por ciento, según sus estimaciones. Pero si se hace en un entorno de alta enfermedad, el crecimiento se verá afectado por una propagación paralela de la enfermedad.

"En general, las redes sociales han evolucionado para adaptarse a su entorno económico y epidemiológico", escriben Fogli y Veldkamp. "Tratar de cambiar las redes en un país para imitar a las de un país con ingresos más altos puede ser contraproducente".

Un modelo evolutivo

El núcleo de su investigación es un modelo de difusión de red, un marco que les permite medir el efecto de las redes en el crecimiento. Las redes sociales tienen innumerables dimensiones; los economistas se centran en aquellos que son medibles y que median la difusión de la tecnología, pero también responden a la enfermedad. En este modelo, las redes gobiernan la propagación de enfermedades y tecnologías, pero, inversamente, las enfermedades y las tecnologías influyen en la evolución de las redes.

Las variables explicativas clave del modelo, entonces, son la prevalencia de la enfermedad, la adopción de tecnología y la difusión en red. Los datos nacionales para la prevalencia de enfermedades transmisibles son relativamente fáciles de obtener. Medidas de adopción de tecnología también están disponibles. Una métrica para redes sociales es más problemática. Los economistas desarrollan un índice a partir de tres elementos: movilidad, cantidad de vínculos sociales en ubicaciones a distancia; grado, número de conexiones personales cercanas; e individualismo / colectivismo, el nivel de agrupación de una sociedad. ¿Las conexiones personales son compartidas o independientes? ¿Los amigos tienden a tener un amigo mutuo?

Reuniendo datos sobre estas variables para 71 países y calibrando el modelo, Fogli y Veldkamp miden la relación entre la difusión de la red y el ingreso nacional. Encuentran, como se esperaba, una correlación muy alta. "Las fuerzas del modelo pueden explicar conjuntamente las grandes diferencias en los ingresos entre los países", escriben.

Un "experimento político"

Pero la estrecha correlación entre la difusión y el ingreso podría deberse a otros factores, en particular, el impacto de la enfermedad en ambos. Para aislar el papel causal de la difusión de la red, los economistas intentan, en esencia, un experimento político: mantener constante el entorno de la enfermedad, variar el nivel de difusión de la red y ver qué sucede con el crecimiento económico. (Todos los experimentos incluyen dos efectos de retroalimentación: sobre la innovación a medida que aumentan las tasas de infección y sobre la probabilidad de infección a medida que mejora la tecnología).

Su punto de referencia es Estados Unidos, que tiene una prevalencia de enfermedades muy baja (0.05 por ciento para las enfermedades transmisibles). En este entorno, encuentran, las redes de alta difusión tienen un impacto fuertemente positivo en el crecimiento económico. Duplicar el número de individuos altamente móviles o conectados eleva sustancialmente las tasas de crecimiento.
Cambiar la red social de una nación puede aumentar su productividad hasta en un 100 por ciento. Pero en un entorno de alta enfermedad, el crecimiento se verá afectado por una propagación paralela de la enfermedad.

Pero en un entorno de alta enfermedad (utilizando la prevalencia del 18 por ciento de Ghana), la alteración de la red social para facilitar una difusión más rápida reduce el ingreso nacional. Duplicar el número de individuos altamente conectados causa que la producción caiga en un 90 por ciento.

"La conclusión es que la forma en que las redes afectan el crecimiento económico depende del entorno de la enfermedad", escriben los economistas. Las redes de alta difusión propagan patógenos y empobrecen a las naciones en las que prevalece la enfermedad. En las naciones con baja enfermedad, las redes difusas tienen menos patógenos para propagarse. Las ideas se vuelven virales, no gérmenes. “Las mismas redes que empobrecen a los países pobres pueden facilitar el crecimiento de los ricos donde las epidemias son raras. Para prosperar, cada país necesita una red social que esté bien adaptada a su entorno ".

Orígenes de la red

La consulta principal de Fogli y Veldkamp es, según lo expresan, "sobre el efecto, no el origen, de las redes". Pero comprender cómo las redes emergen y evolucionan en respuesta a la enfermedad es clave para apreciar por qué la modificación de las redes puede ser peligrosa. En un ejercicio separado, los economistas, por lo tanto, realizan simulaciones por períodos múltiples de dos economías idénticas que varían solo en sus tasas iniciales de prevalencia de la enfermedad.

En entornos de baja enfermedad, las simulaciones generan redes de alta difusión porque los individuos conectados, independientes y móviles prosperan. Están expuestos a más ideas nuevas y disfrutan de mayores ingresos y mayores tasas de reproducción. "En entornos de baja enfermedad, las características de la red de alta difusión prosperan".
“Las redes que empobrecen a los países pobres pueden facilitar el crecimiento de los ricos donde las epidemias son raras. Para prosperar, cada país necesita una red social ... adaptada a su entorno ".

Pero en entornos de alta enfermedad, ocurre lo contrario: las personas con más amigos, mayor movilidad y mayor independencia se enferman rápidamente. "También pueden obtener nuevas ideas", observa Fogli y Veldkamp. Pero si están enfermos, son "improductivos, independientemente de [su] tecnología. Uno tiene que estar vivo y bien ser productivo ".

Entonces, nuevamente, cuando la enfermedad es común, alterar las redes puede ser una mala idea: “Cambiar la red sin cambiar el entorno de la enfermedad puede ser desastroso. Una red de alta difusión, en un lugar donde prevalecen las enfermedades, es una receta para las epidemias y las crisis humanitarias ".

Confirmación desde un segundo método.

Los economistas evalúan los hallazgos de su modelo mediante el uso de un segundo método, una técnica llamada "estimación de variables instrumentales". Emplea análisis de regresión con variables relacionadas con redes, enfermedades, tecnología y crecimiento, pero que no sufren la causalidad inversa inherente a su modelo. Con datos sobre nueve enfermedades transmisibles en 160 países, miden la diferencia en la prevalencia de las enfermedades transmitidas por los seres humanos y las transmitidas por los animales. Estas enfermedades tienen un impacto similar en la difusión de la tecnología, pero difieren en relación con las redes sociales, por lo que la causalidad inversa no es un problema.

Los hallazgos son tranquilizadores. Los resultados del conjunto completo de países muestran que el aumento del nivel de difusión de la red aumenta considerablemente la productividad de los trabajadores y el PIB per cápita. Pero dividir la muestra entre países con enfermedad alta y países con enfermedad baja "sugiere un mensaje más sutil que refleja los resultados del modelo", observan Fogli y Veldkamp. Como su método principal indica, los efectos de red difieren. "El efecto positivo de las redes sociales solo aparece en los países con baja prevalencia de enfermedad". Por lo tanto, las políticas para implementar redes sociales de alta difusión serían poco recomendables en los países donde las enfermedades contagiosas son comunes.

domingo, 29 de abril de 2018

Redes sociales, movilidad laboral y economía urbana

Movilidad laboral, redes sociales y crecimiento económico en las ciudades


Center for Network Research

El 30 de octubre, el orador invitado en la serie de seminarios CNS fue Balázs Lengyel, quien dio una charla sobre "Movilidad laboral, redes sociales y crecimiento económico en las ciudades"(Labor Mobility, Social Networks and Economic Growth in Cities). Balázs es investigador en el Instituto de Economía de la Academia Húngara de Ciencias, donde dirige el Grupo de Investigación Lendület de Agglomeration and Social Networks.

Balázs comenzó su charla con una revisión de algunos estudios de economistas urbanos donde el argumento principal es que la población mundial se concentra en áreas metropolitanas porque las empresas y los individuos se benefician compartiendo bienes (infraestructura, educación superior, etc.), hay una mejor correspondencia en los mercados laborales , y aprender de los compañeros ocurre en las ciudades. Sin embargo, hay poco conocimiento sobre el aprendizaje entre empresas a través de los vínculos sociales en entornos urbanos y cómo las redes sociales colaborativas influyen en el éxito urbano.

Durante la charla, Balázs mostró, con evidencia empírica, cómo el movimiento de individuos entre empresas crea nuevos vínculos sociales y tiene dos efectos: (1) un efecto directo, cuando los nuevos empleados aportan nuevos conocimientos a la empresa, transfiriendo habilidades nuevas pero relacionadas tecnológicamente el espacio del producto, y (2) un efecto indirecto, con colegas anteriores que tienden a continuar comunicándose y en algunos casos trabajando juntos.


Red de relación de habilidades de industrias de cuatro dígitos. Figura de: Zsolt Csafordi & Laszlo Lorincz & Balazs Lengyel & Karoly Miklos Kiss, 2016. "Derrames de productividad a través de los flujos laborales: el efecto de la brecha de productividad, las empresas de propiedad extranjera y la relación con las habilidades", IEHAS Discussion Papers 1610, Institute of Economics , Centro de Estudios Económicos y Regionales, Academia Húngara de Ciencias. https://ideas.repec.org/p/has/discpr/1610.html

Uno de los efectos directos que se pueden observar en la movilidad laboral es el aumento en el rendimiento de las empresas receptoras, a medida que más nuevos empleados van a una empresa, la productividad aumenta. Sin embargo, para hacerlo, es necesario contar con una red de colaboración cohesiva dentro de la empresa para explotar los nuevos conocimientos aportados a la empresa.

Por último, Balázs argumentó que el efecto de la movilidad de los trabajadores sobre la productividad regional no es sencillo: necesita crear vínculos sociales entre las empresas para estimular el crecimiento.

Trabajos relaciones de Balazs Lengyel


  • Balázs Lengyel, Rikard H. Eriksson; Co-worker networks, labour mobility and productivity growth in regions, Journal of Economic Geography, Volume 17, Issue 3, 1 May 2017, Pages 635–660, https://doi.org/10.1093/jeg/lbw027
  • Zsolt Csafordi & Laszlo Lorincz & Balazs Lengyel & Karoly Miklos Kiss, 2016. "Productivity spillovers through labor flows: The effect of productivity gap, foreign-owned firms, and skill-relatedness," IEHAS Discussion Papers 1610, Institute of Economics, Centre for Economic and Regional Studies, Hungarian Academy of Sciences. https://ideas.repec.org/p/has/discpr/1610.html


miércoles, 7 de marzo de 2018

Qué algoritmo sobre o subajusta cuando se buscan comunidades en redes

Evaluación del sobreajuste y el subajuste en modelos de estructura de comunidad de red

Amir Ghasemian, Homa Hosseinmardi, Aaron Clauset
(Presentado el 28 de febrero de 2018)
arXiv:1802.10582 [stat.ML]


Una tarea común de minería de datos en redes es la detección de comunidades, que busca una descomposición no supervisada de una red en grupos estructurales basada en regularidades estadísticas en la conectividad de la red. Aunque existen muchos métodos, el teorema de No Free Lunch para la detección de comunidades implica que cada uno realiza algún tipo de compensación, y ningún algoritmo puede ser óptimo en todas las entradas. Por lo tanto, diferentes algoritmos superarán o subestimarán las diferentes entradas, encontrando más, menos o solo comunidades diferentes de lo que es óptimo, y los métodos de evaluación que usan una partición de metadatos como verdad fundamental producirán conclusiones engañosas sobre la precisión general. Aquí, presentamos una amplia evaluación de sobreequipamiento en la detección de comunidades, comparando el comportamiento de 16 algoritmos de detección de comunidades de vanguardia en un corpus novedoso y estructuralmente diverso de 406 redes del mundo real. Encontramos que (i) los algoritmos varían ampliamente tanto en el número de comunidades que encuentran como en su composición correspondiente, dado el mismo aporte, (ii) los algoritmos se pueden agrupar en grupos de alto nivel basados ​​en las similitudes de sus resultados en realidades. las redes mundiales, y (iii) estas diferencias inducen una amplia variación en la precisión de las tareas de predicción de enlaces y descripción de enlaces. Presentamos un nuevo diagnóstico para evaluar el sobreajuste y el ajuste insuficiente en la práctica, y lo utilizamos para dividir aproximadamente los métodos de detección de la comunidad en algoritmos de aprendizaje general y especializado. En todos los métodos e insumos, las técnicas bayesianas basadas en el modelo de bloques estocásticos y un enfoque de longitud de descripción mínima para la regularización representan el mejor enfoque general de aprendizaje, pero pueden superarse en circunstancias específicas. Estos resultados introducen un enfoque basado en principios teóricos para evaluar el exceso y el insuficiente ajuste en los modelos de la estructura de la red comunitaria y un punto de referencia realista mediante el cual se pueden evaluar y comparar nuevos métodos.



jueves, 1 de marzo de 2018

Entrevista a Aaron Clauset: Aprendizaje automático, economía y genes

Ciencia de redes: el campo oculto detrás del aprendizaje automático, la economía y la genética de la que nunca habrás oído hablar (probablemente): una entrevista con el Dr. Aaron Clauset [Parte 1]

Por Amy Hodler, Gerente del Programa de Analítica
Blog Neo4j


Recientemente tuve la oportunidad de combinar trabajo y placer y reunirme con el Dr. Aaron Clauset, un experto en ciencia de redes, ciencia de datos y sistemas complejos. En 2016, Clauset ganó el Premio Erdos-Renyi en Network Science, pero es posible que esté más familiarizado con su investigación anterior sobre leyes eléctricas, predicción de enlaces y modularidad.

El Dr. Clauset dirige el grupo de investigación que desarrolló la referencia del conjunto de datos ICON (si está buscando datos de red para evaluar, marque esto ahora) y ha publicado recientemente investigaciones que arrojan luz sobre posibles conceptos erróneos sobre estructuras de red. Cuando apareció un viaje de negocios de última hora a Denver, hice el viaje a Boulder, donde Clauset es profesor asistente de ciencias de la computación en la Universidad de Colorado en Boulder.



El Dr. Aaron Clauset es Profesor Asistente de Ciencias de la Computación en la Universidad de Colorado en Boulder y en el Instituto BioFrontiers. También es parte de la facultad externa en el Instituto Santa Fe (para estudios de complejidad).

Entre el almuerzo y la próxima clase de Clauset, hablamos sobre la investigación reciente de su grupo y la dirección general de la ciencia de la red, y me fui con una superposición de desilusión y entusiasmo. El Laboratorio Clauset ha estado trabajando para ampliar la diversidad y el rigor de estudiar sistemas complejos y, al hacerlo, pueden desmantelar algunas creencias que datan de los años 90. (Debería haber sabido que no sería simple, estamos hablando de sistemas complejos después de todo).

Esto le importa a la comunidad gráfica de Neo4j porque cualquier persona que analice las redes, especialmente si buscan atributos globales, necesita comprender la estructura y la dinámica subyacente. A continuación se encuentra un resumen de nuestra discusión.

¿En qué tipo de trabajo se enfoca su equipo?

Clauset: Mi grupo de investigación en CU Boulder actualmente incluye cinco Ph.D. estudiantes, junto con algunos maestros y varios estudiantes universitarios. Nuestra investigación se centra tanto en el desarrollo de nuevos métodos computacionales para la comprensión de conjuntos de datos complicados y desordenados, como en la aplicación de estos métodos para resolver problemas científicos reales, principalmente en entornos biológicos y sociales.

En el grupo, todos están involucrados en la investigación de alguna manera. Por ejemplo, el sitio web ICON (índice de redes complejas) fue construido por un par de estudiantes de licenciatura para aprender conceptos de redes y explorar herramientas.

Las redes son una de nuestras áreas de trabajo clave. Las redes son en realidad solo una representación, una herramienta para comprender sistemas complejos. Representamos cómo funciona un sistema social al pensar en las interacciones entre pares de personas. Al analizar la estructura de esta representación, podemos responder preguntas sobre cómo funciona el sistema o cómo se comportan las personas dentro de él. En este sentido, la ciencia de la red es un conjunto de herramientas técnicas que se pueden aplicar a casi cualquier dominio.

Las redes también actúan como un puente para comprender cómo las interacciones y dinámicas microscópicas pueden conducir a regularidades globales o macroscópicas. Pueden hacer un puente entre lo micro y lo macro porque representan exactamente qué cosas interactúan entre sí. Solía ​​ser común suponer que todo interactúa con todo, y sabemos que eso no es verdad; en genética, no todos los pares de personas y no todos los pares de genes interactúan entre sí.

Tomado de “Hierarchical structure and the prediction of missing links in networks
Un esfuerzo extremadamente importante en la ciencia de redes es descubrir cómo la estructura de una red da forma a la dinámica de todo el sistema. En los últimos 15 años hemos aprendido que para muchos sistemas complejos, la red es increíblemente importante para configurar lo que les sucede a los individuos dentro de la red y cómo evoluciona todo el sistema.

El trabajo de mi grupo se centra en caracterizar la estructura de estas redes para que podamos comprender mejor cómo la estructura finalmente da forma a la función.

¿Hay puntos en común entre los diferentes tipos de redes?

Clauset: A fines de la década de 1990 y principios de la década de 2000, mucha energía en la conducción de la ciencia de redes provino de los físicos, que aportaron nuevas herramientas matemáticas, modelos y muchos datos nuevos. Una idea que popularizaron fue la hipótesis de que los patrones "universales" ocurrieron en redes de todo tipo: redes sociales, biológicas, tecnológicas, de información e incluso económicas, y que fueron impulsadas por un pequeño número de procesos fundamentales.

Este tipo de idea era bastante normal en una parte de la física. Por ejemplo, hay un modelo matemático universal de cómo funciona un imán que hace predicciones notablemente precisas sobre imanes reales de todo tipo.

El sueño de las redes era mostrar que lo mismo se podía hacer por ellos: que todos los diferentes tipos de redes podían explicarse mediante un pequeño conjunto de principios o procesos matemáticos básicos, o que caían en un pequeño número de categorías estructurales generales. Es una idea bastante poderosa e inspiró tanto un trabajo multidisciplinario realmente bueno como varias afirmaciones altamente provocativas.



La validez de algunas de las afirmaciones más audaces ha sido difícil de evaluar empíricamente porque requirió el uso de un conjunto grande y diverso de redes del mundo real para probar la "universalidad" empírica del patrón. Reunir un conjunto de datos de este tipo es parte de lo que nos llevó a armar el índice de redes complejas, lo que llamamos el índice ICON.

Aunque todavía estamos expandiéndolo, mi grupo ya ha comenzado a revisar muchas de las afirmaciones iniciales sobre patrones universales en redes, incluida la idea de que "todas las redes están libres de escalas", o que solo las redes sociales tienen una alta densidad triangular, o que las redes se agrupan en "superfamilias" basadas en el patrón de su estructura local. Sorprendentemente, muchas afirmaciones sobre la estructura de las redes se han repetido una y otra vez en la literatura, pero no han sido escrutadas cuidadosamente con datos empíricos.

Resulta que muchos de estos patrones universales se desmoronan cuando se puede mirar a través de una gran variedad de redes. El reciente artículo de Kansuke Ikehara [Characterizing the structural diversity of complex networks across domains] plantea una pregunta simple: si etiqueto una gran cantidad de redes de dónde provienen (por ejemplo, una red de transporte / carretera, una red social / en línea o una red metabólica / biológica) ¿puede utilizar el aprendizaje automático para descubrir qué características distinguen a estas clases de redes?

La diversidad estructural de las redes complejas. Si hay algunas "familias" de estructuras de red, entonces ningún algoritmo debería ser capaz de aprender a distinguir las diferentes redes dentro de una familia. En cambio, lo que encontramos fue que prácticamente todas las clases de redes se distinguían fácilmente de las demás clases.


Las redes sociales se agrupan en una parte del espacio de características, las redes biológicas generalmente están bien separadas de aquellas, etc., y esto es cierto para cada clase de red que examinamos. El claro mensaje para llevar a casa es que hay mucha más diversidad en las estructuras de red de lo que pensamos hace 20 años, y por lo tanto, mucho más trabajo por hacer para comprender de dónde viene esta diversidad.

La investigación de Ikehara reveló la diversidad estructural oculta de las redes y sugiere que puede haber menos patrones universales de lo que alguna vez se pensó. Al mismo tiempo, algunos grupos de redes están más cerca unos de otros en términos de su estructura.

Por ejemplo, encontramos que las redes de distribución de agua exhiben firmas estructurales similares a las redes miceliales fúngicas, lo que sugiere que pueden estar formadas por procesos subyacentes similares o problemas de optimización. De esta forma, el aprendizaje automático puede ayudarnos a identificar semejanzas estructurales y, por lo tanto, a ayudarnos a descubrir, de una manera basada en datos, dónde es más probable que encontremos una explicación mecánica común.

¿Cómo está evolucionando la ciencia de la red?

Clauset: En muchos sentidos, la ciencia de redes hoy se está diversificando y expandiendo. Esta expansión permite una gran especialización, pero hay una compensación. Ahora las personas pueden tomar métodos de red y aplicarlos en preguntas realmente específicas sobre sistemas realmente específicos.

Esto es enormemente productivo y un logro emocionante para la ciencia de redes. Pero, el crecimiento del trabajo disciplinario alrededor de las redes también significa que hay relativamente menos trabajo que cruza los límites disciplinarios. Sin espacios compartidos donde personas de diferentes dominios se reúnan para hablar sobre sus avances, las personas que trabajan en un tipo de problema tienen menos probabilidades de exponerse a ideas potencialmente notables en un área diferente.

Claro, muchas ideas sobre economía no se aplicarán a las redes biológicas, pero algunas lo harán, y si los economistas y los biólogos nunca se comunican entre sí, nunca lo sabremos. Si no hay un terreno común, habrá una gran cantidad de reinvención y retrasos, incluso años para que los métodos en un dominio pasen a otro.

Es por eso que creo que es muy importante estudiar y reunirse para debatir sobre las redes en general. Este tipo de fervor interdisciplinario es otra cosa que los físicos y los informáticos ayudaron a poner en marcha hace unos 20 años; eran principalmente físicos y científicos informáticos que transmitían "también podemos hacer sociología, política y ecología".

Esa actitud ciertamente molestó a algunas personas, especialmente a los sociólogos que ya habían estado haciendo redes durante 80 años, pero también generó un enorme y amplio interés en las redes de prácticamente todas las ciencias. Ahora, las diferentes áreas disciplinarias de la ciencia de las redes crecen tan rápido que, de alguna manera, el centro -encrucijada donde las ideas pueden saltar entre los campos- se está reduciendo de manera efectiva.

¿Cómo puede la ciencia de redes fomentar una mayor colaboración entre dominios?

Clauset: Tener un evento real que sirva como una encrucijada entre dominios donde las personas pueden presentarse e interactuar es esencial. En muchos sentidos, la Conferencia Internacional sobre Ciencia de Redes está tratando de hacer eso, pero se esfuerza por sacar a los investigadores de sus dominios y colocarlos en el medio, ya que las diferentes disciplinas tienen diferentes preguntas generales. Creo que siempre que algunos expertos en dominios de diferentes campos lleguen a la encrucijada para hablar e interactuar, las buenas ideas eventualmente se extenderán.

Continuar con este esfuerzo interdisciplinario será una parte clave para continuar el avance de la ciencia de redes. Pero no todos los esfuerzos deben ser interdisciplinarios. De hecho, las disciplinas son esenciales para ayudar a enfocar nuestra atención colectiva.

No estoy seguro de cuál es el equilibrio correcto entre el trabajo disciplinario y el interdisciplinario, pero para mí las ideas interdisciplinarias son las más interesantes. Si el trabajo sobre estos no está financiado y respaldado a niveles decentes, seguramente no abordaremos muchas de las ideas más importantes de la sociedad porque son las que abarcan diferentes disciplinas.

Por ejemplo, la ciberseguridad no es solo un problema técnico, ya que los humanos tienen un terrible historial de escritura de software libre de errores. La seguridad real requiere componentes legales, componentes sociales, componentes éticos, componentes económicos y probablemente más para desarrollar una solución duradera.

De hecho, si elige cualquier problema que afecte a una porción decente de la población, entonces seguramente se trate de un problema interdisciplinario que requerirá un enfoque interdisciplinario para comprender y resolver.

Conclusión

Como puede ver, tuvimos una gran discusión sobre cómo están cambiando algunas de las ideas preconcebidas sobre las redes. La próxima semana, en la segunda parte de esta serie, resumiré nuestra inmersión más profunda en algunos de los avances y temas emergentes en la ciencia de redes.

jueves, 1 de febrero de 2018

Influencia de las redes sociales en el precio de las viviendas

Redes sociales y mercados de vivienda

Michael Bailey, Ruiqing Cao, Theresa Kuchler, Johannes Stroebel
Documento de trabajo NBER No. 22258
Emitido en mayo de 2016



Documentamos que las experiencias recientes de precios de la vivienda dentro de la red social de un individuo afectan sus percepciones sobre el atractivo de las inversiones inmobiliarias y, a través de este canal, tienen grandes efectos en su actividad en el mercado de la vivienda. Nuestros datos combinan información de redes sociales anónima de Facebook con datos de transacciones de vivienda y una encuesta. Primero mostramos que en la encuesta, las personas cuyos amigos geográficamente distantes experimentaron mayores aumentos recientes en el precio de la vivienda consideran que la propiedad local es una inversión más atractiva, con mayores efectos para las personas que regularmente discuten dichas inversiones con sus amigos. Con base en estos hallazgos, presentamos una nueva metodología para documentar los grandes efectos de las expectativas del mercado de la vivienda en las decisiones de inversión de vivienda individual y los resultados agregados del mercado de la vivienda. Nuestro enfoque explota de manera plausible la variación exógena en las experiencias recientes de precios de la vivienda de amigos geográficamente distantes de individuos como cambiantes de las expectativas del mercado de vivienda local de esos individuos. Las personas cuyos amigos experimentaron un incremento de 5 puntos porcentuales en el precio de la vivienda en los últimos 24 meses (i) tienen 3.1 puntos porcentuales más de probabilidades de pasar de alquilar a ser propietarios en un período de dos años, (ii) comprar una casa 1.7 por ciento más grande, ( iii) pagar un 3,3 por ciento más por una casa determinada, y (iv) hacer un pago inicial un 7% más grande. De manera similar, cuando los amigos de los propietarios experimentan cambios de precios de la vivienda menos positivos, es más probable que estos propietarios se vuelvan inquilinos y más propensos a vender sus propiedades a un precio menor. También encontramos que cuando las personas observan una mayor dispersión de las experiencias de precios de la vivienda entre sus amigos, esto tiene un efecto negativo en sus inversiones de vivienda. Finalmente, mostramos que estas respuestas a nivel individual se agregan para afectar los precios de la vivienda a nivel del condado y el volumen de negociación. Nuestros hallazgos sugieren que las experiencias de precios de la vivienda de amigos distantes geográficamente podrían proporcionar un instrumento válido para el crecimiento del precio de la vivienda local.

sábado, 18 de noviembre de 2017

¿Por qué las mujeres economistas quedan rezagadas?

Esta es la razón por la que las economistas no están siendo reconocidas




Un oficinista con una bolsa de compras se refleja en el techo de un edificio en el centro de Sídney el 5 de febrero de 2013. REUTERS / Daniel Muñoz (AUSTRALIA - Tags: IMÁGENES DE BUSINESS TPX DEL DÍA) - GM1E9250X6201 En 2016, menos del 15% de todos los profesores de economía eran mujeres. Imagen: REUTERS / Daniel Muñoz


Michael E. Rose
Candidato a Doctor en Economía, Universidad de Ciudad del Cabo
World Economic Forum

Cuando se trata del éxito académico, las mujeres científicas están, en promedio, generalmente detrás de sus homólogos masculinos. Reciben la titularidad académica con menos frecuencia y ganan menos premios.

Esta brecha de género también existe en la disciplina académica de la economía. En 2016, menos del 15% de todos los profesores de economía eran mujeres.

Los datos que he recopilado y con los que trabajé durante mi doctorado muestran que las mujeres también son menos importantes en la red social de colaboración informal. Esto se refiere al proceso entre los académicos de proporcionar comentarios y ayudar a otros autores a mejorar su trabajo a través de comentarios y compromisos. Tales redes permiten el flujo global de conocimiento, que es crucial para la investigación.

Mi información sugiere que las actitudes de los hombres podrían ser parte de lo que impide que las mujeres en un subcampo de la economía ocupen una posición central en la red social de colaboración informal.

Menos mujeres

Los datos se centran en la economía financiera, el campo que se ocupa de las crisis financieras, la inflación, la banca y las finanzas corporativas.

El conjunto de datos contiene 14,529 investigadores cuyos nombres aparecen en artículos de investigación publicados en revistas de economía financiera importantes entre 1997 y 2011. Son autores, comentaristas reconocidos o ambos. Un comentarista reconocido es una persona que asesoró a los autores y ayudó a guiar o informar su pensamiento; su asistencia se anota en la sección de agradecimientos de cualquier artículo o libro de revista.

A lo largo de todos los años, solo el 18% de los autores son mujeres. Esta disparidad solo entre autores masculinos y femeninos ejemplifica la brecha de género. También es sorprendente que las mujeres comentaristas solo representen el 11% del total. Esto significa que los autores no recurren regularmente a las mujeres economistas para obtener asesoramiento.

Esta baja proporción de mujeres comentaristas y autores es problemática por dos razones. El primero es la falta de diversidad. El gobernador de la Reserva Federal de los Estados Unidos, Lael Brainard, reiteró recientemente por qué la diversidad es tan valiosa: ayuda a generar mejores ideas.

El segundo se relaciona con el rol que desempeña la colaboración informal en la red social de economía financiera como disciplina académica. Las personas intercambian información sobre conferencias, visitas en otras instituciones o llamadas telefónicas. Esta información incluye información sobre resultados no publicados, tendencias emergentes, nuevas ideas, conjuntos de datos prometedores y más. Hoy en día un investigador debe estar activo incluso antes de que se publique su investigación. Por eso es importante ser parte de la conversación.

Aquellos que no son centrales para tales redes (en el caso de mi investigación y datos, mujeres) tienen menos probabilidades de recibir información relevante que aquellos que ejercen una gran influencia: los hombres. Ellos quedan fuera de la conversación.

Una hipótesis estándar es que las mujeres establecen redes de manera diferente, y con menos eficacia, que los hombres. Existe evidencia anecdótica de que las mujeres evitan el trabajo en red por varias razones. Una es que las mujeres a menudo son menos seguras de sí mismas, piensan que su trabajo hablará por su competencia y que no se necesita publicidad.

Mis datos me permitieron probar, y desaprobar, esta hipótesis. Los agradecimientos nos dicen mucho sobre el comportamiento de redes, porque los autores también usan esta parte de un artículo para enumerar conferencias y seminarios en las universidades donde presentaron su investigación.


Como muestra esta figura, mis datos revelan que los artículos escritos solo por mujeres muestran una colaboración más informal por autor que los escritos exclusivamente por hombres. Un grupo de autoras, en promedio, presenta su artículo con más frecuencia y habla con más personas que un grupo de autores masculinos o un grupo de autores de género mixto.

Entonces, el problema no es que las mujeres tengan menos redes. En cambio, se conectan más. ¿Por qué, entonces, se los reconoce con menos frecuencia?

A las mujeres no se les pide consejo


Mis datos muestran que los autores masculinos, en promedio, no están pidiendo consejos a las mujeres o no están reconociendo el consejo que reciben de las mujeres. Esta podría ser una de las razones por las cuales las mujeres participan menos en las enredadas redes de investigación líderes en el mundo.

No sabemos en este momento por qué los hombres reconocen a las mujeres con menos frecuencia. Una explicación plausible es la actitud más amplia de los hombres hacia las mujeres en la sociedad y en el trabajo. Los estudios sobre las mujeres en el lugar de trabajo sugieren que los hombres perciben a las mujeres como menos creativas o que las mujeres tienen que trabajar mucho más que los hombres para ser consideradas igualmente competentes. Este podría ser el caso aquí también.

Un reciente artículo de Nature lo expresó muy bien: "Las mujeres no están fallando en la ciencia, la ciencia les está fallando a las mujeres". En nuestro caso, son los científicos hombres -economistas financieros- quienes están "fallando en las mujeres".

Este artículo se basa en una pieza que apareció originalmente en el blog profesional del autor.

miércoles, 28 de junio de 2017

Status económico y posición en la red

Infiriendo el estatus económico personal desde la ubicación de la red social

Shaojun Luo, Flaviano Morone, Carlos Sarraute, Matías Travizano y Hernán A. Makse
Nature Communications 8, Número del artículo: 15227 (2017)
Doi: 10.1038 / ncomms15227


Resumen -
Se cree comúnmente que los patrones de lazos sociales afectan la situación económica de los individuos. Aquí traducimos este concepto en una definición operativa a nivel de red, lo que nos permite inferir el bienestar económico de los individuos a través de una medida de su ubicación e influencia en la red social. Analizamos dos fuentes de gran escala: las telecomunicaciones y los datos financieros de la población de todo un país. Nuestros resultados muestran que la ubicación de un individuo, medida como la influencia colectiva óptima para la integridad estructural de la red social, está altamente correlacionada con la situación económica personal. Los patrones de influencia social observados imitan los patrones de desigualdad económica. Para el uso pragmático y la validación, llevamos a cabo una campaña de marketing que muestra un aumento de tres veces en la tasa de respuesta dirigida a los individuos identificados por nuestras métricas de red social en comparación con la orientación aleatoria. Nuestra estrategia también puede ser útil para maximizar los efectos de las políticas de estímulo económico a gran escala.


Introducción

El problema de larga data de cómo la red de contactos sociales1,2,3 influye en la situación económica de los individuos ha llamado la atención debido a su importancia en una diversidad de temas socioeconómicos que van desde la política al mercadeo4,5,6,7. Los análisis teóricos han señalado la importancia de la red social en la vida económica5 como medio para difundir las ideas8,9 a través de los efectos de los "agujeros estructurales" 10 y los "lazos débiles" en la red4. Del mismo modo, la investigación ha reconocido el efecto económico positivo de ampliar los contactos de un individuo fuera de su propio grupo social estrechamente conectado1,11,12,13. Mientras que el trabajo previo ha establecido la importancia de la influencia de la red social a la situación económica, el problema de cómo cuantificar dicha correspondencia a través de las redes sociales o métricas3,14 permanece abierto.

Los estudios que emplean datos de comunicación telefónica móvil y otros indicadores sociales han encontrado una variedad de efectos en la red sobre indicadores socioeconómicos como oportunidades de empleo15,16, movilidad social17,18,19, desarrollo económico6,20,21,22 y comportamiento del consumidor23,24. Un trabajo reciente también proporciona evidencia de tales efectos sobre la riqueza de un individuo y destaca la necesidad de mejores indicadores25. Recientemente, un estudio numérico ha probado el efecto de la diversidad de redes en el desarrollo económico6. Este estudio analizó el desarrollo económico definido a nivel comunitario. Sin embargo, la cuestión de cómo se pueden utilizar las métricas de redes sociales para inferir la situación financiera a nivel individual, necesaria, por ejemplo, para las campañas de mercadotecnia o de intervención social, sigue sin respuesta. La dificultad se debe, en parte, a la falta de datos empíricos que combinen la información financiera de un individuo con el patrón de sus lazos sociales a nivel de red en gran escala de toda la sociedad.

En este trabajo abordamos este problema directamente combinando dos grandes conjuntos de datos: una red social de toda la población de un país latinoamericano y datos bancarios financieros a nivel individual. Descubrimos que la optimalidad de la localización de un individuo en la red, medida por la influencia colectiva (CI) métrica26, está altamente correlacionada con la situación económica del individuo a nivel de población: cuanto mayor es el CI, mayor es el nivel socioeconómico. La bondad de ajuste de esta correlación puede ser tan alta como R2 = 0,99 cuando también se incluye la edad. Estos resultados indican que la optimización de la ubicación en la red social medida por la métrica CI puede predecir con precisión los indicadores socioeconómicos a nivel personal.

El 1% superior del estrato económico tiene patrones de red precisos de formación de enlaces que muestran relativamente baja conectividad local rodeada por una jerarquía de centros estratégicamente ubicados en esferas de influencia de creciente tamaño en la red. Este patrón no se observa en el resto de la población, en particular, en el 10% inferior caracterizado por bajos valores de CI. Así, la influencia medida a partir de patrones de redes sociales imita la desigualdad observada en el estado económico27.

También encontramos una alta correlación entre la diversidad de vínculos de los individuos y su situación financiera (R2 = 0,96), empleando el análisis basado en la ubicación de la red y la edad. El análisis de la covarianza sugiere que el efecto de la influencia de la red es significativo e independiente de otros factores. Validamos estos resultados llevando a cabo una campaña de marketing dirigida en la que comparamos la tasa de respuesta para diferentes grupos de personas con diferentes ubicaciones de red. Al dirigir el grupo con los valores CI superiores, la tasa de respuesta puede llegar hasta 1%; Aproximadamente tres veces la tasa de respuesta encontrada por orientación al azar y cinco veces la tasa de respuesta de las personas de CI baja.

Así, los individuos con alto nivel socioeconómico (1% superior) desarrollan un patrón muy característico de lazos sociales en comparación con el 10% inferior. Si bien este resultado se puede esperar, es notable que la diferencia en el patrón de las interacciones sociales entre los ricos y los pobres pueden ser capturados con precisión por una métrica de red midiendo su CI en la red social26. La capa socioeconómica superior de la sociedad también representa el conjunto mínimo de personas que proporciona integridad a toda la red social a través de su gran CI. El hecho de que los individuos de mayor estatus económico estén ubicados en regiones de gran CI en la red eleva la evidencia anecdótica anterior a un principio de organización de la red a través de la optimización de la influencia de las personas afluentes que afectan la integridad estructural de la red social. Al mismo tiempo, sugiere la aparición del fenómeno de CI en la sociedad como resultado de la optimización de las interacciones socioeconómicas.


Resultados

Construcción de redes

La red social se construye a partir de datos móviles (llamadas y metadatos SMS) y de comunicaciones residenciales recopilados por un período de 122 días (Nota complementaria 1, datos agregados en kcorelab.com). La base de datos contiene 1.10 × 108 usuarios de teléfono. Después de filtrar los nodos no humanos activos mediante un modelo aprendido por la máquina y entrenado en el comportamiento de la comunicación natural humana (Nota Complementaria 2, con Figuras 1-4 adicionales), construimos una red final de 1,07 × 108 nodos en un componente conectado gigante hecho de 2,46 × 108 enlaces. Los lazos, o enlaces, en la red corresponden a comunicaciones telefónicas, ya que esperamos que los patrones de comunicación sean indicativos de la ubicación de un individuo en la red social28,29,30. El costo financiero del uso de los servicios telefónicos hace posible que exista un sesgo sistemático en la cantidad de personas ricas que utilizan los servicios telefónicos en relación con las personas que tienen menos dinero para gastar en llamadas telefónicas. Aunque el efecto podría ser limitado (nota complementaria 1), no podemos descartar esta posibilidad con los datos actuales.

La situación financiera se obtiene del límite de crédito combinado de las tarjetas de crédito asignadas por las instituciones bancarias a cada cliente. El límite de crédito se basa en factores compuestos de ingresos e historial de crédito y, por lo tanto, refleja la situación financiera del individuo (ver discusión en la Nota Suplementaria 1). El límite de crédito se extrae de una base de datos de bancos cifrados e identificado por los números de teléfono de los clientes cifrados registrados en el banco. Por lo tanto, somos capaces de correlacionar precisamente la información financiera de un individuo con su ubicación social en la red de llamadas telefónicas a nivel de país. Hay 5.02 × 105 clientes bancarios que han sido identificados en la red móvil cuyo límite de crédito oscila entre USD $ 50 a $ 3.5 × 105 (convertido desde el país de estudio). Por lo tanto, los conjuntos de datos están conectados con precisión proporcionando una oportunidad sin precedentes para probar la correlación entre la ubicación de la red y el estado financiero.

A pesar de la gran escala de nuestra fuente de datos, observamos que trabajar en un solo país específico como en el presente estudio no es suficiente para otorgar generalidad a nuestros resultados. Para probar la validez general de los resultados actuales, se necesitaría el acceso a conjuntos de datos bancarios y de comunicaciones a nivel de toda la población de otros países. A medida que más conjuntos de datos estén disponibles, la generalidad de nuestros resultados puede ser probada a través de diferentes sistemas económicos y sociales.

La Figura 1a, b muestra los patrones de comunicación geolocalizados en todo el país de los individuos en el 1% superior y el 10% inferior de los límites de crédito, respectivamente. La desigualdad en los patrones de comunicación entre la clase económica superior y la más baja es sorprendente y imita la desigualdad económica a nivel de país27. Es visualmente evidente que el 1% superior (que representa el 45,2% del crédito total en el país) muestra un patrón de comunicación completamente diferente que el 10% inferior; El primero se caracteriza por vínculos más activos y diversos, especialmente conectando ubicaciones remotas y comunicándose con otras personas igualmente afluentes. Otros resultados utilizando el análisis de entropía también sugieren que la estructura de la red puede ser significativamente diferente entre las personas en el ranking de cuantil superior e inferior del límite de crédito (nota complementaria 3, cuadro complementario 1). Ejemplos particulares de las redes de ego ampliadas para dos individuos (con el mismo número de lazos) que ocupan el 1% superior y el 10% inferior proporcionan una imagen ampliada de tales diferencias (Fig. 1c, d, respectivamente). Los 1-por ciento más ricos tienen una mayor diversidad de contactos móviles y están ubicados centralmente, rodeados por otras personas altamente conectadas (hubs de red). Por otro lado, los individuos más pobres tienen una diversidad de contacto baja y están débilmente conectados a menos centros. El quid de la cuestión es encontrar una métrica de red social confiable para cuantificar esta diferencia visual en los patrones de estructura de red entre los ricos y los pobres, como se muestra a continuación.

Figura 1: Los patrones de influencia de la red imitan patrones de desigualdad de ingresos.

Visualización de la actividad de comunicación de la población en el primer 1% (con límite de crédito superior a USD $ 25.000, convertido, en el país de estudio) y (b) inferior 10% (con límite de crédito inferior a USD $ 600) del total Clases de límite de crédito. Los enlaces están entre los clientes del banco que han registrado su código postal. La resolución de ambas parcelas es de 1.700 × 1.000. El número de clientes bancarios dentro de cada comunidad se refleja en el tamaño del nodo. El límite de crédito promedio se indica mediante la escala de grises de un nodo. El color y grosor de los bordes refleja el número de eventos de comunicación entre diferentes comunidades. (C) Ejemplos de la red de ego (extendida a dos capas) para un individuo en la clase rica superior del 1% y (d) un individuo en la clase inferior del 10%. Las redes muestran dos patrones distintos de lazos sociales de acuerdo con la alta y baja situación económica: la primera se caracteriza por una IC grande, la segunda por CI baja. (E) Representación esquemática de una red bajo la descomposición de k-shell33. (F) Ejemplo de cálculo de CI. El CI Bola de radio alrededor del nodo i es el conjunto de nodos contenidos dentro de la esfera y ∂Ball es el conjunto de nodos en el límite (marrón). CI es el grado-menos-uno del nodo central veces la suma del grado-menos-uno de los nodos en el límite de la esfera de influencia.


Influencia de la red y situación financiera

Se han considerado muchas métricas o centralidades para caracterizar la influencia o importancia de los nodos en una red3,14,31. Aquí consideramos sólo aquellas centralidades que pueden ser escaladas hasta el tamaño de la red grande considerado aquí (figura 1e, nota adicional 4): (a) la centralidad del grado ki (número de lazos del individuo i) es una de las más simples3, (B) PageRank, de Google fame32, es una centralidad de vectores propios que incluye la importancia no sólo del grado, sino también de los vecinos más próximos, (c) el índice ks  del k-shell de un nodo (Figura 1e), es decir, La localización de la cáscara obtenida mediante la poda iterativa de todos los nodos con un grado k<ks (referencia 33), y (d) la CI de un nodo de grado ki  (figura 1f) en una esfera de influencia del tamaño  definido por la frontera de la bola de influencia , y se prevé que sea  por la teoría de percolación óptima26. A diferencia de las otras centralidades heurísticas, CI se deriva de la teoría de la maximización de la influencia en la red34. Por lo tanto, los nodos CI superiores se identifican como influenciadores o distribuidores superiores de información, y lo son colocándose en ubicaciones estratégicas en el centro de esferas rodeadas por cubos situados jerárquicamente a distancias (figura 1d). Estos influyentes colectivos constituyen también un conjunto óptimo que proporciona integridad al tejido social: son el número más pequeño de personas que, al salir de la red (proceso matemáticamente conocido como percolación óptima26), desintegraría la red en pequeñas piezas desconectadas.

Por definición, todas las métricas tienen similitudes (por ejemplo, son proporcionales a k, y PageRank y CI se basan en los autovalores más grandes de las matrices de adyacencia y no retroceso, respectivamente26), y de hecho, encontramos que sus valores en La red de comunicaciones telefónicas están correlacionadas (Tabla 2 suplementaria). Más interesante, la Fig. 2 proporciona evidencia de correlación de las cuatro métricas de la red con el estado financiero (límite de crédito clasificado) cuando controlamos por edad, lo que indica que la ubicación de la red se correlaciona con la situación financiera. En esta figura, se representa la fracción de individuos ricos (definida como el cuarto cuantil superior, equivalente a un límite de crédito superior a USD $ 4.000, véase la Nota Complementaria 5 para detalles sobre los métodos de validación y la referencia 30) en una cuadrícula de muestreo para un valor dado De edad y métrica social como se indica.


Figura 2: Fracción de individuos ricos versus edad y métricas de red.

Correlación entre la fracción de individuos ricos frente a la edad y (a) grado k  (R2=0.92), (b) k-shell (R2=0.96), (c) PageRank (R2=0.96) y (d) log10CI (R2=0.93). Sólo se muestran en la parcela los grupos con población> 20. Las cuatro métricas se correlacionan bien con la situación financiera cuando se consideran con la edad. Otras correlaciones se estudian en la Nota Suplementaria 6, indicando que CI podría ser considerada como la métrica más conveniente de los cuatro debido a su alta resolución.

Si bien todas las métricas sociales muestran correlaciones con el estado financiero cuando se consideran con la edad (figura 2), la pregunta sigue siendo cuál métrica es el predictor más eficiente. Se observan correlaciones fuertes con el bienestar económico para los pares de características (edad, k-shell, R2 = 0,96, Fig. 2b) y (edad, CI; R2 = 0,93, Fig. 2d). La Nota Suplementaria 6 (Figuras Adicionales 7-9) proporciona una comparación adicional cuando se consideran las métricas por sí solas, indicando que k-shell y CI mejor captan la correlación con el límite de crédito. Entre estas dos métricas, CI garantiza un requisito para una correlación fuerte y suficiente resolución. K-shell no puede capturar más detalles debido a su limitación de valores (k-shell varía de 1 a 23, dividiendo a toda la población en este pequeño número de conchas con una típica concha conteniendo decenas de millones de personas), mientras que CI abarca más de siete órdenes de magnitud; Véase la Fig. 5. Esta alta resolución implica que CI es una firma social más precisa para la situación financiera de los individuos. Según su definición (figura 1d), un nodo CI superior es un hub moderado a fuerte rodeado por otros centros jerárquicamente situados a distancia. Sin embargo, enfatizamos que CI es sólo una estrategia útil por las razones expuestas anteriormente, y de ninguna manera la única o mejor estrategia para correlacionar la riqueza de los individuos y su influencia en la red.

Si bien la teoría detrás de CI es una maximización global de la influencia, CI representa la aproximación local a esta optimización global. Así, CI representa un equilibrio entre una optimización global y su aproximación local, teniendo en cuenta las primeras 2 o 3 capas de vecinos a través del parámetro , que representa el tamaño de la esfera de influencia utilizada para definir la importancia de un nodo. 1d. Al cambiar , descubrimos que CI con es suficiente para capturar la correlación entre la influencia de la red y la riqueza (Figura 10).

Para realizar un seguimiento del efecto de la IC independientemente de la edad, se investigan los efectos de la CI dentro de dos grupos de edad específicos en la Fig. 3a, b. En ambos grupos de edad, la CI alta siempre está acompañada por una población más alta de personas ricas. Una pendiente relativamente menor en el grupo de edad <30 sugiere que el efecto de la red de CI es más sensible para las personas mayores con niveles económicos más maduros y estables que para los jóvenes (Figura 6). Cuando combinamos la edad y la clasificación de cuantil CI en un compuesto de edad-red: ANC=αAge+(1−α) CI, con α = 0,5, se logra una notable correlación (R2 = 0,99, Fig. 3c). Al combinar la información de la red con la edad, la probabilidad de identificar a las personas con un límite de crédito alto alcanza el ~ 70% al nivel más alto de ingresos. Este nivel de precisión hace que el modelo sea práctico para inferir la aptitud financiera de los individuos usando la CI de la red como se muestra a continuación.

Figura 3: Fracción de individuos ricos en diferentes edades y grupos de clasificación compuestos.

Correlación entre la fracción de individuos ricos dada por el límite máximo de crédito del 25% y CI en diferentes grupos de edad de (a) 18-30 y (b)> 45. Las correlaciones entre la situación económica superior y la IC grande determinada por los valores de CI en diferentes edades son significativas en todos los grupos de edad, mientras que la pendiente de la regresión lineal es mayor en el grupo de mayor edad (0,053 comparado con 0,037). (C) Clasificación compositiva edad-red ANC = 1/2 Edad + CI 1/2, y (d) clasificación mixta edad-diversidad ADC = 1/2 Edad + 1/2 DR. Mediante la combinación de las métricas de red con la edad en un índice compuesto, la posibilidad de identificar a las personas de alto nivel financiero alcanza ~ 70% para valores altos del compuesto. Ambos R2 muestran un alto nivel de correlación (R2 = 0,99 y 0,96 para ANC y ADC, respectivamente), haciendo ambos compuestos buenos predictores de la riqueza en aplicaciones prácticas.

Validación por campaña de marketing

Para validar nuestra estrategia, realizamos una campaña de marketing social cuyo objetivo es la adquisición de nuevos clientes de tarjetas de crédito, mediante el envío de mensajes a las personas afluentes (identificadas por sus valores de CI) e invitando a los destinatarios a iniciar una solicitud de producto (nota complementaria 8) . Observamos que en este experimento usamos un conjunto de datos independiente de un marco de tiempo diferente, y usamos solamente los valores de CI extraídos de la red para clasificar las personas objetivo. En concreto, utilizamos la red de comunicaciones resultante de la agregación de llamadas y SMS intercambiados entre usuarios durante un período de 91 días. La red social resultante contiene 7,19 × 107 personas y 3,51 × 108 enlaces. La campaña se llevó a cabo en un total de 656.944 personas que fueron objeto de un mensaje SMS ofreciendo el producto de acuerdo a sus valores de CI en la red social. También enviamos mensajes a un grupo de control de 48.000 personas, elegidas al azar. Para evaluar la campaña, se midió la tasa de respuesta, es decir, el número de receptores que solicitaron el producto dividido por el número de personas objetivo, en función de la CI. En el grupo de control, la tasa de respuesta a los mensajes fue 0,331%. Nuestros resultados muestran que los grupos de IC creciente muestran un aumento en su tasa de respuesta, con una triple ganancia sana en la tasa de respuesta de los principales influenciadores (identificados por los valores superiores de CI) en comparación con el caso aleatorio. Cuando comparamos la respuesta de la IC alta con la de CI más baja, la tasa de respuesta se quintuplica. Los resultados del experimento se resumen en la Tabla 1 y en la Fig. 4.


Tabla 1: Resultados de la campaña de marketing de la vida real.


Rango CI CuentaCuantilRespuestasTasa de respuesta
(0, 48)66,4950.11700.26%
(48, 246)65,1640.22180.33%
(246, 600)65,9610.33160.48%
(600, 1,144)65,3760.43320.51%
(1,144, 1,992)65,4770.53630.55%
(1,992, 3,408)65,4770.64580.70%
(3,408, 6,032)65,7360.74930.75%
(6,032, 11,772)65,6410.85550.8%
(11,772, 28,740)65,6830.96571.0%
(28,740, 2,719,354)65,6831.05730.87%
  1. Los individuos ('Cuenta') fueron apuntados según su ranking de cuantil CI en toda la red social obtenida de la actividad de comunicaciones telefónicas. Se calculó la respuesta a la campaña ("Sí contestó") para calcular la tasa de respuesta.

Figura 4: Tasa de respuesta versus cuantil de CI en la campaña de marketing de la vida real basada en CI.

La tasa de respuesta aumenta aproximadamente linealmente con la clasificación CI. La campaña de CI-targeting muestra una ganancia triple para los principales influyentes con CI alta, en comparación con una campaña dirigida a un grupo control aleatorizado.


Análisis de la covarianza

Observamos que nuestra validación es indirecta ya que no es una predicción directa de la situación financiera, sino una tasa de respuesta exitosa a una campaña de marketing. Esta tasa de éxito puede depender en realidad de una serie de otros factores que pueden correlacionarse con la centralidad de la red. Por lo tanto, la métrica de CI puede no ser necesariamente la única causa de la tasa de éxito de la campaña específica (por ejemplo, la ubicación geográfica puede ser también importante). Para abordar este punto, realizamos un análisis de la covarianza35 sobre todas las características a las que tenemos acceso (edad, sexo y código postal registrado) para probar la varianza causada por las métricas de la red y otros factores (detalles en la Nota Complementaria 5 y Tabla 3). El análisis de la covarianza muestra que los efectos de las métricas de la red son independientes de los de los otros factores. La correlación entre el CI y la fracción de personas adineradas es positiva y significativa (P <0,001) en todos los grupos de comunidades geográficas, entre géneros y entre todas las edades mayores de 24 años (Figura 6). Los mismos resultados significativos también se obtienen bajo diferentes umbrales de riqueza. Estos efectos de red significativos y sólidos implican que las métricas de red pueden ser un indicador potencial de la situación financiera.

Diversidad de la red y situación financiera

Nuestros conjuntos de datos combinados también ofrecen la posibilidad de probar la importancia de la diversidad de vínculos, medida por lazos con comunidades distantes de la red que no están directamente conectadas con la comunidad de un individuo, a nivel de individuos individuales4,5,6. Para ello, primero detectamos las comunidades en la red social mediante la aplicación de algoritmos rápidos de detección de la modularidad de los pliegues (Nota Suplementaria 7, Figura 11) 36,37. La diversidad de los vínculos de un individuo puede ser cuantificada a través de la relación de diversidad DR = Wout / Win, definida como la proporción de eventos de comunicación total con personas fuera de su propia comunidad, Wout, con aquellos dentro de su propia comunidad, Win. Esta relación está débilmente correlacionada con CI (R = 0,4), lo que sugiere que captura una característica diferente de la influencia de la red. Implementamos las mismas estadísticas de clasificación compuesta como antes, resultando en un compuesto de diversidad de edades ADC = αAge + (1-α) DR, con un peso α = 0.5. El resultado (Fig. 3d) muestra que ADC se correlaciona con el bienestar financiero individual, generalizando los resultados agregados en ref. 6 a nivel individual. Así, las métricas sociales consideradas, DR y CI, expresan el hecho de que los niveles económicos más altos se correlacionan con la capacidad de comunicarse con individuos fuera de la comunidad social local estrechamente unida, una medida del principio de fuerza de los lazos débiles de Granovetter En ubicaciones de red particulares de CI alto que son óptimas para la difusión de la información y la estabilidad estructural de la red social. Observamos que no se puede establecer una inferencia causal con los datos actuales.

Discusión

Este resultado destaca la posibilidad de predecir el estado financiero y los beneficios de las políticas socialmente orientadas basadas en métricas de red, lo que conduce a mejoras tangibles en las campañas de marketing social. El alto rendimiento de la CI entre las métricas de la red también sugiere el posible papel de acceder y mediar información en la oportunidad financiera y el bienestar5. Esto tiene un impacto inmediato en el diseño de campañas de marketing óptimas mediante la identificación de los objetivos ricos sobre la base de su posición influyente en una red social. Este hallazgo puede también elevarse al nivel de un principio, que explicaría la aparición del fenómeno de CI mismo como resultado de la optimización de las interacciones socioeconómicas.


Referencias

1. Newman, M. E. The structure and function of complex networks. SIAM Rev. 45, 167–256 (2003).
2. Vespignani, A. & Caldarelli, G. Large Scale Structure and Dynamics of Complex Networks: from Information Technology to Finance and Natural Science World Scientific (2007).
3. Wasserman, S. & Faust, K. Methods and Applications, Vol. 8 (Cambridge Univ. Press, 1994).
4. Granovetter, M. S. The strength of weak ties. Am. J. Sociol. 78, 1360–1380 (1973).
5. Granovetter, M. The impact of social structure on economic outcomes. J. Econ. Perspect. 19, 33–50 (2005).
6. Eagle, N., Macy, M. & Claxton, R. Network diversity and economic development. Science 328, 1029–1031 (2010).
7. Singh, V. K., Freeman, L., Lepri, B. & Pentland, A. S. in 2013 Internation Conference on Social Computing (SocialCom) 174–179 (Washington, DC, USA, 2013).
8. Powell, W. W. & Smith-Doerr, L. The Handbook of Economic Sociology, Vol. 368, 380 (eds Neil J. Smelser & Richard Swedberg) (Princeton University Press, Princeton, NJ, USA, 1994).
9. Strang, D. & Soule, S. A. Diffusion in organizations and social movements: from hybrid corn to poison pills. Annu. Rev. Sociol. 24, 265–290 (1998).
10. Burt, R. S. Structural Holes: the Social Structure of Competition Harvard Univ. Press (2009).
11. Page, S. E. The Difference: how the Power of Diversity Creates Better Groups, Firms, Schools, and Societies Princeton Univ. Press (2008).
12. Fernandez, R. M. & Weinberg, N. Getting a job: networks and hiring in a retail bank. Graduate Business School Research Paper No. 1382, 1 (University of Stanford, CA, USA, 1996).
13. Zimmer, C. The Art and Science of Entrepreneurship 3–23 (Ballinger, 1986).
14. Freeman, L. C. Centrality in social networks conceptual clarification. Soc. Networks 1, 215–239 (1978).
15. Toole, J. L. et al. Tracking employment shocks using mobile phone data. J. R. Soc. Interface 12, 2015.0185 (2015).
16. Seidel, M.-D. L., Polzer, J. T. & Stewart, K. J. Friends in high places: the effects of social networks on discrimination in salary negotiations. Admin. Sci. Q. 45, 1–24 (2000).
17. Cho, E., Myers, S. A. & Leskovec, J. in Proceedings of the 17th ACM (International Conference on Knowledge Discovery and Data Mining) 1082–1090 (San Diego, CA, USA, 2011).
18. Phithakkitnukoon, S., Smoreda, Z. & Olivier, P. Socio-geography of human mobility: a study using longitudinal mobile phone data. PLoS ONE 7, e39253 (2012).
19. Deville, P. et al. Scaling identity connects human mobility and social interactions. Proc. Natl Acad. Sci. USA 113, 7047–7052 (2016).
20. Pappalardo, L. et al. An analytical framework to nowcast well-being using mobile phone data. Int. J. Data Sci. Anal. 2, 75–92 (2016).
21. Pan, W., Ghoshal, G., Krumme, C., Cebrian, M. & Pentland, A. Urban characteristics attributable to density-driven tie formation. Nat. Commun. 4, 1961 (2013).
22. Gutierrez, T., Krings, G. & Blondel, V. D. Evaluating socio-economic state of a country analyzing airtime credit and mobile phone datasets. Preprint at https://arxiv.org/abs/1309.4496 (2013).
+ Show context
23. Salah, A. A., Lepri, B., Pianesi, F. & Pentland, A. S. in International Workshop on Human Behavior Understanding (eds Salah, A. & Lepri, B.) 1–15 (Springer, 2011).
24. Decuyper, A. et al. Estimating Food Consumption and Poverty Indices with Mobile Phone Data. Technical Report (United Nations Global Pulse, New York, USA, 2014). Preprint at https://arxiv.org/abs/1412.2595 (2014).
25. Blumenstock, J. in Proceedings of 20th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) (New York, NY, USA, 2014).
26. Morone, F. & Makse, H. A. Influence maximization in complex networks through optimal percolation. Nature 524, 65–68 (2015).
27. Stiglitz, J. E. The Price of Inequality: how Today’s Divided Society Endangers our Future W. W. Norton & Company (2012).
28. Onnela, J.-P. et al. Structure and tie strengths in mobile communication networks. Proc. Natl Acad. Sci. USA 104, 7332–7336 (2007).
29. Gonzalez, M. C., Hidalgo, C. A. & Barabasi, A.-L. Understanding individual human mobility patterns. Nature 453, 779–782 (2008).
30. Eagle, N., Pentland, A. S. & Lazer, D. Inferring friendship network structure by using mobile phone data. Proc. Natl Acad. Sci. USA 106, 15274–15278 (2009).
31. Pei, S. & Makse, H. A. Spreading dynamics in complex networks. J. Stat. Mech. Theor. Exp. 2013, P12002 (2013).
32. Page, L., Brin, S., Motwani, R. & Winograd, T. The Pagerank Citation Ranking: bringing Order to the Web. Technical Report 422 (Stanford InfoLab, Palo Alto, CA, USA, 1998).
33. Kitsak, M. et al. Identification of inuential spreaders in complex networks. Nat. Phys. 6, 888–893 (2010).
34. Kempe, D., Kleinberg, J. & Tardos, É. in Proceedings of 9th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) 137–146 (Seattle, WA, USA, 2003).
35. Wildt, A. R. & Ahtola, O. Analysis of Covariance, Vol. 12 (Sage Publications, 1978).
36. Blondel, V. D., Guillaume, J.-L., Lambiotte, R. & Lefebvre, E. Fast unfolding of communities in large networks. J. Stat. Mech. Theor. Exp. 2008, P10008 (2008).
37. Newman, M. E. Analysis of weighted networks. Phys. Rev. E 70, 056131 (2004).