Cualquiera que use Facebook puede asumir con seguridad que a la empresa todos somos un tipo de una cosa: paquetes de datos vendibles. Sin embargo, la masiva red social es más que una cosa para sus clientes. Algunos de nosotros lo usamos para mantener las pestañas en amigos lejanos, por ejemplo, y otros para promover sus obras creativas, o "literalmente" uñas de los pies demasiado lindas. Aún otros ven a Facebook como un medio pasivo, un canal de televisión compuesto por espectáculos protagonizados por todos los que conocen y otros no.
Ahora un nuevo estudio, publicado en la International Journal of Virtual Communities and Social Networking, confirma que Facebook tiene un efecto Rashomon: varios grupos de usuarios interpretan la experiencia de usarlo de manera muy diferente. Sorprendentemente, sin embargo, los investigadores también encontraron que podrían categorizar fácilmente a los usuarios en cuatro tipos generales: "constructores de relaciones", "compradores de ventanas", "pregoneros" y "selfies".
Los autores del estudio, de la Escuela de Comunicación de la Universidad Brigham Young, dicen que estas cuatro categorías surgieron de una encuesta que pidió a los sujetos responder a una lista de 48 declaraciones. Estos incluyen frases como "Facebook es una fuente de estrés, y me deprime" y "Facebook es una forma instantánea de pedir ayuda o algo que necesito de la gente". Los sujetos clasificaron cada declaración en una escala de "más como yo" A "menos como yo", y más tarde fueron entrevistados por los investigadores que reunieron información adicional y datos cualitativos.
En particular, sólo 47 sujetos estuvieron involucrados en este estudio, pero los autores argumentan que, debido a que emplearon la metodología Q, un enfoque para investigar perspectivas divergentes sobre temas subjetivos usando clasificación, estadística y análisis de factores, el tamaño pequeño de la muestra es suficiente para revelar sólidos patrones.
Sin embargo, al leer los perfiles de los tipos de teclas que aparecen a continuación, es posible que se vea reflejado en más de una categoría. Los autores reconocen que no todos somos fácilmente casilleros, pero decimos que es probable que encontremos que somos principalmente como un tipo. Es decir, al menos entre los adultos jóvenes estadounidenses; El estudio sólo involucró a los estadounidenses de 18 a 32 años, por lo que las poblaciones mundiales y los datos demográficos más antiguos pueden incluir otros tipos. Lo que es más, sus actitudes sobre Facebook y su comportamiento en línea pueden cambiar en su vida.
Aquí está una mirada más cercana a los tipos revelados por la encuesta:
Constructores de relaciones
Esta cohorte utiliza Facebook de la misma forma en que los humanos usaron el correo real y los teléfonos fijos: fortalecer las relaciones existentes con amigos y familiares. De hecho, Facebook es una extensión de su vida fuera de línea, según Tom Robinson, director asociado de la Escuela de Postgrado de BYU y profesor de publicidad. Una muestra de la declaración de que los constructores de relaciones se identificó con "Facebook me ayuda a expresar el amor a mi familia y permite a mi familia expresar amor a mí".
Como explican los investigadores en el estudio, esta banda no considera a Facebook como una "sociedad social virtual abierta, sino como un sitio mini-hub para la narración personal, donde la información fluye libremente entre amigos y familiares". En la entrevista, un sujeto que cayó En esta categoría dijo que ella no llamó a su familia, así que Facebook era "una manera fácil de decir 'hola' y compartir un poco de amor".
Los constructores de la relación también tienden para ser carteles pesados y los espectadores de cuadros y de videos; Comúnmente comentan las imágenes y actualizaciones que otros han compartido y participan en conversaciones.
Compradores de ventanas
Impulsados por "un sentido de obligación social" de estar en Facebook, los compradores de ventanas ven a Facebook como una parte ineludible de la vida moderna, pero rara vez divulgan información personal, comparten fotos o escriben actualizaciones. Tampoco les gusta mucho o comentan.
Clark Callahan, uno de los coautores del documento, que también es especialista en métodos de investigación y el director de la escuela de licenciatura de comunicación en BYU, llamó a Facebook window shopping, "el equivalente social de la gente viendo". Hombres y mujeres En este grupo más identificado con declaraciones como: "Puedo mirar libremente el perfil de Facebook de alguien que tengo un enamoramiento y conocer sus intereses y estado de relación", o "Tengo que usar Facebook para mantenerse conectado con la gente. "
Otro comentó que Facebook no era un lugar para "publicar cosas sobre mí mismo o sobre mi vida cotidiana, o sobre lo que hice el sábado, porque creo que las personas Que quieren conocerme estará a punto de hacerlo conmigo ".
Pregoneros
Éstos son los periodistas auto-denominados o profesionales, activistas y organizadores de eventos que ven Facebook principalmente como una caja de jabón. A diferencia de los constructores de relaciones, su mundo virtual no se asemeja a su vida real. Pueden transmitir información que se sienten obligados a compartir con una amplia gama de conexiones cercanas y distantes, pero no están buscando un seguimiento o no en línea de todos modos. "A veces publican cosas y ni siquiera les importa si a alguien le gusta o no", dijo a Quartz Kris Boyle, un profesor de periodismo de BYU que también fue coautor.
Los miembros de esta facción suelen sonar las alarmas en los grandes temas, y pasar a lo largo de los últimos memes, y ver a Facebook como la forma más fácil de hacer eso. Uno tiene que preguntarse si, en un año de agitación política en los EE.UU. y en otros lugares, su constante publicación de artículos en línea -para los que Facebook, como un poderoso distribuidor, se lleva a casa el mayor trozo del pastel de ingresos publicitarios- no ha ayudado El gigante de la tecnología mientras debilitaba aún más la industria periodística. Pero si los periódicos pueden luchar con éxito a través de una batalla legal, como esperan, los pregoneros de la ciudad serán los primeros en contarlo a través de Facebook.
Simplemente no les pida que compartan detalles personales. Aunque están enfocados enfáticamente en empujar alertas (ya sean noticias reales o inventadas) e invitar a la gente a eventos (ya sean protestas o brunch de iglesia), los pregoneros tienden a revelar poca información "privada" en su actividad en Facebook.
Su falta de compartir e interactuar no representa una falta de interés en sus conocidos. "No hablo con mi familia en Facebook", un criador de la ciudad explicó a los autores del documento, añadiendo: "Son más importantes que eso".
La mayoría de los pregoneros prefieren recoger el teléfono, el texto o el mensaje directo de alguien para una conversación real.
Selfies
El grupo final, los selfies, es el que estamos muy familiarizados, y así es como les gusta. Sus caminos han generado miles de ensayos sobre el problema de los medios de comunicación social y han contribuido al mito del Milennial narcisista.
Los selfies usan rutinariamente las mismas características de Facebook que los constructores de relaciones, publicando fotos, videos y actualizaciones de estado, pero lo hacen principalmente para llamar la atención a sí mismos, dicen los investigadores detrás de este estudio. Energizado y validado por gustos y comentarios, los selfies estuvieron de acuerdo con declaraciones como: "Cuanto más" como "alarmas de notificación recibo, más me siento aprobado por mis compañeros".
Hablando en una entrevista de estudio, un selfie explicó que: "Tomar una foto y dejar que se sienta en mi teléfono no hace nada e inútil, pero una vez que publico algo en Facebook, muestra que he hecho algo".
Aunque los selfies se encontraron menos preocupados por la exactitud del self que presentaron en línea, dice Boyle, esa tendencia podría existir en cualquier categoría. "Incluso los constructores de relaciones podrían parecer que tienen una relación amorosa con alguien en Facebook, y cuando se reúnen, es una historia diferente", dice. Entre los pregoneros, la computadora puede proporcionar una barrera protectora para aquellos que no necesariamente se sienten cómodos compartiendo sus ideas u opiniones en la vida real.
Una calidad seductora de la interacción en línea en general, observa Boyle, es que las personas son capaces de crear una versión mejor o diferente de sí mismos.
Para compartir nuestras verdades más oscuras, preferimos el anonimato percibido de una búsqueda de Google.
Miles de personas en todo el mundo han hecho emocionadamente un punto político con un tweet bien afilado e ingenioso. Todo lo que se necesita es 140 caracteres para hacer un argumento rotundo, y el hombre se siente bien para obtener unos retweets.
Pero, independientemente de lo persuasivos o divertidos que sean sus tweets, es probable que no sea bien recibido por alguien que no esté de acuerdo con usted. Un estudio de más de medio millón de tweets, publicado recientemente en las Actas de la Academia Nacional de Ciencias, muestra que los tweets moralmente indignados tienden a ser ampliamente retweeted dentro de sus esferas políticas, pero rara vez escapan de sus burbujas.
Los investigadores, dirigidos por el psicólogo William Brady de la Universidad de Nueva York, comenzaron analizando el lenguaje utilizado en 563.312 tweets sobre tres temas polémicos: control de armas, matrimonio entre personas del mismo sexo y cambio climático. Ellos ordenaron los tweets según su uso del lenguaje moral (por ejemplo, la palabra "deber"), lenguaje emocional (por ejemplo, "miedo") y lenguaje que es tanto moral como emocional (por ejemplo, "odio"). Los tweets que eran estrictamente morales o puramente emocionales no tenían un mayor número de retweets, pero los investigadores encontraron un aumento del 20% en retweets por palabra moral-emocional añadida.
A continuación, los investigadores analizaron cuánto de este intercambio ocurrió en redes ideológicas. Ellos estimaron la inclinación ideológica de cada tweeter usando un algoritmo que mide la persuasión política basada en redes seguidoras. Para cada tweet, calcularon el número de retweets de aquellos con la misma ideología que el autor, en comparación con aquellos con una ideología diferente. En general, encontraron mucho más retweets en grupo que fuera de grupo para mensajes sobre el control de armas y el cambio climático. (Los resultados para los tweets de matrimonio del mismo sexo tienden en la misma dirección, pero no son estadísticamente significativos).
El gráfico de red anterior es una visualización de esos hallazgos, con el azul representando a tweeters liberales y rojo representando conservadores. Los puntos representan tweets en todos los temas políticos, mientras que las líneas representan retweets. Aunque hay cierta interacción entre los dos grupos, el rojo y el azul permanecen en gran medida separados. Incluso las palabras más morales o emocionales, al parecer, no son lo suficientemente poderosas como para inducir un retweet desde el otro lado del pasillo.
Siguiendo nuestro análisis anterior, estudiamos la prevalencia de la campaña #IstandwithCEU en Twitter. Esto incluye el examen de 54k tweets realizados por 15k usuarios durante dos meses con un alcance social total de 180M.
Hemos reconstruido la red de retweets de los usuarios mediante la introducción de un enlace dirigido entre dos usuarios si uno retwitea el otro. Calculamos la importancia de los nodos utilizando el algoritmo llamado PageRank (PR) propuesto por los fundadores de Google. Este método cuantifica el nivel de influencia de cada usuario en la muestra dada. El concepto subyacente es similar a un sistema de votación: si un usuario retweeting a alguien, entonces el usuario retweeted es endosado, y el nivel de respaldo es proporcional a la influencia del retweeter (por ejemplo, el número de seguidores).
El análisis muestra que el puntaje PR está correlacionado con el recuento de seguidores, lo que significa que el éxito y la apreciación anteriores están lógicamente relacionados con la influencia actual y la atención adquirida. Esto es apoyado por la visualización de red también. El color nos dice que hay usuarios que tienen muchos seguidores pero que no son tan influyentes (Fig. 1: nodos grandes en color blanco, Fig. 2: debajo de la línea punteada) y aquellos que no tienen tantos seguidores pero tienen un Gran influencia (Fig. 1: pequeños nodos con color rojo, Fig. 2: puntos por encima de la línea punteada).
Fig. 1. La red de retweets de los 1000 usuarios más influyentes activos en la campaña. Los nodos representan a los usuarios, su tamaño es proporcional al número de sus seguidores, y su color codifica la centralidad PR de escala de blanco (baja importancia) a rojo (alta importancia).
Hemos encontrado que aunque la intuición ingenua sugeriría que los usuarios altamente seguidos (hasta varios millones de seguidores) son los más importantes para lograr un amplio alcance social, hay un número de usuarios menos populares (con alrededor de 10k seguidores) entre la opinión clave Líderes. Esto significa que además de un alto reconocimiento general, una serie de tweets de calidad y una cantidad razonable de seguidores influyentes pueden en gran medida aumentar el alcance social mediante la inducción de oleadas de retweets entre los usuarios influyentes.
Fig. 2. El puntaje de PageRank versus el recuento de seguidores de cada usuario (representado por un punto) que twittó en el tema #IstandwithCEU. La línea discontinua representa una fórmula analítica (ley de potencia), mientras que los puntos grises dispersados a su alrededor son la tendencia acumulando los datos.
Por Milán Janosov y Zsombor Koman
Utilizando Pajek y análisis de centralidad para identificar una red social de oficios de construcción
Brad W. Wambeke; Min Liu; y Simon M. Hsiang Journal of Construction Engineering and Management Volumen 138 Número 10 - Octubre 2012
Resumen
Los gerentes de proyectos de construcción a menudo se enfrentan con el reto de gestionar un complejo proceso de construcción que consiste en múltiples operaciones que trabajan en un gran número de tareas interdependientes. Una red social es un patrón de vínculos que existen entre diferentes entidades (es decir, personas, organizaciones, países). Existe una red social subyacente de oficios que existe con un proyecto de construcción y reconocer que puede ayudar a un equipo de gestión a tener éxito en este desafiante entorno. Se estudió un proyecto de 50 millones de dólares que involucra a 43 oficios durante un período de 28 semanas. Pajek, un programa de análisis de redes sociales, se utilizó para generar una serie de 14 redes sociales para los oficios involucrados. Tanto el grado como la centralidad de los vectores propios se analizaron para reflejar la distribución de las relaciones a través de la red y para identificar las operaciones clave. Esta investigación es útil para los gestores de proyectos y es significativa ya que describe e ilustra un método para identificar la red subyacente y las operaciones clave asociadas de un proyecto de construcción basado en la proximidad espacial. Si bien esta investigación se basa en un estudio de caso individual, los aspectos de esta investigación son repetibles. Los métodos presentados en este documento permitirán a otros desarrollar una red social que se adapte a un aspecto específico de un proyecto, que va desde los equipos de desarrollo de contratos a los oficios individuales utilizando un cronograma de ruta de camino crítico (CPM).
Techo de vidrio de Twitter revelado para mujeres y razas minoritarias
La gente más popular en Twitter son hombres blancos desproporcionadamente, según el primer estudio de la raza y de la desigualdad del género en el Twitterverse.
Nuestra civilización está llena de desigualdades. Las más obvias, que involucran género y raza, son objeto de estudio y debate en curso. Revertir estas disparidades es ampliamente considerado un objetivo importante para la humanidad.
Una de las herramientas que cambian la forma en que los humanos interactúan son los medios sociales. Es natural pensar que servicios como Twitter pueden desempeñar un papel importante en la reversión de las desigualdades de diversos tipos.
Pero eso plantea una pregunta importante: ¿hasta qué punto las desigualdades asociadas con la raza y el género se han extendido en las redes de redes sociales?
Hoy recibimos una respuesta gracias al trabajo de Johnnatan Messias en la Universidad Federal de Minas Gerais en Brasil y algunos compañeros que han estudiado el campo de juego para hombres y mujeres de diferentes razas en Twitter. Sus resultados proporcionan una fuerte evidencia de que ciertos tipos de desigualdades ya han infectado el Twitterverse.
El método de los investigadores para estudiar la desigualdad es sencillo. Messias y colegas comenzaron por filtrar el flujo de Twitter durante los tres meses hasta septiembre de 2016. En total, recogieron 341.457.982 tweets publicados por 50.270.310 usuarios.
Filtraron esto por zona horaria, geolocalización y aquellos con una imagen de perfil para dejarlos con 1,6 millones de usuarios basados en los EE.UU. Luego, alimentaron las imágenes a través de una aplicación de reconocimiento facial de última generación llamada Face ++, que reporta el sexo Y la raza (negro, blanco o asiático) de cada usuario.
Eso reveló el maquillaje general del grupo. Esto mostró que el 53 por ciento eran mujeres y el 47 por ciento hombres. También reveló el desglose de la raza, que era 18 por ciento asiático, 14 por ciento negro, y 68 por ciento blanco.
Estas cifras de referencia son importantes porque en una sociedad verdaderamente igualitaria, las mismas proporciones deben aparecer en subgrupos de personas seleccionadas de este conjunto de datos.
Los resultados hacen interesante la lectura. Messias y coautores comenzaron por mirar las proporciones de hombres y mujeres que tenían más seguidores en Twitter. Del 1 por ciento de los usuarios de Twitter con más seguidores, el 57 por ciento eran hombres y 43 por ciento mujeres.
Eso es un balance del 15 por ciento de la distribución esperada en una sociedad igual. "Los resultados reflejan la idea general de que las posiciones más altas suelen ser tomadas por los hombres", dicen Messias y coautores.
Semejantes desigualdades surgieron cuando el grupo estudió la distribución de razas entre los usuarios más populares de Twitter. "En los niveles más altos de visibilidad de [Twitter], los usuarios que se perciben como Blancos salen en la primera posición", dicen los investigadores.
Incluso se burlan de los datos aparte en más detalle, mirando los efectos de ambos, género y raza. El grupo más privilegiado resulta ser hombres blancos, que están sobre representados en un 20 por ciento entre los usuarios populares de Twitter. Las hembras blancas también son más privilegiadas, aunque en menor medida, sólo el 3 por ciento.
Los grupos más desfavorecidos son las mujeres asiáticas y las negras, que están sub-representadas en un 31 por ciento.
Messias y coautores también miran la forma en que los usuarios se conectan entre sí y si esto refleja los datos de línea de base. Resulta que hay sesgos significativos en la forma en que los géneros y razas se vinculan entre sí. Este es un efecto conocido como "homofilia" -la tendencia de las personas a buscar a otros como ellos.
Pero las magnitudes de este efecto son interesantes. Los blancos tienden a seguir más gente blanca de lo esperado por un margen de 16 por ciento. Los negros tienden a seguir más gente negra de lo esperado por un margen muy significativo de más del 200 por ciento. Sin embargo, las personas asiáticas tienden a seguir menos personas asiáticas de lo esperado por un margen de 10 por ciento. "El homofilismo esperado no estaba claro para el caso de los asiáticos", dicen Messias y colegas.
Es un trabajo interesante que revela la clara existencia de efectos de techo de cristal en Twitter. "Mostramos que el efecto de techo de cristal de Twitter, típicamente aplicado a las mujeres, también ocurre en Twitter para los hombres, si son negros o asiáticos", dicen los investigadores.
Esto tiene implicaciones significativas para la forma en que se puede abordar la desigualdad. Un primer paso es siempre la comprensión de la naturaleza de las disparidades, y este trabajo va de alguna manera para lograr esto.
Sin embargo, la siguiente etapa de la elaboración de cómo nivelar el campo de juego es una tarea mucho más difícil.
Ref: arxiv.org/abs/1706.08619: White, Man, and Highly Followed: Gender and Race Inequalities in Twitter
La "máquina del tiempo" reconstruye las redes sociales de la antigua Venecia El proyecto de aprendizaje automático analizará 1.000 años de mapas y manuscritos de la edad de oro de la ciudad flotante.
Por Alison Abbott | Nature
La Máquina del Tiempo de Venecia transportará a los historiadores de la actual Plaza de San Marcos (derecha) al bullicio de la Venecia del siglo XVIII (a la izquierda). Crédito: Tauromaquia en la Plaza de San Marcos de Canaletto y Cimaroli / DeAgostini / Getty; Zetter / Istock / Getty
A pocos metros de la multitud de turistas que pasan por las concurridas plazas de Venecia, el silencio dentro de Santa María Gloriosa dei Frari es tan profundo que duele las orejas. Hace tiempo que los archivistas del Estado se apoderaron de este convento del siglo xiv, pero son tan estudiosos como los hermanos franciscanos que una vez vivieron aquí, ya que tienden los registros históricos que llenan unos 80 kilómetros de estanterías. Ahora, una tripulación de científicos cargados con equipo de alta tecnología está revolviendo las cosas en estas pilas sagradas.
La historia se cuelga pesada en el Frari, y el informático Frédéric Kaplan le gusta de esa manera. Tiene la ambición de capturar más de 1.000 años de discos en forma digital dinámica, abarcando la gloriosa era de la República de Venecia. El proyecto, que él llama la máquina del tiempo de Venecia, explorará documentos incluyendo los mapas, las monografías, los manuscritos y la partitura. Promete no sólo abrir remesas de historia ocultas a los estudiosos, sino también permitir a los investigadores buscar y referenciar la información, gracias a los avances en las tecnologías de aprendizaje automático.
Si tiene éxito, abrirá el camino para un proyecto aún más ambicioso de conectar máquinas de tiempo similares en los centros históricos de la cultura y el comercio de Europa, revelando con un detalle sin precedentes cómo las redes sociales, el comercio y el conocimiento se han desarrollado durante siglos en todo el continente. Sería Google y Facebook durante generaciones, dijo Kaplan, quien dirige el Laboratorio de Humanidades Digitales del Instituto Federal Suizo de Tecnología en Lausana (EPFL).
Aunque la década anterior ha visto muchos proyectos de digitales-humanidades que analizan, anotan e indexan manuscritos, éste se destaca por su ambiciosa escala y las nuevas tecnologías que espera usar: desde escáneres de última generación que incluso podrían leer Libros sin abrir, a algoritmos adaptables que convertirán documentos escritos a mano en texto digital y de búsqueda.
La bendición para la beca debe extenderse mucho más allá de los historiadores. Los economistas y epidemiólogos, por ejemplo, están ansiosos por acceder a los registros escritos dejados por decenas de miles de ciudadanos comunes, lo que podría revelar cómo se desarrollaron los mercados financieros o cómo se propagaron enfermedades como la plaga. "Estamos en un estado de entusiasmo electrificado por las posibilidades", dice Lorraine Daston, directora del Instituto Max Planck para la Historia de la Ciencia en Berlín. "Estoy prácticamente salivando."
La República Serena
Venecia es la ciudad perfecta para el experimento debido a su riqueza de documentación históricamente importante y bien ordenada. Fue fundada en el siglo V dC por los ciudadanos del imperio romano escapando de los invasores bárbaros del norte. Sus inhospitalarias lagunas proporcionaban una protección muy necesaria, y su ubicación en el extremo norte del mar Adriático también tenía ventajas estratégicas. Pronto se convirtió en el puesto comercial más importante entre Europa occidental y el este, lo que le aporta riqueza y poder.
A medida que el imperio de Venecia crecía, desarrolló sistemas administrativos que registraron una gran cantidad de información: quién vivía donde, los detalles de cada barco que entraba o salía del puerto, cada alteración hacía edificios o canales. La banca moderna se inventó en el Rialto, uno de los barrios más antiguos de Venecia, y los notarios allí registraron todos los intercambios comerciales y transacciones financieras.
Crucialmente, esos expedientes sobrevivieron a través de siglos turbulentos. Mientras que el resto de Europa estaba dominado por sus monarcas perpetuamente en guerra, a partir del siglo VIII Venecia comenzó a convertirse en una república estable que proporcionó la paz y el orden necesarios para que el comercio florezca. En muchos sentidos era una democracia modelo. La gente eligió a un líder - el doge - apoyado por los varios consejes, cuyos miembros también fueron elegidos generalmente. La gobernanza era secular, pero en su mayor parte coexistió tolerantemente con la religión.
El emperador francés Napoleón Bonaparte puso fin a la República Serena en 1797. En su camino a Viena durante su intento de conquistar el Imperio Austro-Húngaro, declaró la gobernabilidad secular y democrática de Venecia como una forma de autocracia y la ciudad como un enemigo De la revolución. Obligó a la República a disolverse. En 1815, el viejo Frari se convirtió en el Archivo Estatal de Venecia.
Durante las próximas décadas, todos los documentos administrativos estatales, incluidos los registros de defunción, fueron trasladados allí, junto con registros médicos, registros notariales, mapas y planos arquitectónicos, registros de patentes y una diversidad de otros documentos, algunos de otros lugares de Italia. Particularmente significativos son los informes de embajadores de Europa más amplia y el Imperio Otomano, proporcionando una fuente única de información detallada sobre la vida cotidiana. "Los embajadores venecianos eran los viajeros más atentos, entrenados para averiguar cosas como lo que se estaba descargando en los muelles, o lo que un príncipe u otro alto era como una persona", dice Daston. Sus informes estaban llenos de chismes e intrigas.
La mayor parte del archivo, escrito predominantemente en latín o en el dialecto veneciano, nunca ha sido leído por historiadores modernos. Ahora todo será introducido sistemáticamente en la máquina del tiempo de Venecia, junto con fuentes más no convencionales de datos, tales como pinturas y registros de los viajeros.
Nacimiento de una carrera
Kaplan ha pasado su carrera aplicando inteligencia artificial (IA) en las humanidades, principalmente en lingüística. Ha modelado la evolución del lenguaje, por ejemplo, utilizando AI para buscar siglos de reportajes periodísticos para patrones de palabras y frases. Pero siempre había deseado aplicar estas técnicas a la construcción de una máquina del tiempo en una ciudad europea con un par de siglos de archivos. Sus pensamientos se dirigieron primero a París, Ámsterdam o Ginebra, Suiza. Pero cuando los rectores de la EPFL y la Universidad Ca'Foscari de Venecia decidieron colaborar y solicitar ideas, inmediatamente se ofreció a desarrollar su idea del tiempo-máquina para Venecia. Recuerda vívidamente la primera vez que entró en los archivos, en 2012. El tiempo se detiene en el corral de más de 300 habitaciones, que no son ni aire acondicionado ni calefacción. En invierno son mordazmente frío, en verano sofocante caliente. Los documentos frágiles se apilan del suelo al techo, y ocasionalmente copos de papel amarillento bajan de sus bordes. "Me sentí completamente abrumado", dice. "Al ver cómo es un archivo de mil años, sabiendo que la mayoría no estaba disponible, sabía que necesitábamos hacerlo".
Cuando el proyecto se lanzó oficialmente en 2012, Kaplan sabía que exigía mucho más que su destreza computacional. Sería necesario que los historiadores anotaran los manuscritos, para proporcionar el contexto necesario para el manejo de los datos. Pueden anotar el papel de cada persona mencionada en un contrato para aclarar exactamente quién fue el destinatario, por ejemplo, o evaluar la fiabilidad de una determinada fuente de información. Los archivistas también serían necesarios, por su profundo conocimiento de la inmensa colección de documentos.
La máquina del tiempo de Venecia puede vincular a los ciudadanos y las empresas con los mapas históricos de Venecia, como esta opinión del siglo XVI de la ciudad. Crédito: EPFL / Archivio di Stato
Así que se comprometió como su co-directora Isabella di Lenardo, un historiador entrenado en Venecia que ahora está en EPFL. Los arquivistas estatales de Venecia, acostumbrados a las viejas formas de tutela, tardaron un poco más en aceptar la idea, pero al cabo de un año fueron socios de pleno derecho .
La colaboración interdisciplinaria comenzó de inmediato a recoger el tipo de oscuro conocimiento archivístico que tiende a no penetrar al mundo exterior. Por ejemplo, aunque los informes de los embajadores son una fuente particularmente rica de detalles, a menudo se escriben en código para mantener los mensajes en secreto, una fuente de frustración para los historiadores. Sin embargo, una conversación informal entre los miembros del equipo condujo al descubrimiento fortuito de un pequeño libro del siglo XVI llamado Libro de le cifre, que proporcionó el código de cifrado para los informes de algunos embajadores venecianos. Los historiadores ahora se preparan con entusiasmo para descifrar sus secretos.
Historial de escaneo
Incluso antes de que llegara la Máquina del Tiempo de Venecia, los Archivos del Estado habían iniciado un proyecto de digitalización financiado por el Ministerio de Patrimonio Cultural de Italia. En 2006, un enorme escáner de propósito específico comenzó a digitalizar la preciosa tienda de archivos de más de 3.000 mapas de ciudades italianas, incluyendo muchos encargados por Napoleón. Estos mapas 'catastrales' delimitan los límites de las propiedades y registran la propiedad d pequeñas parcelas de tierra; Algunos de los documentos son tan grandes como 4 metros por 7 metros.
La máquina del tiempo de Venecia ha cambiado este proceso en la sobremarcha, trayendo en otro estado-de-the-art, alta velocidad escáneres especialmente adaptados para el proyecto. Incluyen uno con un brazo robótico para girar las páginas de libros y un imponente escáner rotativo con un plato giratorio de 2 metros de ancho que permite a los técnicos de pie en lados opuestos para alimentar múltiples documentos de tamaño A3 al mismo tiempo. Estos escáneres ahora forman una tubería que produce varios miles de imágenes de alta definición por hora, alimentando terabytes de información a los servidores en Venecia para almacenamiento a largo plazo, ya Lausana, donde las computadoras de alto rendimiento transforman las imágenes en texto digital listas para anotación.
La lectura automática de manuscritos manuscritos antiguos es un reto importante. El software estándar de reconocimiento de caracteres permite que los libros impresos se lean letra por letra a pesar de las variaciones en las fuentes y, por lo tanto, se pueden buscar. Pero esto no funciona para manuscritos manuscritos, donde las formas de las letras individuales pueden variar enormemente entre los escribas, y pueden evolucionar con el tiempo. En una colaboración de la Unión Europea denominada Reconocimiento y Enriquecimiento de Documentos de Archivo (READ) se están desarrollando diversos enfoques para resolver el problema. Kaplan, un miembro de la colaboración, está aplicando actualmente su acercamiento preferido a la máquina del tiempo de Venecia, usando el aprendizaje de la máquina para reconocer las formas de palabras enteras.
Aprendizaje de la máquina se basa en algoritmos que modifican sus propias reglas y comportamiento a medida que recogen ejemplos de conjuntos de datos, afinando sus habilidades con cada nueva experiencia. Los algoritmos de la máquina del tiempo están diseñados para analizar la estructura del texto escrito y extraer formas gráficas que parecen similares, formando un vínculo entre ellas (ver 'Hacking history'). Esto permite que un usuario encuentre un nombre en un documento y luego pida al sistema que revele dónde aparece el mismo nombre en todos los otros manuscritos de la base de datos.
En la próxima década, estos escáneres podrían unirse a un instrumento que lee libros sin siquiera abrirlos. El concepto se basa ahora en las técnicas de barrido de tomografía computarizada (TC) utilizadas en medicina, donde las imágenes de rayos X tomadas en diferentes ángulos forman una imagen 3D del interior de un cuerpo, cortada por rodaja. Los científicos de EPFL están investigando la composición de tintas antiguas para identificar moléculas que podrían actuar como agentes de contraste de rayos X. "Puede necesitar más de cinco años antes de que el escáner tomográfico pueda ser puesto en operación", dice Kaplan. Pero ofrecería enormes ventajas: podría escanear libros mucho más rápido, examinar volúmenes delicados sin daños y acceder a los cientos de miles de frágiles testamentos sellados en los archivos de Venecia que se destruirían si se abrieran.
Redes sociales
A pesar de que estas tecnologías se están desarrollando y refinado, la máquina del tiempo de Venecia ya está demostrando cómo puede ayudar a remodelar la comprensión de los estudiosos del pasado. Las narrativas que llenan los libros de texto de la historia se construyen generalmente alrededor de gente famosa, porque se sabe mucho más sobre ellos. Sin embargo, la máquina del tiempo se hinchará con el tipo de registros mundanos que los administradores estatales en todas partes rutinariamente se reúnen para hacer un seguimiento de sus poblaciones. Esto permitirá a los historiadores reconstruir la vida de cientos de miles de personas comunes - artesanos y comerciantes, enviados y comerciantes - y construir narrativas históricas mucho más redondeadas.
Los Archivos del Estado de Venecia contienen documentos que abarcan 1.000 años, llenando 80 kilómetros de estanterías. Crédito: EPFL / Archivio di Stato
El enfoque eficiente de Napoleón a la administración estatal ha sido especialmente valioso para el proyecto. Un mapa catastral de Venecia que él encargó en 1808 ha proporcionado una columna vertebral de datos confiables, permitiendo a historiadores agregar contexto geográfico a un censo 1740 que enumera a los ciudadanos que poseyeron y alquilaron la característica en la ciudad. Al combinar esto con información 3D sobre edificios de pinturas como las de Canaletto, el equipo de relojería ha realizado una gira animada por Venecia, mostrando qué negocios estaban activos en cada edificio de la época. "Napoleón pudo haber puesto fin a la República de Venecia", dice Kaplan, "pero para nosotros fue el punto de partida para la recuperación de su historia".
Kaplan y di Lenardo también han hecho una serie de otras animaciones de Venecia sobre el espacio y el tiempo, que serán actualizadas y enriquecidas a medida que se alimenten más datos en la máquina. Se trata de un video dinámico del desarrollo del Rialto a partir de 950 dC, utilizando diversas fuentes de información en diferentes momentos. La simulación muestra cómo los edificios -y el icónico Puente de Rialto- surgieron entre las marismas, junto con la destrucción periódica de la zona por incendios y reconstrucciones posteriores.
Otras simulaciones etiquetan edificios en el Rialto con nombres de empresas familiares, o representan las redes sociales que se formaron entre los venecianos y otros en toda Europa. The Venice Time Machine asume que hay una conexión entre personas cuyos nombres aparecen en el mismo documento, y esto le permite mostrar a cada persona como un nodo en una red de conexiones. Cuando los mismos individuos surgen en otros documentos, la web comienza a crecer hasta convertirse en una red gigante - al igual que los científicos elaboran redes sociales a partir de datos de Facebook o Twitter. Esta red debería permitir a los historiadores descubrir detalles sobre la vida de un gran número de personas desconocidas en Venecia y más allá, y su lugar en la sociedad.
Unidades bancarias y plagas
Daston piensa que la máquina del tiempo podría ayudar a responder a una lista casi interminable de preguntas históricas. Por ejemplo, podría mostrar cómo se desarrolló el lenguaje para describir las extrañas especies animales traídas a los muelles de Venecia desde países recién descubiertos, o podría rastrear las trayectorias de académicos y científicos mientras vagaban por Europa.
Su pasión personal es la epistemología de la medición. "Todo el mundo estaba loco por medir el mundo en el siglo XVII, pero las unidades de medida apenas se mencionaban en los siglos XV y XVI", dice. "Ser capaz de hacer búsquedas de palabras clave a lo largo de los siglos podría ayudarnos a entender cómo se estableció la ciencia de la medición".
Ese entusiasmo se derrama de la historia a otros campos. El historiador económico Joan Rosés, de la Escuela de Economía y Ciencia Política de Londres, dice que siglos de información de los notarios de una ciudad tan importante para la historia económica de Venecia "podrían ayudar a cambiar nuestra comprensión de cómo funcionan los mercados financieros". Gran parte de la teoría económica se desarrolló sin datos sólidos, dice, y los economistas que buscan una base de evidencia más sólida se ven obstaculizados por la falta de conjuntos de datos adecuados sobre cosas como las transacciones y el flujo de dinero. Los registros modernos, incluidos los de los bancos, tienen un valor limitado: los datos ya han sido procesados de acuerdo con la teoría económica a la que la institución suscribe. Los conjuntos de datos históricos son más limpios porque registran el comportamiento crudo e intuitivo - simplemente quién vendió qué, por cuánto. Pero los grandes archivos financieros de Europa, como el Archivo Notarial de Cataluña en Barcelona, no están en línea. "Cuando voy al archivo de Barcelona para la investigación, puedo leer sólo tres documentos al día", dice Rosés, "por lo que la Máquina del Tiempo de Venecia será un cambiante". Y hay mucho que aprender de las personas que eran económicas Fallas "Se puede deducir un montón de cosas estúpidas si sólo estudian con éxito, la gente famosa - las únicas personas que conocemos mucho", dice.
El epidemiólogo Marcel Salathé, de EPFL, ya está colaborando con la máquina del tiempo de Venecia, mirando en los registros que revelan los nombres y lugares de las personas que murieron, a menudo con detalles sobre las circunstancias de su fallecimiento. "Es como un registro de salud electrónico primitivo", dice. La peste aniquiló a un tercio de la población de Venecia a mediados del siglo XVII, y Salathé espera descubrir más acerca de cómo se propaga la enfermedad. Los brotes todavía ocurren en todo el mundo, pero hay grandes lagunas en los datos sobre su transmisión. La investigación con animales por sí sola no puede llenarlos, y los conjuntos de datos humanos modernos son demasiado pequeños para ayudar, dice.
Kaplan espera que Venecia sea sólo un punto de partida. La máquina del tiempo de Venecia se ha aplicado, con socios de toda Europa, para convertirse en uno de los próximos millones de euros de los programas emblemáticos financiados por la Unión Europea. Si gana, creará máquinas de tiempo en otras ciudades con archivos similarmente importantes, y los unirá. A principios de este año, un consorcio de académicos holandeses lanzó la máquina del tiempo de Amsterdam, aunque todavía tiene que obtener financiación. Su coordinadora, Julia Noordegraaf de la Universidad de Amsterdam, que estudia la historia de las industrias creativas, dice que es "una gran oportunidad para estudiar el tráfico cultural entre Ámsterdam y Venecia durante su edad de oro en el siglo XVII". Una Máquina del Tiempo de París también está en discusión.
Las ambiciones desenfrenadas del proyecto del tiempo-máquina son una preocupación para algunos investigadores, no menos porque muchas de sus tecnologías de la base todavía se están desarrollando. "La visión de extender la representación digital en diferentes franjas horarias es absolutamente, evidentemente correcta, pero podría ser mejor desarrollar cosas más en muchos proyectos pequeños y diferentes", dice Jürgen Renn, pionero en digital-humanidades y director En el Instituto Max Planck para la Historia de la Ciencia.
Sin embargo, Daston sospecha que la máquina del tiempo anuncia una nueva era de estudio histórico. "Nosotros, los historiadores, fuimos bautizados con el polvo de los archivos", dice. "El futuro puede ser diferente".
Infiriendo el estatus económico personal desde la ubicación de la red social
Shaojun Luo, Flaviano Morone, Carlos Sarraute, Matías Travizano y Hernán A. Makse Nature Communications 8, Número del artículo: 15227 (2017)
Doi: 10.1038 / ncomms15227
Resumen - Se cree comúnmente que los patrones de lazos sociales afectan la situación económica de los individuos. Aquí traducimos este concepto en una definición operativa a nivel de red, lo que nos permite inferir el bienestar económico de los individuos a través de una medida de su ubicación e influencia en la red social. Analizamos dos fuentes de gran escala: las telecomunicaciones y los datos financieros de la población de todo un país. Nuestros resultados muestran que la ubicación de un individuo, medida como la influencia colectiva óptima para la integridad estructural de la red social, está altamente correlacionada con la situación económica personal. Los patrones de influencia social observados imitan los patrones de desigualdad económica. Para el uso pragmático y la validación, llevamos a cabo una campaña de marketing que muestra un aumento de tres veces en la tasa de respuesta dirigida a los individuos identificados por nuestras métricas de red social en comparación con la orientación aleatoria. Nuestra estrategia también puede ser útil para maximizar los efectos de las políticas de estímulo económico a gran escala.
Introducción
El problema de larga data de cómo la red de contactos sociales1,2,3 influye en la situación económica de los individuos ha llamado la atención debido a su importancia en una diversidad de temas socioeconómicos que van desde la política al mercadeo4,5,6,7. Los análisis teóricos han señalado la importancia de la red social en la vida económica5 como medio para difundir las ideas8,9 a través de los efectos de los "agujeros estructurales" 10 y los "lazos débiles" en la red4. Del mismo modo, la investigación ha reconocido el efecto económico positivo de ampliar los contactos de un individuo fuera de su propio grupo social estrechamente conectado1,11,12,13. Mientras que el trabajo previo ha establecido la importancia de la influencia de la red social a la situación económica, el problema de cómo cuantificar dicha correspondencia a través de las redes sociales o métricas3,14 permanece abierto.
Los estudios que emplean datos de comunicación telefónica móvil y otros indicadores sociales han encontrado una variedad de efectos en la red sobre indicadores socioeconómicos como oportunidades de empleo15,16, movilidad social17,18,19, desarrollo económico6,20,21,22 y comportamiento del consumidor23,24. Un trabajo reciente también proporciona evidencia de tales efectos sobre la riqueza de un individuo y destaca la necesidad de mejores indicadores25. Recientemente, un estudio numérico ha probado el efecto de la diversidad de redes en el desarrollo económico6. Este estudio analizó el desarrollo económico definido a nivel comunitario. Sin embargo, la cuestión de cómo se pueden utilizar las métricas de redes sociales para inferir la situación financiera a nivel individual, necesaria, por ejemplo, para las campañas de mercadotecnia o de intervención social, sigue sin respuesta. La dificultad se debe, en parte, a la falta de datos empíricos que combinen la información financiera de un individuo con el patrón de sus lazos sociales a nivel de red en gran escala de toda la sociedad.
En este trabajo abordamos este problema directamente combinando dos grandes conjuntos de datos: una red social de toda la población de un país latinoamericano y datos bancarios financieros a nivel individual. Descubrimos que la optimalidad de la localización de un individuo en la red, medida por la influencia colectiva (CI) métrica26, está altamente correlacionada con la situación económica del individuo a nivel de población: cuanto mayor es el CI, mayor es el nivel socioeconómico. La bondad de ajuste de esta correlación puede ser tan alta como R2 = 0,99 cuando también se incluye la edad. Estos resultados indican que la optimización de la ubicación en la red social medida por la métrica CI puede predecir con precisión los indicadores socioeconómicos a nivel personal.
El 1% superior del estrato económico tiene patrones de red precisos de formación de enlaces que muestran relativamente baja conectividad local rodeada por una jerarquía de centros estratégicamente ubicados en esferas de influencia de creciente tamaño en la red. Este patrón no se observa en el resto de la población, en particular, en el 10% inferior caracterizado por bajos valores de CI. Así, la influencia medida a partir de patrones de redes sociales imita la desigualdad observada en el estado económico27.
También encontramos una alta correlación entre la diversidad de vínculos de los individuos y su situación financiera (R2 = 0,96), empleando el análisis basado en la ubicación de la red y la edad. El análisis de la covarianza sugiere que el efecto de la influencia de la red es significativo e independiente de otros factores. Validamos estos resultados llevando a cabo una campaña de marketing dirigida en la que comparamos la tasa de respuesta para diferentes grupos de personas con diferentes ubicaciones de red. Al dirigir el grupo con los valores CI superiores, la tasa de respuesta puede llegar hasta 1%; Aproximadamente tres veces la tasa de respuesta encontrada por orientación al azar y cinco veces la tasa de respuesta de las personas de CI baja.
Así, los individuos con alto nivel socioeconómico (1% superior) desarrollan un patrón muy característico de lazos sociales en comparación con el 10% inferior. Si bien este resultado se puede esperar, es notable que la diferencia en el patrón de las interacciones sociales entre los ricos y los pobres pueden ser capturados con precisión por una métrica de red midiendo su CI en la red social26. La capa socioeconómica superior de la sociedad también representa el conjunto mínimo de personas que proporciona integridad a toda la red social a través de su gran CI. El hecho de que los individuos de mayor estatus económico estén ubicados en regiones de gran CI en la red eleva la evidencia anecdótica anterior a un principio de organización de la red a través de la optimización de la influencia de las personas afluentes que afectan la integridad estructural de la red social. Al mismo tiempo, sugiere la aparición del fenómeno de CI en la sociedad como resultado de la optimización de las interacciones socioeconómicas.
Resultados
Construcción de redes
La red social se construye a partir de datos móviles (llamadas y metadatos SMS) y de comunicaciones residenciales recopilados por un período de 122 días (Nota complementaria 1, datos agregados en kcorelab.com). La base de datos contiene 1.10 × 108 usuarios de teléfono. Después de filtrar los nodos no humanos activos mediante un modelo aprendido por la máquina y entrenado en el comportamiento de la comunicación natural humana (Nota Complementaria 2, con Figuras 1-4 adicionales), construimos una red final de 1,07 × 108 nodos en un componente conectado gigante hecho de 2,46 × 108 enlaces. Los lazos, o enlaces, en la red corresponden a comunicaciones telefónicas, ya que esperamos que los patrones de comunicación sean indicativos de la ubicación de un individuo en la red social28,29,30. El costo financiero del uso de los servicios telefónicos hace posible que exista un sesgo sistemático en la cantidad de personas ricas que utilizan los servicios telefónicos en relación con las personas que tienen menos dinero para gastar en llamadas telefónicas. Aunque el efecto podría ser limitado (nota complementaria 1), no podemos descartar esta posibilidad con los datos actuales.
La situación financiera se obtiene del límite de crédito combinado de las tarjetas de crédito asignadas por las instituciones bancarias a cada cliente. El límite de crédito se basa en factores compuestos de ingresos e historial de crédito y, por lo tanto, refleja la situación financiera del individuo (ver discusión en la Nota Suplementaria 1). El límite de crédito se extrae de una base de datos de bancos cifrados e identificado por los números de teléfono de los clientes cifrados registrados en el banco. Por lo tanto, somos capaces de correlacionar precisamente la información financiera de un individuo con su ubicación social en la red de llamadas telefónicas a nivel de país. Hay 5.02 × 105 clientes bancarios que han sido identificados en la red móvil cuyo límite de crédito oscila entre USD $ 50 a $ 3.5 × 105 (convertido desde el país de estudio). Por lo tanto, los conjuntos de datos están conectados con precisión proporcionando una oportunidad sin precedentes para probar la correlación entre la ubicación de la red y el estado financiero.
A pesar de la gran escala de nuestra fuente de datos, observamos que trabajar en un solo país específico como en el presente estudio no es suficiente para otorgar generalidad a nuestros resultados. Para probar la validez general de los resultados actuales, se necesitaría el acceso a conjuntos de datos bancarios y de comunicaciones a nivel de toda la población de otros países. A medida que más conjuntos de datos estén disponibles, la generalidad de nuestros resultados puede ser probada a través de diferentes sistemas económicos y sociales.
La Figura 1a, b muestra los patrones de comunicación geolocalizados en todo el país de los individuos en el 1% superior y el 10% inferior de los límites de crédito, respectivamente. La desigualdad en los patrones de comunicación entre la clase económica superior y la más baja es sorprendente y imita la desigualdad económica a nivel de país27. Es visualmente evidente que el 1% superior (que representa el 45,2% del crédito total en el país) muestra un patrón de comunicación completamente diferente que el 10% inferior; El primero se caracteriza por vínculos más activos y diversos, especialmente conectando ubicaciones remotas y comunicándose con otras personas igualmente afluentes. Otros resultados utilizando el análisis de entropía también sugieren que la estructura de la red puede ser significativamente diferente entre las personas en el ranking de cuantil superior e inferior del límite de crédito (nota complementaria 3, cuadro complementario 1). Ejemplos particulares de las redes de ego ampliadas para dos individuos (con el mismo número de lazos) que ocupan el 1% superior y el 10% inferior proporcionan una imagen ampliada de tales diferencias (Fig. 1c, d, respectivamente). Los 1-por ciento más ricos tienen una mayor diversidad de contactos móviles y están ubicados centralmente, rodeados por otras personas altamente conectadas (hubs de red). Por otro lado, los individuos más pobres tienen una diversidad de contacto baja y están débilmente conectados a menos centros. El quid de la cuestión es encontrar una métrica de red social confiable para cuantificar esta diferencia visual en los patrones de estructura de red entre los ricos y los pobres, como se muestra a continuación.
Figura 1: Los patrones de influencia de la red imitan patrones de desigualdad de ingresos. Visualización de la actividad de comunicación de la población en el primer 1% (con límite de crédito superior a USD $ 25.000, convertido, en el país de estudio) y (b) inferior 10% (con límite de crédito inferior a USD $ 600) del total Clases de límite de crédito. Los enlaces están entre los clientes del banco que han registrado su código postal. La resolución de ambas parcelas es de 1.700 × 1.000. El número de clientes bancarios dentro de cada comunidad se refleja en el tamaño del nodo. El límite de crédito promedio se indica mediante la escala de grises de un nodo. El color y grosor de los bordes refleja el número de eventos de comunicación entre diferentes comunidades. (C) Ejemplos de la red de ego (extendida a dos capas) para un individuo en la clase rica superior del 1% y (d) un individuo en la clase inferior del 10%. Las redes muestran dos patrones distintos de lazos sociales de acuerdo con la alta y baja situación económica: la primera se caracteriza por una IC grande, la segunda por CI baja. (E) Representación esquemática de una red bajo la descomposición de k-shell33. (F) Ejemplo de cálculo de CI. El CI Bola de radio alrededor del nodo i es el conjunto de nodos contenidos dentro de la esfera y ∂Ball es el conjunto de nodos en el límite (marrón). CI es el grado-menos-uno del nodo central veces la suma del grado-menos-uno de los nodos en el límite de la esfera de influencia.
Influencia de la red y situación financiera
Se han considerado muchas métricas o centralidades para caracterizar la influencia o importancia de los nodos en una red3,14,31. Aquí consideramos sólo aquellas centralidades que pueden ser escaladas hasta el tamaño de la red grande considerado aquí (figura 1e, nota adicional 4): (a) la centralidad del grado ki (número de lazos del individuo i) es una de las más simples3, (B) PageRank, de Google fame32, es una centralidad de vectores propios que incluye la importancia no sólo del grado, sino también de los vecinos más próximos, (c) el índice ks del k-shell de un nodo (Figura 1e), es decir, La localización de la cáscara obtenida mediante la poda iterativa de todos los nodos con un grado k<ks (referencia 33), y (d) la CI de un nodo de grado ki (figura 1f) en una esfera de influencia del tamaño definido por la frontera de la bola de influencia , y se prevé que sea por la teoría de percolación óptima26. A diferencia de las otras centralidades heurísticas, CI se deriva de la teoría de la maximización de la influencia en la red34. Por lo tanto, los nodos CI superiores se identifican como influenciadores o distribuidores superiores de información, y lo son colocándose en ubicaciones estratégicas en el centro de esferas rodeadas por cubos situados jerárquicamente a distancias (figura 1d). Estos influyentes colectivos constituyen también un conjunto óptimo que proporciona integridad al tejido social: son el número más pequeño de personas que, al salir de la red (proceso matemáticamente conocido como percolación óptima26), desintegraría la red en pequeñas piezas desconectadas.
Por definición, todas las métricas tienen similitudes (por ejemplo, son proporcionales a k, y PageRank y CI se basan en los autovalores más grandes de las matrices de adyacencia y no retroceso, respectivamente26), y de hecho, encontramos que sus valores en La red de comunicaciones telefónicas están correlacionadas (Tabla 2 suplementaria). Más interesante, la Fig. 2 proporciona evidencia de correlación de las cuatro métricas de la red con el estado financiero (límite de crédito clasificado) cuando controlamos por edad, lo que indica que la ubicación de la red se correlaciona con la situación financiera. En esta figura, se representa la fracción de individuos ricos (definida como el cuarto cuantil superior, equivalente a un límite de crédito superior a USD $ 4.000, véase la Nota Complementaria 5 para detalles sobre los métodos de validación y la referencia 30) en una cuadrícula de muestreo para un valor dado De edad y métrica social como se indica.
Figura 2: Fracción de individuos ricos versus edad y métricas de red. Correlación entre la fracción de individuos ricos frente a la edad y (a) grado k (R2=0.92), (b) k-shell (R2=0.96), (c) PageRank (R2=0.96) y (d) log10CI (R2=0.93). Sólo se muestran en la parcela los grupos con población> 20. Las cuatro métricas se correlacionan bien con la situación financiera cuando se consideran con la edad. Otras correlaciones se estudian en la Nota Suplementaria 6, indicando que CI podría ser considerada como la métrica más conveniente de los cuatro debido a su alta resolución.
Si bien todas las métricas sociales muestran correlaciones con el estado financiero cuando se consideran con la edad (figura 2), la pregunta sigue siendo cuál métrica es el predictor más eficiente. Se observan correlaciones fuertes con el bienestar económico para los pares de características (edad, k-shell, R2 = 0,96, Fig. 2b) y (edad, CI; R2 = 0,93, Fig. 2d). La Nota Suplementaria 6 (Figuras Adicionales 7-9) proporciona una comparación adicional cuando se consideran las métricas por sí solas, indicando que k-shell y CI mejor captan la correlación con el límite de crédito. Entre estas dos métricas, CI garantiza un requisito para una correlación fuerte y suficiente resolución. K-shell no puede capturar más detalles debido a su limitación de valores (k-shell varía de 1 a 23, dividiendo a toda la población en este pequeño número de conchas con una típica concha conteniendo decenas de millones de personas), mientras que CI abarca más de siete órdenes de magnitud; Véase la Fig. 5. Esta alta resolución implica que CI es una firma social más precisa para la situación financiera de los individuos. Según su definición (figura 1d), un nodo CI superior es un hub moderado a fuerte rodeado por otros centros jerárquicamente situados a distancia. Sin embargo, enfatizamos que CI es sólo una estrategia útil por las razones expuestas anteriormente, y de ninguna manera la única o mejor estrategia para correlacionar la riqueza de los individuos y su influencia en la red.
Si bien la teoría detrás de CI es una maximización global de la influencia, CI representa la aproximación local a esta optimización global. Así, CI representa un equilibrio entre una optimización global y su aproximación local, teniendo en cuenta las primeras 2 o 3 capas de vecinos a través del parámetro , que representa el tamaño de la esfera de influencia utilizada para definir la importancia de un nodo. 1d. Al cambiar , descubrimos que CI con es suficiente para capturar la correlación entre la influencia de la red y la riqueza (Figura 10).
Para realizar un seguimiento del efecto de la IC independientemente de la edad, se investigan los efectos de la CI dentro de dos grupos de edad específicos en la Fig. 3a, b. En ambos grupos de edad, la CI alta siempre está acompañada por una población más alta de personas ricas. Una pendiente relativamente menor en el grupo de edad <30 sugiere que el efecto de la red de CI es más sensible para las personas mayores con niveles económicos más maduros y estables que para los jóvenes (Figura 6). Cuando combinamos la edad y la clasificación de cuantil CI en un compuesto de edad-red: ANC=αAge+(1−α) CI, con α = 0,5, se logra una notable correlación (R2 = 0,99, Fig. 3c). Al combinar la información de la red con la edad, la probabilidad de identificar a las personas con un límite de crédito alto alcanza el ~ 70% al nivel más alto de ingresos. Este nivel de precisión hace que el modelo sea práctico para inferir la aptitud financiera de los individuos usando la CI de la red como se muestra a continuación.
Figura 3: Fracción de individuos ricos en diferentes edades y grupos de clasificación compuestos. Correlación entre la fracción de individuos ricos dada por el límite máximo de crédito del 25% y CI en diferentes grupos de edad de (a) 18-30 y (b)> 45. Las correlaciones entre la situación económica superior y la IC grande determinada por los valores de CI en diferentes edades son significativas en todos los grupos de edad, mientras que la pendiente de la regresión lineal es mayor en el grupo de mayor edad (0,053 comparado con 0,037). (C) Clasificación compositiva edad-red ANC = 1/2 Edad + CI 1/2, y (d) clasificación mixta edad-diversidad ADC = 1/2 Edad + 1/2 DR. Mediante la combinación de las métricas de red con la edad en un índice compuesto, la posibilidad de identificar a las personas de alto nivel financiero alcanza ~ 70% para valores altos del compuesto. Ambos R2 muestran un alto nivel de correlación (R2 = 0,99 y 0,96 para ANC y ADC, respectivamente), haciendo ambos compuestos buenos predictores de la riqueza en aplicaciones prácticas.
Validación por campaña de marketing
Para validar nuestra estrategia, realizamos una campaña de marketing social cuyo objetivo es la adquisición de nuevos clientes de tarjetas de crédito, mediante el envío de mensajes a las personas afluentes (identificadas por sus valores de CI) e invitando a los destinatarios a iniciar una solicitud de producto (nota complementaria 8) . Observamos que en este experimento usamos un conjunto de datos independiente de un marco de tiempo diferente, y usamos solamente los valores de CI extraídos de la red para clasificar las personas objetivo. En concreto, utilizamos la red de comunicaciones resultante de la agregación de llamadas y SMS intercambiados entre usuarios durante un período de 91 días. La red social resultante contiene 7,19 × 107 personas y 3,51 × 108 enlaces. La campaña se llevó a cabo en un total de 656.944 personas que fueron objeto de un mensaje SMS ofreciendo el producto de acuerdo a sus valores de CI en la red social. También enviamos mensajes a un grupo de control de 48.000 personas, elegidas al azar. Para evaluar la campaña, se midió la tasa de respuesta, es decir, el número de receptores que solicitaron el producto dividido por el número de personas objetivo, en función de la CI. En el grupo de control, la tasa de respuesta a los mensajes fue 0,331%. Nuestros resultados muestran que los grupos de IC creciente muestran un aumento en su tasa de respuesta, con una triple ganancia sana en la tasa de respuesta de los principales influenciadores (identificados por los valores superiores de CI) en comparación con el caso aleatorio. Cuando comparamos la respuesta de la IC alta con la de CI más baja, la tasa de respuesta se quintuplica. Los resultados del experimento se resumen en la Tabla 1 y en la Fig. 4.
Tabla 1: Resultados de la campaña de marketing de la vida real.
Rango CI
Cuenta
Cuantil
Respuestas
Tasa de respuesta
(0, 48)
66,495
0.1
170
0.26%
(48, 246)
65,164
0.2
218
0.33%
(246, 600)
65,961
0.3
316
0.48%
(600, 1,144)
65,376
0.4
332
0.51%
(1,144, 1,992)
65,477
0.5
363
0.55%
(1,992, 3,408)
65,477
0.6
458
0.70%
(3,408, 6,032)
65,736
0.7
493
0.75%
(6,032, 11,772)
65,641
0.8
555
0.8%
(11,772, 28,740)
65,683
0.9
657
1.0%
(28,740, 2,719,354)
65,683
1.0
573
0.87%
Los individuos ('Cuenta') fueron apuntados según su ranking de cuantil CI en toda la red social obtenida de la actividad de comunicaciones telefónicas. Se calculó la respuesta a la campaña ("Sí contestó") para calcular la tasa de respuesta.
Figura 4: Tasa de respuesta versus cuantil de CI en la campaña de marketing de la vida real basada en CI. La tasa de respuesta aumenta aproximadamente linealmente con la clasificación CI. La campaña de CI-targeting muestra una ganancia triple para los principales influyentes con CI alta, en comparación con una campaña dirigida a un grupo control aleatorizado.
Análisis de la covarianza
Observamos que nuestra validación es indirecta ya que no es una predicción directa de la situación financiera, sino una tasa de respuesta exitosa a una campaña de marketing. Esta tasa de éxito puede depender en realidad de una serie de otros factores que pueden correlacionarse con la centralidad de la red. Por lo tanto, la métrica de CI puede no ser necesariamente la única causa de la tasa de éxito de la campaña específica (por ejemplo, la ubicación geográfica puede ser también importante). Para abordar este punto, realizamos un análisis de la covarianza35 sobre todas las características a las que tenemos acceso (edad, sexo y código postal registrado) para probar la varianza causada por las métricas de la red y otros factores (detalles en la Nota Complementaria 5 y Tabla 3). El análisis de la covarianza muestra que los efectos de las métricas de la red son independientes de los de los otros factores. La correlación entre el CI y la fracción de personas adineradas es positiva y significativa (P <0,001) en todos los grupos de comunidades geográficas, entre géneros y entre todas las edades mayores de 24 años (Figura 6). Los mismos resultados significativos también se obtienen bajo diferentes umbrales de riqueza. Estos efectos de red significativos y sólidos implican que las métricas de red pueden ser un indicador potencial de la situación financiera.
Diversidad de la red y situación financiera
Nuestros conjuntos de datos combinados también ofrecen la posibilidad de probar la importancia de la diversidad de vínculos, medida por lazos con comunidades distantes de la red que no están directamente conectadas con la comunidad de un individuo, a nivel de individuos individuales4,5,6. Para ello, primero detectamos las comunidades en la red social mediante la aplicación de algoritmos rápidos de detección de la modularidad de los pliegues (Nota Suplementaria 7, Figura 11) 36,37. La diversidad de los vínculos de un individuo puede ser cuantificada a través de la relación de diversidad DR = Wout / Win, definida como la proporción de eventos de comunicación total con personas fuera de su propia comunidad, Wout, con aquellos dentro de su propia comunidad, Win. Esta relación está débilmente correlacionada con CI (R = 0,4), lo que sugiere que captura una característica diferente de la influencia de la red. Implementamos las mismas estadísticas de clasificación compuesta como antes, resultando en un compuesto de diversidad de edades ADC = αAge + (1-α) DR, con un peso α = 0.5. El resultado (Fig. 3d) muestra que ADC se correlaciona con el bienestar financiero individual, generalizando los resultados agregados en ref. 6 a nivel individual. Así, las métricas sociales consideradas, DR y CI, expresan el hecho de que los niveles económicos más altos se correlacionan con la capacidad de comunicarse con individuos fuera de la comunidad social local estrechamente unida, una medida del principio de fuerza de los lazos débiles de Granovetter En ubicaciones de red particulares de CI alto que son óptimas para la difusión de la información y la estabilidad estructural de la red social. Observamos que no se puede establecer una inferencia causal con los datos actuales.
Discusión
Este resultado destaca la posibilidad de predecir el estado financiero y los beneficios de las políticas socialmente orientadas basadas en métricas de red, lo que conduce a mejoras tangibles en las campañas de marketing social. El alto rendimiento de la CI entre las métricas de la red también sugiere el posible papel de acceder y mediar información en la oportunidad financiera y el bienestar5. Esto tiene un impacto inmediato en el diseño de campañas de marketing óptimas mediante la identificación de los objetivos ricos sobre la base de su posición influyente en una red social. Este hallazgo puede también elevarse al nivel de un principio, que explicaría la aparición del fenómeno de CI mismo como resultado de la optimización de las interacciones socioeconómicas.
Referencias
1. Newman, M. E. The structure and function of complex networks. SIAM Rev. 45, 167–256 (2003).
2. Vespignani, A. & Caldarelli, G. Large Scale Structure and Dynamics of Complex Networks: from Information Technology to Finance and Natural Science World Scientific (2007).
3. Wasserman, S. & Faust, K. Methods and Applications, Vol. 8 (Cambridge Univ. Press, 1994).
4. Granovetter, M. S. The strength of weak ties. Am. J. Sociol. 78, 1360–1380 (1973).
5. Granovetter, M. The impact of social structure on economic outcomes. J. Econ. Perspect. 19, 33–50 (2005).
6. Eagle, N., Macy, M. & Claxton, R. Network diversity and economic development. Science 328, 1029–1031 (2010).
7. Singh, V. K., Freeman, L., Lepri, B. & Pentland, A. S. in 2013 Internation Conference on Social Computing (SocialCom) 174–179 (Washington, DC, USA, 2013).
8. Powell, W. W. & Smith-Doerr, L. The Handbook of Economic Sociology, Vol. 368, 380 (eds Neil J. Smelser & Richard Swedberg) (Princeton University Press, Princeton, NJ, USA, 1994).
9. Strang, D. & Soule, S. A. Diffusion in organizations and social movements: from hybrid corn to poison pills. Annu. Rev. Sociol. 24, 265–290 (1998).
10. Burt, R. S. Structural Holes: the Social Structure of Competition Harvard Univ. Press (2009).
11. Page, S. E. The Difference: how the Power of Diversity Creates Better Groups, Firms, Schools, and Societies Princeton Univ. Press (2008).
12. Fernandez, R. M. & Weinberg, N. Getting a job: networks and hiring in a retail bank. Graduate Business School Research Paper No. 1382, 1 (University of Stanford, CA, USA, 1996).
13. Zimmer, C. The Art and Science of Entrepreneurship 3–23 (Ballinger, 1986).
14. Freeman, L. C. Centrality in social networks conceptual clarification. Soc. Networks 1, 215–239 (1978).
15. Toole, J. L. et al. Tracking employment shocks using mobile phone data. J. R. Soc. Interface 12, 2015.0185 (2015).
16. Seidel, M.-D. L., Polzer, J. T. & Stewart, K. J. Friends in high places: the effects of social networks on discrimination in salary negotiations. Admin. Sci. Q. 45, 1–24 (2000).
17. Cho, E., Myers, S. A. & Leskovec, J. in Proceedings of the 17th ACM (International Conference on Knowledge Discovery and Data Mining) 1082–1090 (San Diego, CA, USA, 2011).
18. Phithakkitnukoon, S., Smoreda, Z. & Olivier, P. Socio-geography of human mobility: a study using longitudinal mobile phone data. PLoS ONE 7, e39253 (2012).
19. Deville, P. et al. Scaling identity connects human mobility and social interactions. Proc. Natl Acad. Sci. USA 113, 7047–7052 (2016).
20. Pappalardo, L. et al. An analytical framework to nowcast well-being using mobile phone data. Int. J. Data Sci. Anal. 2, 75–92 (2016).
21. Pan, W., Ghoshal, G., Krumme, C., Cebrian, M. & Pentland, A. Urban characteristics attributable to density-driven tie formation. Nat. Commun. 4, 1961 (2013).
22. Gutierrez, T., Krings, G. & Blondel, V. D. Evaluating socio-economic state of a country analyzing airtime credit and mobile phone datasets. Preprint at https://arxiv.org/abs/1309.4496 (2013).
+ Show context
23. Salah, A. A., Lepri, B., Pianesi, F. & Pentland, A. S. in International Workshop on Human Behavior Understanding (eds Salah, A. & Lepri, B.) 1–15 (Springer, 2011).
24. Decuyper, A. et al. Estimating Food Consumption and Poverty Indices with Mobile Phone Data. Technical Report (United Nations Global Pulse, New York, USA, 2014). Preprint at https://arxiv.org/abs/1412.2595 (2014).
25. Blumenstock, J. in Proceedings of 20th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) (New York, NY, USA, 2014).
26. Morone, F. & Makse, H. A. Influence maximization in complex networks through optimal percolation. Nature 524, 65–68 (2015).
27. Stiglitz, J. E. The Price of Inequality: how Today’s Divided Society Endangers our Future W. W. Norton & Company (2012).
28. Onnela, J.-P. et al. Structure and tie strengths in mobile communication networks. Proc. Natl Acad. Sci. USA 104, 7332–7336 (2007).
29. Gonzalez, M. C., Hidalgo, C. A. & Barabasi, A.-L. Understanding individual human mobility patterns. Nature 453, 779–782 (2008).
30. Eagle, N., Pentland, A. S. & Lazer, D. Inferring friendship network structure by using mobile phone data. Proc. Natl Acad. Sci. USA 106, 15274–15278 (2009).
31. Pei, S. & Makse, H. A. Spreading dynamics in complex networks. J. Stat. Mech. Theor. Exp. 2013, P12002 (2013).
32. Page, L., Brin, S., Motwani, R. & Winograd, T. The Pagerank Citation Ranking: bringing Order to the Web. Technical Report 422 (Stanford InfoLab, Palo Alto, CA, USA, 1998).
33. Kitsak, M. et al. Identification of inuential spreaders in complex networks. Nat. Phys. 6, 888–893 (2010).
34. Kempe, D., Kleinberg, J. & Tardos, É. in Proceedings of 9th ACM SIGKDD (International Conference on Knowledge Discovery and Data Mining) 137–146 (Seattle, WA, USA, 2003).
35. Wildt, A. R. & Ahtola, O. Analysis of Covariance, Vol. 12 (Sage Publications, 1978).
36. Blondel, V. D., Guillaume, J.-L., Lambiotte, R. & Lefebvre, E. Fast unfolding of communities in large networks. J. Stat. Mech. Theor. Exp. 2008, P10008 (2008).
37. Newman, M. E. Analysis of weighted networks. Phys. Rev. E 70, 056131 (2004).