Número de pasajeros vs cobertura: el dilema del planificador de transporte
Por Jarrett Walker y Christopher Yuen | City Metric
¿Su agencia estatal de planificación de tránsito tiene éxito? Depende de lo que esté tratando de hacer, y la mayoría de las agencias de tránsito no han recibido instrucciones claras sobre lo que deberían tratar de hacer. Peor aún, les dicen que hagan cosas contradictorias. Es como si le dijera a su taxista que giró a la izquierda y derecha al mismo tiempo, y luego los criticó por haber tomado la dirección equivocada.
Por un lado, esperamos que las agencias de tránsito persigan un objetivo de usuarios. Sin embargo, también exigimos que proporcione un pequeño servicio para todos, lo que se llama un objetivo de cobertura. El objetivo de cobertura requiere que una agencia ejecute servicios de baja audiencia predecibles, por motivos que no sean de pasajeros, por lo que es lo contrario de un objetivo de usuarios
En la ciudad de ficción a continuación, los pequeños puntos indican viviendas y edificios comerciales y otros usos de la tierra. Las líneas indican carreteras, y los 18 autobuses indican los recursos que la ciudad tiene para ejecutar el tránsito. La mayor parte de la actividad en la ciudad se concentra en unos pocos caminos, como en la mayoría de las ciudades.
Una agencia de tránsito que persigue solo un objetivo de pasajeros enfocaría el servicio en las calles donde hay un gran número de personas, donde caminar hasta las paradas de tránsito es fácil y las rutas directas se sienten directas y rápidas para los clientes. Debido a que el servicio se concentra en menos rutas, la frecuencia es alta y un autobús siempre llegará pronto.
Esto daría como resultado una red como la siguiente.
Los 18 autobuses se concentran en las áreas más concurridas. Las esperas por el servicio son cortas, pero las caminatas al servicio son más largas para las personas en áreas menos pobladas. La frecuencia y el número de usuarios son altos, pero algunos lugares no tienen servicio.
¿Por qué es esta la alternativa máxima de pasajeros? Tiene que ver con el pago no lineal tanto de alta densidad como de alta frecuencia, como se explica más detalladamente aquí.
Si la ciudad persigue solo un objetivo de cobertura, por otro lado, la agencia de tránsito extenderá los servicios para que cada calle tenga una ruta de autobús, como en la red de abajo. Difundirlo suena genial, pero también significa diseminarlo.
Los 18 autobuses están repartidos de manera que haya una ruta en cada calle. Todo el mundo vive cerca de una parada, pero cada ruta es poco frecuente, incluso en las carreteras principales, y el servicio es largo. Solo unas pocas personas pueden esperar tanto tiempo, por lo que el número de pasajeros es bajo.
En estos dos escenarios, la ciudad usa la misma cantidad de autobuses. Estas dos redes cuestan la misma cantidad para operar, pero ofrecen resultados muy diferentes.
Las redes orientadas a los pasajeros sirven varios objetivos populares para el tránsito, que incluyen:
Reducir el impacto ambiental a través de menores millas recorridas por vehículos;
Lograr un bajo subsidio público por jinete, a través de servir a más jinetes con los mismos recursos, y a través de tarifas recogidas de más pasajeros;
Apoyar el desarrollo urbano continuo, a densidades más altas, sin verse limitado por la congestión del tráfico;
Reducir el costo de las ciudades para construir y mantener carreteras y puentes al reemplazar viajes de automóviles con viajes de tránsito, y al permitir la vida sin automóviles para algunas personas que viven cerca de corredores de tránsito densos y transitables.
Por otro lado, las redes orientadas a la cobertura cumplen un conjunto diferente de objetivos, que incluyen:
Asegurar que todos tengan acceso a algún servicio de tránsito, sin importar dónde vivan;
Proporcionar acceso vital a servicios críticos para aquellos que no pueden conducir;
Proporcionar acceso a personas con necesidades severas;
Proporcionar un sentido de equidad política, proporcionando servicio a cada municipio o distrito electoral.
Las metas de viaje y cobertura son loables, pero nos llevan en direcciones opuestas. Dentro de un presupuesto fijo, si una agencia de tránsito quiere hacer más de una, debe hacer menos de la otra.
Debido a eso, las ciudades y las agencias de tránsito deben tomar una decisión clara con respecto a la compensación de Jubilación-Cobertura. De hecho, alentamos a las ciudades a desarrollar un consenso sobre una Política de asignación de servicios, que toma la forma de un porcentaje de división de recursos entre los diferentes objetivos.
Por ejemplo, una agencia puede decidir asignar el 60 por ciento de su servicio hacia la Meta de Nro. de Pasajeros y el 40 por ciento hacia la Meta de Cobertura.
Los principales rediseños de red a menudo cambian este equilibrio, intencionalmente y conscientemente. Cuando dirigimos un rediseño de la red de autobuses en Houston, dirigimos una discusión con los líderes elegidos sobre sus prioridades, y decidieron cambiar el enfoque de su red del 80 por ciento de cobertura al 5 por ciento de cobertura. Sabían de antemano cuál sería el resultado: una red más útil, con el potencial de aumentar la cantidad de pasajeros, pero también muchas personas enojadas en áreas que ya no se prestaban.
¿Qué hay de tu ciudad? ¿Cuál crees que debería ser la división entre el número de usuarios y la cobertura? La respuesta dependerá de tus preferencias y valores. Para las ciudades, debería ser decisión de los funcionarios electos, informados por el público.
Después de explorar y limpiar los datos aquí, podemos recopilar un conjunto de datos que consta de 640 colaboraciones en películas altamente calificadas, y 653 colaboraciones en películas de baja calificación.
Ahora lo que tenemos que hacer es importar los archivos csv a Gephi. Hay algunas otras herramientas para mapeo de red, como igraph en R o networkx en Python. Sin embargo, en este proyecto, elijo usar Gephi debido a su usabilidad y diseño diversos.
Red de actores en películas altamente calificadas:
La red de actores en películas altamente calificadas tiene forma de celda, con colaboraciones de actores no tan famosos en los bordes, y una red de colaboraciones entre los nombres familiares de Hollywood en el centro.
Hay 178 clases de modularidad (subcomunidades) en el conjunto de datos. La mayoría de las subcomunidades tienen menos de 5 nodos, sin embargo, podemos ver un puñado de subcomunidades con más de 15 nodos, que giran en torno a grandes nombres de la casa como Tom Hanks, Leonardo DiCaprio, Robert De Niro, etc. o tipos de películas (superhéroes, Western, etc.).
Red de las principales estrellas de Hollywood. ¿Puedes nombrar las películas que colaboran entre sí?
La red de superhéroes Batman, Black Widow y Wolverine probablemente estén vinculados por The Prestige, una película sobre magos. Tiene sentido, porque no son superhéroes mágicos?
Los tamaños de los nodos representan sus influencias en la red (centralidad eigenvector). El líder es Tom Hanks (EC = 1), seguido de cerca por Leonardo DiCaprio y Robert De Niro en el rango de 0.9. Brad Pitt, Johnny Depp, Christian Bale y Morgan Freeman también se encuentran entre los nodos más grandes de la red.
Sin embargo, eso lleva a la pregunta: ¿Dónde están las mujeres?
La actriz que tiene la mayor influencia en la red es Kate Winslet con un EC de 0.45079, que es menos de la mitad de Tom Hanks. Meryl Streep, la actriz favorita de los Oscar, es segunda con un EC de 0.376124. Jennifer Lawrence, a pesar de su impresionante trayectoria ganadora de premios a temprana edad, tiene un mero EC de 0.291412.
Aquí hay una foto del nodo de Kate junto a otras actrices (¡y actores!) Igualmente influyentes:
Y aquí está el nodo de Kate en comparación con los nodos más grandes de actores (masculinos).
¿El CE bajo general de las actrices solo existe en las películas altamente calificadas? ¿Qué hay de los humildes? ¡Nos encontraremos pronto!
Red de actores en películas de baja calificación:
Al igual que en la red de las películas mejor calificadas, la red de películas de baja calificación también tiene forma de celda.
Aquí hay una vista general de la red.
Muy disperso, lo sé. Aquí hay una mirada más cercana para capturar los nodos más grandes:
Podemos notar algunos puntos interesantes.
En primer lugar, algunos actores que aparecen en las listas de películas altamente calificadas también aparecen aquí. Tenemos a Johnny Depp, Matthew McConaughey, Brad Pitt, Morgan Freeman, Anthony Hopkins y, por supuesto, a Robert De Niro, por nombrar algunos. Robert De Niro con un CE de 1 también es el actor con mayor influencia en la lista de películas de baja calificación.
En segundo lugar, la aparición de las actrices con grandes nodos en la lista.
Angelina Jolie Pitt tiene un EC de 0.59355, lo que hace que su nodo sea el tercero más grande en la lista (después de Robert De Niro y Dwayne Johnson). Mila Jovovich sigue con un EC de 0.5738. Ambos son más altos en comparación con el EC de Kate Winslet en la lista de películas altamente calificadas.
Conclusión:
Podemos decir que Tom Hanks y Leo DiCaprio tienen muy buen gusto en las películas. Si bien son los nodos más grandes en la lista de películas altamente calificadas, no existen o tienen una influencia muy baja en la lista de bajas calificaciones.
Johnny Depp, Matthew McConaughey, Brad Pitt, Morgan Freeman, Anthony Hopkins, etc. tienen un buen gusto al elegir películas. Algunas de sus elecciones son realmente buenas; algunos son muy malos También podrían estar en esas malas películas por el bien de ganar dinero, quién sabe.
Robert De Niro tiene un gusto extremo al elegir películas. Sin embargo, todavía me gusta él.
Las actrices tienden a tener menos influencia en películas altamente calificadas, y más influencia en las de baja calificación. ¿Por qué? Todavía no me he enterado.
Solo cuando comencé a escribir la conclusión me di cuenta de que no pesaba en la posición de las películas en las listas ni en las puntuaciones reales de IMDB de las películas mientras mapeaba la red. Una mejora de este análisis debe pesar esas características en el algoritmo.
Los Premios de la Academia 2017 se anunciarán mañana (26/02/2017). ¿Están el ganador del Oscar y el puntaje de IMDB correlacionado? Tal vez tal vez no.
Las matemáticas están revolucionando el estudio de la historia: así es como
Matteo Valleriani Senior Research Fellow, Max Planck Institute for the History of Science The conversation
El estudio de la historia tradicionalmente trae a la mente imágenes de archivos oscuros y sinuosos y el olor a polvo; visiones de académicos examinando montones de documentos para descubrir secretos y encontrar la pieza faltante, montones que invariablemente son demasiado pequeños para cubrir el tema y demasiado altos para ser tratados.
Pero gracias a internet, una cantidad casi inconcebible de fuentes está ahora disponible para el historiador. La base de la investigación histórica (manuscritos, libros raros, imágenes y documentos de naturaleza privada y administrativa, como cartas y planes financieros) ahora se puede acceder desde casi cualquier lugar. Y esta mayor cantidad de fuentes históricas disponibles no solo significa que ahora lo sabemos mejor. Significa que ahora, podemos conocerlo de otra manera. Esta cantidad ha afectado la naturaleza de nuestra investigación. No solo ha cambiado los tipos de respuestas que el estudio histórico puede proporcionar, sino también qué preguntas formulamos.
La historia viene en dos sabores. Existe lo que yo llamo microhistoria, y luego está la reconstrucción histórica a largo plazo. El primero se caracteriza por estudios de caso detallados pero espacialmente limitados en el tiempo; el segundo es más bien una reflexión de segundo orden orientada por una hipótesis histórica. Este tipo abarca un largo lapso espacial y temporal, pero está informado por un número limitado de casos de estudio seleccionados.
Esto ha restringido por mucho tiempo el tipo de historia que se puede estudiar. Pero mediante el análisis matemático de grandes conjuntos de datos históricos, es posible integrar los dos enfoques, realizando un análisis profundo de fuentes de forma sistemática y cubriendo largas distancias espaciales y temporales. En el campo de la historia de la ciencia, en el que trabajo, esto nos permite investigar cómo se formaron los sistemas de conocimiento científico que ahora dictan nuestras vidas.
¿Por qué es esto posible? Primero, porque la selección de fuentes contra las cuales se prueban, modifican y, a veces se rechazan, las hipótesis históricas ha aumentado. Pero también porque un número tan grande de fuentes permite la consideración de más perspectivas simultáneamente.
Estos nuevos métodos permiten a los historiadores analizar datos mucho más variados de lo que era posible anteriormente. Pakula Piotr / Shutterstock.com
Una nueva historia
Por ejemplo, los historiadores del conocimiento ahora no solo pueden considerar un corpus de fuentes mucho más grande, como una gran cantidad de tratados científicos del pasado, sino también las fuentes relacionadas con el contexto institucional, económico y social en el que se produjeron tales tratados. Los historiadores han pedido durante mucho tiempo una historia de conocimiento contextualizada, pero hasta ahora, las reconstrucciones históricas a largo plazo solo podían conectar unos pocos ejemplos bien estudiados por medio de hipótesis específicas de naturaleza económica o conceptual.
Pero si un corpus de fuentes mucho más grande puede ser considerado y analizado en detalle, podemos reflexionar más ampliamente sobre los mecanismos de evolución del conocimiento. Esto nos permite avanzar hacia una comprensión más abstracta de nuestro pasado. Podemos hablar sobre los mecanismos de la historia, y otras humanidades, de una manera totalmente nueva e informada.
Una nueva disciplina, las humanidades digitales, surgió para permitir a los académicos administrar esta gran cantidad de información. Las fuentes históricas, sus copias electrónicas y los metadatos bibliográficos están cada vez más inmersos en un marco de anotaciones, ideas y relaciones electrónicamente producidas por los historiadores mientras estudian nuestro patrimonio material e intelectual. Se han creado repositorios apropiados para todos estos datos y se está desarrollando un formato estándar para su preservación y reutilización independientemente de estas plataformas y herramientas.
El acceso abierto a los datos, incluso más que a las publicaciones, se está convirtiendo en un imperativo. La escritura de la historia está llevando a las humanidades a contribuir a esa nueva frontera de la ciencia llamada Big Data.
Historiador-matemáticos
Entonces los historiadores ahora también tienen que entender sus propias matemáticas. Si bien una base de datos nunca es mucho más que una expresión de álgebra aritmética o lineal, la creciente cantidad de datos disponibles exige un enfoque más sofisticado. Al unir fuerzas con la sociología, la escritura de historia está ahora entrando en una nueva fase, caracterizada por la aplicación de algoritmos y flujos de trabajo tomados del campo del análisis de redes sociales.
Un ejemplo de visualización de una red social. Grandjean Martin, CC BY-SA
Los datos históricos están siendo explorados por medio de visualizaciones de gráficos y parámetros de red. En particular, algunos modelos y paquetes permiten a los historiadores simular cómo las redes cambian según las decisiones de los involucrados. Estas simulaciones se basan en hipótesis formuladas por los historiadores y codificadas en los guiones. Un ejemplo de hipótesis podría ser "las diferencias religiosas no representan ningún obstáculo para la comunicación en la sociedad científica".
Por ejemplo, el historiador Ingeborg van Vugt ha utilizado este enfoque de varias capas para explorar las diferentes formas en que circuló la información en la República de las Letras, la comunidad intelectual de larga distancia de finales del siglo XVII y XVIII en Europa y América. Tal investigación nos permite visualizar mejor cómo se desarrolló la Era de la Ilustración, impulsada por estos intelectuales. El siguiente paso podría ser estadísticamente modelar esta red, y así poder continuar con su pregunta de investigación integrando una cantidad de datos aún más amplia.
Un modelo de red para estudios en historia del conocimiento debe considerar un conjunto de datos inusualmente variado. Están los datos de naturaleza social relacionados con personas y organizaciones; relacionado con aspectos materiales de la historia, como la vida de conservación de un libro; y los datos que representan el conocimiento real, el contenido de las fuentes. Estos son tres niveles diferentes de una y la misma red en evolución para los cuales los modelos matemáticos explicativos han sido concebidos raramente y aún menos realizados. Desde esta perspectiva, la escritura de la historia está a punto de desafiar las estadísticas aplicadas.
Aunque el modelado matemático en el marco de la historia está claramente en sus primeros pasos, su introducción ya parece imparable. Esto está creando las condiciones para el surgimiento de una nueva visión, según la cual podríamos desarrollar modelos matemáticos generales para explicar cómo las ideas y el conocimiento cambiaron desde una perspectiva social e histórica. Quizás podríamos incluso utilizar estos modelos en diferentes áreas de investigación científica dedicadas al presente y al futuro. Y en un futuro así, las humanidades y la ciencia exacta comenzarán a usar el mismo lenguaje matemático.
La trama rusa empleó redes chavistas para agravar la crisis catalana
Un análisis de más de cinco millones de mensajes de la Universidad George Washington revela que RT y Sputnik usaron miles de cuentas para propagar una imagen negativa de España antes y después del 1-O
La trama rusa empleó redes chavistas para agravar la crisis catalana
Dos medios del Kremlin, RT y Sputnik, se valieron de un elevadísimo número de cuentas en redes sociales en el entorno del chavismo y Venezuela para propagar una imagen negativa de España en las jornadas anteriores y posteriores al referéndum del 1 de octubre, según un pormenorizado análisis de más de cinco millones de mensajes de la universidad George Washington, en EE UU. El informe advierte de la “grave crisis de reputación, política y económica en España y en la UE”.
La principal conclusión del estudio es que los líderes políticos y las instituciones tradicionales han perdido peso a la hora de influir en la opinión pública. Su lugar lo han ocupado otros actores, mucho más difíciles de seguir y controlar, y que ya no se circunscriben al ámbito político y mediático de un solo país. En el caso del pulso soberanista catalán, la narrativa de los partidos constitucionalistas en el Gobierno y en la oposición quedó reducida por una compleja red de mensajes originados en medios prorrusos y amplificados en parte por el chavismo.
Para el estudio se ha utilizado un software avanzado de medición y análisis de big data que utiliza tecnología española. Su autor, Javier Lesaca, es investigador visitante en la Escuela de Medios y Asuntos Públicos de la George Washington University. Ha analizado en total 5.029.877 mensajes en Twitter, Facebook y otras redes sociales que emplearon los términos Cataluña, Catalunya y Catalonia entre el 29 de septiembre y el 5 de octubre.
“Lo más sorprendente de la investigación ha sido descubrir todo un ejército de cuentas zombis perfectamente coordinadas que se dedican a compartir contenidos generados por RT y Sputnik en diversas conversaciones digitales, que van desde Siria y Estados Unidos hasta Cataluña”, asegura Lesaca. “Hay indicios para pensar que el patrón de disrupción digital que se ha detectado en debates digitales sobre las elecciones de Estados Unidos o el Brexit se ha producido también en Cataluña y que los actores de esta disrupción son los mismos”.
La trama rusa empleó redes chavistas para agravar la crisis catalana La red de injerencia rusa sitúa Cataluña entre sus prioridades para debilitar Europa
Desde la mesa del Consejo de Ministros se reconoció este viernes que el Gobierno tiene información contrastada de que en la crisis catalana ha habido mensajes disruptivos procedentes de “territorio ruso” y se añadió que había “de otros lugares”, informa Anabel Díez. Fuentes gubernamentales reconocieron posteriormente que con esos “otros lugares” se referían a Venezuela.
Un claro ejemplo: RT publicó múltiples noticias sobre Cataluña. Estas se difundieron luego en redes sociales, provocando una conversación con mensajes y respuestas en las que uno de los términos más empleados fue #VenezuelaSaludaACataluña, por encima de menciones a la OTAN, la UE o Julian Assange. En lo que respecta a Sputnik, la segunda noticia más compartida fue: “Maduro: Rajoy debe responder al mundo por lo que ha hecho en Cataluña”.
La mitad de las noticias compartidas por RT en las jornadas inmediatamente anteriores y posteriores al referéndum del 1 de octubre fueron sobre la supuesta violencia policial, con titulares como: “Fuertes vídeos: la brutal represión de la policía contra los votantes del referéndum catalán” o “Cataluña elige su destino entre porras y balas de goma”.
El análisis de los mensajes en redes sobre la crisis catalana revela que los dos medios rusos, financiados ambos por el Kremlin, lograron que sus enlaces se compartieran más que los de los medios públicos españoles EFE y RTVE, o que cabeceras privadas internacionales como The Guardian o CNN. Según concluye el informe, “los conglomerados mediáticos rusos RT y Sputnik han participado en una estrategia deliberada de disrupción en la conversación digital global sobre Cataluña”.
Es significativa la plataforma que emplearon para propagar y viralizar esos mensajes, según el análisis de Lesaca: la mayoría, un 32%, fueron cuentas chavistas o de Venezuela, seguidas por perfiles falsos o automatizados (25%), cuentas anónimas con coberturas reales que sólo se dedican a difundir contenido de RT y Sputnik (30%) y canales oficiales de estos dos medios (10%). Solo un 3% de la conversación obedeció a perfiles reales fuera de esos grupos de interés. Una de las cuentas más activas fue @MarinoEscalante en Twitter, que ha compartido enlaces de RT con mensajes como “Rajoy y el Rey franquista de #España ven la paja en el ojo de Maduro, pero no en #Cataluña”.
Esta procedencia queda confirmada por el análisis de las cuentas que a la hora de publicar mensajes en Twitter, Facebook y otras redes sociales hacen pública su geolocalización. Venezuela es su ubicación más común por detrás de España. De entre los que compartieron el contenido de RT sobre la crisis catalana, un 13,18% están en Venezuela.En el caso de Sputnik, son un 10,46%.
Como afirma el informe, la mayoría de perfiles digitales anónimos analizados “están asociados a cuentas o nodos que se originan en Venezuela y que claramente muestran su simpatía hacia el régimen de Nicolás Maduro, el Partido Socialista Unido de Venezuela o su líder [difunto] Hugo Chávez”. El estudio añade que “en algunos casos, se detecta que esas cuentas publican el mismo contenido al mismo tiempo, reforzando la hipótesis del empleo de robots”.
El empleo de los bots es crucial en este tipo de estrategias de disrupción: se crean noticias inventadas o con enfoques partidistas o manipulados. Luego se publican en algún foro, por oscuro que sea. Después, se difunden los mensajes en redes sociales y una verdadera legión de cuentas falsas procede a compartirlos de forma automática, haciendo que los algoritmos digitales les dediquen un lugar destacado.
Según Lesaca, “los sistemas democráticos tienen la obligación de investigar estos indicios e implementar métodos sistemáticos de monitoreo y respuesta frente a presuntas disrupciones de agentes extranjeros. Las guerras y conflictos internacionales se están librando ya en la opinión pública”.
UNA RED EN CUYO CENTRO ESTÁ VENEZUELA
El gran entramado de cuentas en redes sociales que controlan tanto Rusia como el chavismo logró que una determinada interpretación de la crisis catalana dominara la conversación global en foros como Twitter. Lo demuestra el gráfico que encabeza esta información, que identifica visualmente las cuentas más activas y las conexiones entre estas.
Esas informaciones, que habitualmente describen una supuesta brutalidad policial en el referéndum del 1 de octubre y que en ocasiones restaban importancia a que el referéndum hubiera sido ilegalizado por la justicia, fueron compartidas con mayor intensidad —los puntos rojos— por cuentas chavistas, que ocuparon el lugar central de la conversación social sobre la crisis en Cataluña.
Los vídeos más compartidos en esas redes, por ejemplo, fueron los que mostraban cargas policiales durante el referéndum, con mensajes alarmistas y en ocasiones con opiniones que referían a una supuesta carencia democrática del Estado español en esta crisis.
Es decir: hubo un esfuerzo consciente y coordinado por parte de esas cuentas en la órbita venezolana por amplificar al máximo las informaciones procedentes de los medios estatales rusos RT y Sputnik, algo que también hicieron activistas en la órbita rusa como Edward Snowden.
El estudio apunta la conclusión clara de esta estrategia: “La narrativa que generaron los grupos pro-independentistas, contraria al Gobierno de España, dominó la conversación de forma hegemónica en inglés, español y catalán”.
El CEO de Cambridge Analytica Alexander Nix habla en la Cumbre Concordia 2016 - Día 1 en Grand Hyatt New York el 19 de septiembre de 2016 en la ciudad de Nueva York. Bryan Bedder vía Getty Images
Revelado: 50 millones de perfiles de Facebook cosechados para Cambridge Analytica en violación de datos importantes
Delator describe cómo la empresa vinculada al ex asesor de Trump, Steve Bannon compiló los datos de los usuarios para apuntar a los votantes estadounidenses
• Cómo los algoritmos de Cambridge Analytica convirtieron los "me gusta" en una herramienta política
Carole Cadwalladr y Emma Graham-Harrison | The Guardian
Denunciante de Cambridge Analytica: 'Gastamos $ 1m recolectando millones de perfiles de Facebook' - video
La firma analítica de datos que trabajó con el equipo electoral de Donald Trump y la ganadora campaña Brexit recolectó millones de perfiles de Facebook de votantes estadounidenses, en una de las infracciones de datos más grandes del gigante tecnológico, y los usó para construir un poderoso programa de software para predecir e influir en las elecciones en las urnas.
Un denunciante ha revelado al observador cómo Cambridge Analytica - una empresa propiedad del multimillonario de fondos de cobertura Robert Mercer, y encabezada en ese momento por el asesor clave de Trump, Steve Bannon - usó información personal tomada sin autorización a principios de 2014 para construir un sistema que pudiera perfilarse votantes estadounidenses individuales, con el fin de dirigirlos a ellos con publicidades políticas personalizadas.
Christopher Wylie, el alcahuete de Cambridge Analytica
Christopher Wylie, que trabajó con un académico de la Universidad de Cambridge para obtener los datos, le dijo al observador: "Aprovechamos Facebook para recolectar millones de perfiles de personas. Y construyó modelos para explotar lo que sabíamos acerca de ellos y apuntar a sus demonios internos. Esa fue la base sobre la que se basó toda la compañía ".
Los documentos vistos por el Observer, y confirmados por una declaración de Facebook, muestran que a fines de 2015 la compañía había descubierto que la información se había recolectado a una escala sin precedentes. Sin embargo, en ese momento no alertó a los usuarios y tomó solo medidas limitadas para recuperar y proteger la información privada de más de 50 millones de personas.
Perfiles Cambridge Analytica: los jugadores clave
Alexander Nix, CEO
Antiguo Etoniano de la Universidad de Manchester, Nix, de 42 años, trabajó como analista financiero en México y el Reino Unido antes de unirse a SCL, una empresa de comunicaciones estratégicas, en 2003. Desde 2007 asumió la división de elecciones de la compañía, y afirma tener trabajó en 260 campañas a nivel mundial. Estableció Cambridge Analytica para trabajar en Estados Unidos, con la inversión de Robert Mercer. Aleksandr Kogan, minero de datos
Aleksandr Kogan nació en Moldavia y vivió en Moscú hasta la edad de siete años, luego se mudó con su familia a los Estados Unidos, donde se convirtió en ciudadano naturalizado. Estudió en la Universidad de California, Berkeley, y obtuvo su doctorado en la Universidad de Hong Kong antes de unirse a Cambridge como profesor de psicología y experto en psicometría de redes sociales. Estableció Global Science Research (GSR) para llevar a cabo la investigación de datos de CA. Mientras estuvo en Cambridge, aceptó un puesto en la Universidad Estatal de San Petersburgo y también recibió becas del gobierno ruso para investigación. Cambió su nombre a Spectre cuando se casó, pero luego volvió a Kogan. Steve Bannon, ex miembro de la junta
Un ex banquero de inversión convertido en un svengali de medios "alt-right", Steve Bannon era el jefe del sitio web Breitbart cuando conoció a Christopher Wylie y Nix y aconsejó a Robert Mercer que invierta en investigación de datos políticos estableciendo CA. En agosto de 2016 se convirtió en el CEO de campaña de Donald Trump. Bannon alentó a la estrella de televisión a adoptar la agenda "populista, nacionalista económico" que lo llevaría a la Casa Blanca. Eso le valió a Bannon el puesto de estratega jefe del presidente y durante un tiempo fue posiblemente el segundo hombre más poderoso de Estados Unidos. Para agosto de 2017, su relación con Trump se había agriado y él estaba fuera. Robert Mercer, inversor
Robert Mercer, de 71 años, es un informático y multimillonario de fondos de cobertura, que usó su fortuna para convertirse en uno de los hombres más influyentes en la política estadounidense como uno de los principales donantes republicanos. Un experto en inteligencia artificial, hizo una fortuna con los pioneros en comercio cuantitativo Renaissance Technologies, y luego construyó un cofre de guerra de 60 millones de dólares para respaldar causas conservadoras mediante el uso de un vehículo de inversión offshore para evitar los impuestos estadounidenses. Rebekah Mercer, inversionista
Rebekah Mercer es matemática de Stanford y trabajó como comerciante, pero su influencia proviene principalmente de los miles de millones de su padre. El cuarenta y tantos, la segunda de las tres hijas de Mercer, encabeza la fundación familiar que canaliza el dinero a los grupos de derecha. Los mega-donantes conservadores respaldaron a Breitbart, Bannon y, más influyente, invirtieron millones en la campaña presidencial de Trump.
The New York Times informa que todavía se pueden encontrar copias de los datos recopilados para Cambridge Analytica en línea; su equipo de informes había visto algunos de los datos sin procesar.
Los datos fueron recolectados a través de una aplicación llamada thisisyourdigitallife, construida por el académico Aleksandr Kogan, separada de su trabajo en la Universidad de Cambridge. A través de su empresa Global Science Research (GSR), en colaboración con Cambridge Analytica, se les pagó a cientos de miles de usuarios para que realicen una prueba de personalidad y acordaron que se recopilaran sus datos para uso académico.
Sin embargo, la aplicación también recopiló la información de los amigos de Facebook de los candidatos, lo que llevó a la acumulación de un grupo de datos de decenas de millones de personas. La "política de plataforma" de Facebook permitió solo la recopilación de datos de amigos para mejorar la experiencia del usuario en la aplicación y prohibió su venta o uso para publicidad. El descubrimiento de la recolección de datos sin precedentes, y el uso que se le dio, plantea nuevas preguntas urgentes sobre el papel de Facebook en la selección de votantes en las elecciones presidenciales de Estados Unidos. Se produce solo semanas después de las acusaciones de 13 rusos formuladas por el asesor especial Robert Mueller, que afirmaba que habían utilizado la plataforma para perpetrar una "guerra de información" contra los EE. UU.
Cambridge Analytica y Facebook son un foco de una investigación sobre datos y política realizada por la Oficina del Comisionado de Información británico. Por otro lado, la Comisión Electoral también está investigando qué papel desempeñó Cambridge Analytica en el referéndum de la UE.
"Estamos investigando las circunstancias en que los datos de Facebook pueden haber sido adquiridos y utilizados ilegalmente", dijo la comisionada de información Elizabeth Denham. "Es parte de nuestra investigación en curso sobre el uso de análisis de datos para fines políticos que se inició para considerar cómo los partidos políticos y las campañas, las empresas de análisis de datos y las plataformas de redes sociales en el Reino Unido están utilizando y analizando información personal de las personas para micro-segmentar a los votantes. "
El viernes, cuatro días después, The Observer buscó comentarios para esta historia, pero más de dos años después de que se informara la violación de datos, Facebook anunció que suspendería Cambridge Analytica y Kogan de la plataforma, a la espera de más información sobre el uso indebido de datos. Por otra parte, los abogados externos de Facebook advirtieron al observador que estaba haciendo acusaciones "falsas y difamatorias", y se reservaron la posición legal de Facebook.
Consejero clave de Trump Steve Bannon
Las revelaciones provocaron una indignación generalizada. La fiscal general de Massachusetts, Maura Healey, anunció que el estado lanzaría una investigación. "Los residentes merecen respuestas inmediatamente de Facebook y Cambridge Analytica", dijo en Twitter.
El senador demócrata Mark Warner dijo que la recolección de datos en una escala tan amplia para la focalización política subrayó la necesidad de que el Congreso mejore los controles. Ha propuesto una Ley de anuncios honestos para regular la publicidad política en línea de la misma manera que la televisión, la radio y la prensa. "Esta historia es más evidencia de que el mercado de publicidad política en línea es esencialmente el Salvaje Oeste. Ya sea que les permita a los rusos comprar avisos políticos, o una amplia microtelevisión basada en datos de usuarios mal comprados, está claro que, si no se regula, este mercado seguirá siendo propenso al engaño y carente de transparencia ", dijo.
El mes pasado, tanto Facebook como el CEO de Cambridge Analytica, Alexander Nix, dijeron en una investigación parlamentaria sobre noticias falsas: que la compañía no tenía ni usaba datos privados de Facebook.
Simon Milner, director de políticas del Reino Unido de Facebook, cuando se le preguntó si Cambridge Analytica tenía datos de Facebook, le dijo a los parlamentarios: "Pueden tener muchos datos, pero no serán datos de usuarios de Facebook". Pueden ser datos sobre personas que están en Facebook que se han reunido, pero no son datos que hemos proporcionado ".
El director ejecutivo de Cambridge Analytica, Alexander Nix, dijo a la consulta: "No trabajamos con datos de Facebook y no tenemos datos de Facebook".
Wylie, un experto en análisis de datos canadiense que trabajó con Cambridge Analytica y Kogan para diseñar e implementar el esquema, mostró un dosier de pruebas sobre el uso indebido de datos para el Observer que parece suscitar preguntas sobre su testimonio. Lo ha pasado a la unidad de ciberdelincuencia de la Agencia Nacional de Crimen y a la Oficina del Comisionado de Información. Incluye correos electrónicos, facturas, contratos y transferencias bancarias que revelan que más de 50 millones de perfiles, en su mayoría pertenecientes a votantes estadounidenses registrados, se obtuvieron del sitio en una de las mayores violaciones de datos de Facebook. Facebook el viernes dijo que también estaba suspendiendo a Wylie de acceder a la plataforma mientras llevaba a cabo su investigación, a pesar de su papel como delator.
En el momento de la violación de los datos, Wylie era un empleado de Cambridge Analytica, pero Facebook lo describió como que trabajaba para Eunoia Technologies, una empresa que creó por su cuenta después de dejar a su antiguo empleador a finales de 2014.
La evidencia que Wylie suministró a las autoridades del Reino Unido y los EE. UU. Incluye una carta de los propios abogados de Facebook que le enviaron en agosto de 2016, pidiéndole que destruya todos los datos que tenía recogidos por GSR, la empresa creada por Kogan para recolectar los perfiles.
¿Qué son los archivos de Cambridge Analytica?
Al trabajar con un informante que ayudó a configurar Cambridge Analytica, el Observer y Guardian han visto documentos y recopilado informes de testigos que levantan la tapa de la empresa de análisis de datos que ayudó a Donald Trump a la victoria. La compañía está siendo investigada en ambos lados del Atlántico. Es un tema clave en dos investigaciones en el Reino Unido - por la Comisión Electoral, sobre el posible papel de la empresa en el referéndum de la UE y la Oficina del Comisionado de Información, en análisis de datos con fines políticos - y uno en los EE. UU., Como parte de un abogado especial La investigación de Robert Mueller sobre la colusión entre Trump y Rusia.
Esa carta legal fue enviada varios meses después de que The Guardian informara por primera vez de la violación y días antes de que se anunciara oficialmente que Bannon estaba asumiendo el control como jefe de campaña de Trump y trayendo Cambridge Analytica con él.
"Debido a que estos datos se obtuvieron y usaron sin permiso, y debido a que GSR no estaba autorizado a compartirlos o venderlos, no se pueden usar legítimamente en el futuro y deben eliminarse inmediatamente", decía la carta.
Facebook no solicitó una respuesta cuando la carta inicialmente no recibió respuesta durante semanas porque Wylie estaba de viaje, y tampoco siguió con controles forenses en sus computadoras o almacenamiento, dijo.
"Eso para mí fue lo más sorprendente". Esperaron dos años y no hicieron absolutamente nada para verificar que los datos se borraron. Todo lo que me pidieron que hiciera fue marcar una casilla en un formulario y publicarlo nuevamente ".
Paul-Olivier Dehaye, especialista en protección de datos, quien encabezó los esfuerzos de investigación en el gigante tecnológico, dijo: "Facebook ha negado, negado y negado esto. Ha engañado a los parlamentarios y a los investigadores del Congreso y ha fallado en sus deberes de respetar la ley.
"Tiene la obligación legal de informar a reguladores e individuos sobre esta violación de datos, y no es así. Una y otra vez ha fallado ser abierto y transparente ".
Aprovechamos Facebook para cosechar millones de perfiles. Y construir modelos para explotar eso y apuntar a sus demonios internos
Christopher Wylie
La mayoría de los estados estadounidenses tienen leyes que requieren notificación en algunos casos de violación de datos, incluyendo California, donde se basa Facebook.
Facebook niega que la recolección de decenas de millones de perfiles por parte de GSR y Cambridge Analytica haya sido una violación de datos. Dijo en un comunicado que Kogan "obtuvo acceso a esta información de manera legítima y a través de los canales adecuados", pero "no acató nuestras reglas" porque transmitió la información a terceros.
Facebook dijo que retiró la aplicación en 2015 y exigió la certificación de todos los que tenían copias de que los datos habían sido destruidos, aunque la carta a Wylie no llegó hasta la segunda mitad de 2016. "Nos comprometemos a aplicar enérgicamente nuestras políticas para proteger la información de las personas . Tomaremos todos los pasos necesarios para garantizar que esto ocurra ", dijo en un comunicado Paul Grewal, vicepresidente de Facebook. La compañía ahora está investigando informes de que no se han eliminado todos los datos.
Kogan, que anteriormente no informó enlaces a una universidad rusa y tomó subvenciones rusas para investigación, tenía una licencia de Facebook para recopilar datos de perfil, pero solo para fines de investigación. Entonces cuando buscó información para la empresa comercial, estaba violando los términos de la compañía. Kogan sostiene que todo lo que hizo era legal, y dice que tenía una "relación de trabajo cercana" con Facebook, que le había otorgado permiso para sus aplicaciones.
Cómo se desarrolló la historia
The Observer ha visto un contrato con fecha del 4 de junio de 2014, que confirma que SCL, una filial de Cambridge Analytica, celebró un acuerdo comercial con GSR, totalmente basado en la recolección y el procesamiento de datos de Facebook. Cambridge Analytica gastó casi $ 1 millón en la recopilación de datos, lo que arrojó más de 50 millones de perfiles individuales que podrían combinarse con las listas electorales. A continuación, utilizó los resultados de las pruebas y los datos de Facebook para construir un algoritmo que podría analizar perfiles de Facebook individuales y determinar los rasgos de personalidad relacionados con el comportamiento electoral.
El algoritmo y la base de datos juntos constituyeron una poderosa herramienta política. Permitió una campaña para identificar posibles votantes indecisos y crear mensajes con más probabilidades de resonar.
"El producto final del conjunto de capacitación es la creación de un 'estándar de oro' para comprender la personalidad desde la información de perfil de Facebook", especifica el contrato. Promete crear una base de datos de 2 millones de perfiles "coincidentes", identificables y vinculados a los registros electorales, en 11 estados, pero con espacio para expandirse mucho más.
Si Mark Zuckerberg quiere hacer que la red social sea buena para el bienestar de las personas, debería dejar que los académicos estudien el comportamiento de sus usuarios.HOTLITTLEPOTATO
El fervor mediático que siguió a la acusación del abogado especial Robert Mueller contra una organización rusa de Internet para sembrar discordias intencionalmente en el sistema político estadounidense ha pasado por alto una implicación crucial: todavía sabemos muy poco sobre el impacto potencial de las redes sociales en las personas y la sociedad.
Irónicamente, este problema podría abordarse fácilmente. Si Facebook realmente adopta la visión, expresada en enero por el cofundador y CEO Mark Zuckerberg, de crear productos que sean "buenos para el bienestar de las personas", la compañía necesita proporcionar a los investigadores académicos un acceso mucho más amplio a sus datos.
Zuckerberg ha expresado su preocupación por los recientes hallazgos de que las redes sociales causan daño social. Anunció que Facebook pretende modificar su algoritmo de búsqueda nuevamente, esta vez para que los usuarios experimenten la mayor cantidad de "interacciones significativas" con amigos y familiares, en lugar de ver el "contenido más significativo", es decir, noticias (ya veces noticias falsas) .
Facebook, sin embargo, continúa resistiendo lo que puede ser la mejor manera de aprender más sobre interacciones significativas, propaganda digital y aspectos de las redes sociales que podrían ser buenas para las personas: compartir su gran cantidad de datos anónimos con un amplio conjunto de investigadores académicos.
Actualmente, la compañía comparte datos con unos pocos seleccionados, lo que limita la capacidad de la sociedad para analizar y comprender los comportamientos en línea relacionados con las elecciones, las manifestaciones masivas, las actitudes políticas, el acoso cibernético, el robo de identidad y mucho más. Tal como está, los académicos deben depender de soluciones a veces incómodas (encuestas de usuarios y auditorías de algoritmos, por ejemplo) para estudiar el impacto social de Facebook.
Los científicos sociales quieren saber por qué las historias se vuelven virales, quiénes tienen influencia política, qué forma las actitudes políticas y sociales, y si las redes sociales pueden cambiar esas actitudes. Queremos comprender las cámaras de eco y las noticias falsas, y por qué los usuarios se unen a grupos como ISIS o las organizaciones nacionales de supremacía blanca en línea. El acceso a los enormes conjuntos de datos de la empresa con fines de investigación ofrecería oportunidades sin precedentes para comprender más acerca de la interacción y el comportamiento humano en línea.
Tal acceso ampliado para académicos ampliaría enormemente el conocimiento público y la comprensión sobre nuestro propio comportamiento (por ejemplo, los mecanismos en línea para la polarización política, impedimentos al discurso civil, actividades masivas de intimidación cibernética dirigidas a jóvenes vulnerables y tipos de propaganda que a veces conducen a información falsa que se vuelve viral ) en esta sociedad cada vez más digital.
Para ser justos, Facebook comparte datos con unos pocos académicos seleccionados. Por ejemplo, Facebook proporciona datos al economista de Stanford Raj Chetty, un conocedor de Silicon Valley y "uno de los favoritos entre las élites tecnológicas". Aunque la investigación de Chetty sobre la desigualdad es valiosa, quienes trabajamos en campus públicos en todo Estados Unidos y en todo el mundo preguntas eruditas tal como lo hace Chetty. Limitar la investigación a unos pocos, y dentro del círculo de Silicon Valley, restringe severamente el tipo de preguntas y análisis que podrían informar.
Es comprensible que Facebook dude en compartir los datos de las personas. La privacidad y la seguridad son preocupaciones serias y crecientes para los usuarios y las compañías tecnológicas por igual. Los defensores de la privacidad tienen razón al permanecer enfocados en proteger los datos de los usuarios en plataformas como Facebook. Pero los datos se pueden anonimizar para proteger a distintos usuarios; esas identidades no son necesarias para el estudio de tendencias y comportamientos.
Algunas empresas de medios sociales ya están encontrando formas creativas y seguras de compartir datos. LinkedIn, por ejemplo, lanzó el programa Economic Graph Research en 2014. Este programa en curso invita a los expertos a enviar propuestas para el uso de datos de LinkedIn para generar nuevos conocimientos. Aunque programas como estos también pueden ser una preocupación para los expertos en privacidad, los datos compartidos son despojados de las identidades de los usuarios antes de entregarlos a los investigadores y pueden iluminar las tendencias de contratación, las brechas de habilidades, las diferencias de género en el avance organizacional y los impactos de las redes profesionales para los empleados.
La sociedad está cambiando rápidamente, en línea y fuera de línea. Facebook tiene el poder de ayudarnos a entender esos cambios y tomar mejores decisiones para el bien común. Los accionistas, los legisladores, los académicos y los usuarios de Facebook deben apoyarse en la empresa y solicitar un acceso más amplio a lo que probablemente sea la mayor recopilación de datos de redes sociales en el mundo.
RT y Sputnik, dos medios de comunicación rusos dependientes del Kremlin, multiplicaron la difusión de los contenidos relacionados con el movimiento independentista catalán durante los días previos y posteriores al referendo ilegal hasta convertirse en el cuarto difusor en redes y comunidades digitales, pese a no figurar ni entre los 25 primeros que más contenidos generaron al respecto, según una investigación llevada a cabo por Alejandro Romero, fundador de Alto Data Analytics, y Javier Lesaca, consultor de comunicación e investigador en la George Washington University.
Romero hizo esta presentación en el marco de la primera Conferencia sobre Ecosistemas de Medios, organizada por el Centro por los Medios Cívicos del Massachusetts Institute of Technology (MIT) y el Berkman Klein Center en Harvard. “El 2 de octubre [día posterior a la consulta] RT y Sputnik llegaron tener 1,7 veces más distribución que El País, que es el primer periódico en España”, explicó el fundador de Alto Data Analytics. EL PAÍS ha publicado desde septiembre diversas informaciones sobre la injerencia de los medios de la órbita rusa sobre la crisis catalana.
El estudio, que abarca el periodo del 29 de septiembre al 9 de octubre, refleja que las informaciones de dichos medios se movieron sobre todo entre usuarios partidarios de la independencia. En los contenidos primaban los relacionados con la violencia y los favorables a la secesión. De los 100 perfiles en Twitter más activos difundiendo sus publicaciones, el 84% correspondían a cuentas anónimas cuyo patrón de comportamiento no corresponder al de individuos particulares, ya que, o bien están dedicadas en un 100% a difundir piezas de RT o Sputnik, o publican toneladas de tuits 24 horas diarias y siete días a la semana o solo retuitean y no tienen actividad propia, según los investigadores. Algunos autores, como de @rick888, @bobbit2266 o @ivan226622 llegaban a publicar mensajes idénticos con minutos de diferencia. Este último, tras una actividad frenética sobre Cataluña, se dedicó tiempo después a tuitear compulsivamente sobre Siria y luego sobre Filipinas. Su cuenta ha sido suspendida recientemente.
La presentación de los datos, bajo el título “Desestabilizar la Unión Europea”, se enmarcó en una jornada centrada en la desinformación, las noticias falsas y el efecto en la democracia. El asunto lleva en el centro del debate en Estados Unidos desde que los servicios de inteligencia determinaron que Moscú había orquestado una campaña de ciberataques e intoxicación para influir en las elecciones presidenciales de 2016 y de favorecer la llegada de Donald Trump al poder. El pasado noviembre RT fue obligada a registrarse como agencia del Kremlin en Estados Unidos. El mes anterior, Twitter prohibió los anuncios de esta cadena y de Sputnik.
En la jornada, la profesora de la Universidad de Washington Kate Starbird, que lleva desde 2013 realizado estudios sobre el efecto de la desinformación y los rumores en situaciones de crisis, advirtió de que el propósito de esas intoxicaciones “no es convencer, sino confundir” de forma que se erosiona la confianza sobre algún asunto. Por ejemplo, en uno de sus últimos trabajos la académica y su equipo reunieron 58 millones de tuits sobre tiroteos masivos en Estados Unidos entre enero y octubre de 2016. De estos, cerca de 100.000 hablaban de que se trataba de montajes o que participaban actores, en definitiva, impulsaban una narrativa alternativa a la oficial. El objetivo de esos mensajes en Twitter no era tanto hacer creer lo que estos decían, sino generar escepticismo general sobre la información sobre matanzas.
“Aunque no consigan convencerte, consiguen paralizarte, que dejes de pensar lo que antes pensabas sobre un asunto”, señaló en la misma línea el director del Centro de Medios Cívicos, Ethan Zuckernam, organizador de la conferencia.
El escritor Peter Pomerantsev, nacido en Kiev en el 77 y profesor visitante de la London School of Economics, abordó el fenómeno de la propaganda exterior desde la Guerra Fría y señaló que la “disinformatzya” es una técnica para destruir la credibilidad en instituciones y citó el viejo bulo de que la CIA creó el virus del VIH como ejemplo. “No son espías los que hacen esto hoy en día, son agencias de relaciones públicas, esa es la diferencia con la Guerra Fría”, señaló. Uno de los objetivos de la propaganda, dijo, era señalar los problemas ajenos para mejorar la imagen de los propios. "Es la idea de 'nosotros somos corruptos' pero ellos también, 'nosotros tenemos desigualdad, pero ellos también".