¿Necesita OKCupid nuestro consentimiento?
Necesitamos un debate mejor calidad acerca de los algoritmos que rigen nuestras vidas en línea
¿Qué significa para consentir a las empresas llevar a cabo experimentos en nuestras vidas en línea?
The Guardian
"¡Experimentamos con seres humanos!" Exclamó el gurú de datos de OKCupid Christian Rudder, en una entrada de blog que se convirtió en uno de los principales títulos de la BBC de ayer, y probablemente no le dolía la promoción de su próximo libro.
El mensaje fue una respuesta a la reciente reacción contra la manipulación de Facebook de fuentes de noticias para investigar "contagio emocional", y describió algunos de los muchos experimentos OKCupid ha ejecutar en sus propios usuarios a través de los años. En un ejemplo, el personal manipula las puntuaciones de compatibilidad del sitio, dando deliberadamente malos partidos una calificación más alta para ver cuál sería el efecto. O como Dylan Matthews en Vox (o su sub-editor al menos) lo expresó, "¿Acaso OkCupid enviar un grupo de personas incompatibles en las fechas a propósito?"
"No" es la respuesta pedante, porque OKCupid no envía a nadie en las fechas. Los usuarios eligen qué aplastante decepción reunirse el próximo mediante una combinación generalmente ineficaces para evaluar los perfiles de los candidatos, adivinando lo que se ha recortado en la salida de las imágenes, y por su propia voluntad. Ellos tienen acceso a una gran cantidad de información que se extiende mucho más allá de un solo número, el crudo con un hábito extraño de ti a juego para gente que ya conoce a quien no quiere tener relaciones sexuales.
Dejando eso de lado, Matthews describe el experimento, en el que "los usuarios se les dijo que tenían diferentes puntuaciones de compatibilidad (en una escala de 0 a 100) de lo que, de hecho, lo hicieron", como "referente". Luego hace una pregunta superficialmente razonable: "si el daño potencial de las intervenciones justifica la falta de consentimiento informado fuera de los términos y condiciones normales de OkCupid." Él da un ejemplo hipotético: "Los usuarios se les dijo a sus resultados de los partidos verdaderos después se concluyó el experimento . ¿Qué pasa si una pareja real, cuya relación comenzó cuando ellos pensaban que eran un partido de 90%, se informó entonces que eran un partido de 30%? "
Es un punto bastante decente, pero no tiene en cuenta un hecho fundamental - que los resultados fueron un experimento arbitrario en el primer lugar. Lo que Matthews se refiere como una "puntuación de partido verdadero" no existe. No hay una sola. Hay apenas cualquier sitio escupe en un momento dado en el tiempo, sobre la base de los datos disponibles y de un algoritmo que ha estado en continuo desarrollo desde hace varios años.
Si usted acepta que seamos permite tener sitios web de citas, entonces usted tiene que aceptar que tiene algún tipo de algoritmo para ayudar a los usuarios filtrar los candidatos, y por lo tanto hay que aceptar que la empresa tiene que ser capaz de construir, probar y ajustar que algoritmo. Ese proceso consiste en la experimentación desde el primer día. En otras palabras, si usted piensa que hay problemas éticos con los ajustes, usted tiene un problema con la ética de estar allí un algoritmo en el primer lugar.
¿Qué Rudder dice sobre esto en su entrada de blog sería considerado como el sentido común por parte de cualquier ingeniero de software utilizado para el desarrollo de experiencias de usuario: "OkCupid no sabe realmente lo que está haciendo. Tampoco ningún otro sitio web. No es que la gente ha sido la construcción de estas cosas por mucho tiempo, o usted puede ir a buscar un plan o algo así. La mayoría de las ideas son malas. Incluso las buenas ideas podría ser mejor. Los experimentos son cómo ordenar todo esto. "
Estos experimentos son absolutamente omnipresente en la industria, ya que sin ellos la mayor parte de la web tal como la vemos no existiría. Los algoritmos de OkCupid es sólo uno de una vasta clase de sistemas de recomendación que se utilizan para filtrar el contenido y ofrecer sugerencias a los usuarios de prácticamente todos los principales sitio web y servicios en línea que se pueda imaginar. Conducen sugerencias de productos de Amazon, el sistema de descubrimiento en Spotify, y eligen los programas de televisión Netflix piensa que deberías ver a continuación.
Y estos algoritmos no son sólo características; ellos son la razón por la cual pueden existir sitios como Netflix o Facebook en el primer lugar. Como Rudder dice: "¿adivinen qué, todo el mundo: si usted usa el Internet, usted es el objeto de cientos de experimentos en un momento dado, en todos los sitios. Así es como funcionan los sitios web. "
El problema es que la mayoría de las personas no se dan cuenta de eso. En un post preguntando por qué la historia OKCupid no ha tenido más tracción dada la respuesta a "experimentos humanos" de Facebook, Tim Carmody señala que: "algoritmo de coincidencia de OKC puede ser al menos tan opaca como feed de noticias de Facebook, pero es más claro a los usuarios que partidos de sitio y vistas se generan mediante un algoritmo. Según se informa, el 62% de los usuarios de Facebook no eran conscientes de que la alimentación de noticias de Facebook se filtró por un algoritmo en absoluto. "
Los expertos no les va mucho mejor. "Facebook juega con las emociones de más de medio millón de usuarios en el nombre de la investigación, sin su consentimiento," un escritor afirmó en el New Statesman, "Pero una cosa clave a recordar aquí - y lo que queda claro al leer a través de la mitad de una década de el valor de las noticias - es que Facebook ha estado haciendo esto durante años ".
Bueno, duh - de lo contrario no existiría el servicio, o de hecho la mayoría de los sitios web que utilizamos diariamente. Los escritores que abordan este tema no deberían tener que leer cinco años de informes de prensa que entender eso.
Cada redactor, editor y escritor - dentro o fuera de Internet - se dedica a un proceso permanente de "jugar con las emociones de la gente", porque eso es lo que averiguar la mejor manera de publicar contenidos significa inevitablemente. No hay ninguna diferencia funcional, práctico o ético entre Facebook elección de qué le viene a la fuente de noticias, y el Guardián de decidir si este artículo aparece en la primera página. Ambos sitios están tratando de las cosas - "experimentar" - en los usuarios, y la recogida de los resultados.
Eso no significa que debamos ignorar cualquier preocupación al respecto, pero es muy difícil tener un debate público significativo sobre una industria que ni los periodistas ni los usuarios tienen alguna idea de cómo funciona. Del mismo modo, la discusión de "consentimiento informado" en torno a estos algoritmos es bastante discutible si la gente no tiene idea de lo que son - no se puede consentir en algo de una manera significativa, si usted no entiende lo que es.
Eso es apenas el comienzo de los vastos problemas intratables, alrededor de la idea del consentimiento del usuario. Vamos a intentar un experimento mental. Imagina que una ley se promulgaron requiriendo que todos los editores en línea que lleva a cabo experimentos similares a OKCupid y Facebook para obtener el consentimiento explícito de sus usuarios. Ahora tener en cuenta que, dada la ubicuidad de estos algoritmos y las prácticas de recolección de datos, en esa norma se aplica a Facebook tendría que aplicar a casi todos los sitios de medios sociales, los sitios web de noticias, todos los servicios de vídeo en línea, todos los motores de búsqueda.
La "elección" en la medida en que se merece el nombre, sería hacer clic en "sí", o volver a 2003 Día uno podría presenciar una ejecución en masa de ventanas emergentes.; breves impresiones de consentimiento borrada por los apenas conscientes clics del ratón de mil millones de usuarios ligeramente frustrado. Como una bandada de pájaros que intentan aterrizar en una ametralladora de muy poca capacidad de atención. Usted también puede pedir a la despreocupación de la electricidad.
Tal vez otros tienen mejores ideas - una especie de código de las mejores prácticas voluntarias tal vez - pero lo más frustrante de todo esto es que el debate público sobre los algoritmos es alrededor de una década detrás de la tecnología. Pocos columnistas o bloggers tienen aún el entendimiento más rudimentario de los algoritmos modernos de análisis de datos, las prácticas de ingeniería de software, o los aspectos prácticos de la ejecución de un servicio web, y que el analfabetismo se extendió a lo largo y ancho, con cada nuevo susto.
Eso es un problema, porque ahora más que nunca necesitamos periodistas equipados para examinar las implicaciones del renacimiento "grandes datos", y los algoritmos aplicados a la misma. Una de las grandes ironías de la industria del software en 2014 es que los avances en el software de análisis de datos están superando la oferta de los científicos de datos necesarios para dar sentido a todo. El peligro es que nos enfrentamos a un futuro cercano de herramientas cada vez más sofisticadas en manos de la gente cada vez menos equipados para entenderlos.
No es que vamos a saber mucho al respecto, por un tiempo al menos. Ha tomado los periodistas tradicionales 10 años para detectar las implicaciones de los modelos de negocio y prácticas de ingeniería concebidas a principios de los 00s, y empezar a discutirlas de una manera significativa. ¿Qué van a notar en el 2024?