Mostrando entradas con la etiqueta OKCupid. Mostrar todas las entradas
Mostrando entradas con la etiqueta OKCupid. Mostrar todas las entradas

miércoles, 15 de octubre de 2014

Mensajes cortos en sitios de citas son importantes para establecer contactos

¿Por qué usted debe poner menos esfuerzo en sus mensajes de citas en línea?

Por Christian Rudder - Science of Us

Los usuarios intercambian en OkCupid cerca de 4 millones de mensajes al día. Por supuesto, lo hacen con un propósito especial - citas - pero la interfaz no proporciona ningún mensaje específico y no hace cumplir ningún límite sobre en qué o cuanto uno tipea. Piense en ello como Gmail para los extraños: la comunicación en el sitio es acerca de dos personas que quieren conocerse; el romanticismo llega mucho más tarde, sin conexión.

Los investigadores externos rara vez se ponen a trabajar con mensajes como estos - tienen los contenidos más sensibles de los usuarios de contenidos e incluso anonimizados y agregados, datos de mensaje que rara vez se les permite salir del santo de los santos en la base de datos. Pero mi posición única como co-fundador de OkCupid nos da acceso especial.

En primer lugar, la década de historia del sitio nos deja ver cómo la tecnología ha cambiado la forma de comunicarse. OkCupid tiene registros del infierno de la era pre-smartphone, pre-Twitter, pre-Instagram -, estaba en línea cuando Myspace era todavía un servicio de almacenamiento de archivos. A juzgar por mensajería a través de todos esos años, la amplia cultura de escritura de hecho ha cambiando y el cambio es impulsado por los teléfonos. Apple abrió su tienda de aplicaciones a mediados de 2008, y OkCupid, al igual que todos los servicios principales, lanzó rápidamente una aplicación. El efecto en la escritura no se hizo esperar. Los usuarios comenzaron a escribir en los teclados más pequeños que su palma, y la longitud del mensaje se ha reducido en más de dos tercios desde:



El mensaje promedio es ahora de poco más de 100 caracteres - Twitter de tamaño, de hecho. Y en términos de efecto, parece lectores han adaptado. Los mejores mensajes, los que obtienen la tasa de respuesta más alta, ahora son sólo de 40 a 60 caracteres de largo.



Al considerar sólo los mensajes de un determinado período, y luego preguntar cuántos segundos el mensaje llevó a componer, podemos tener una idea de lo mucho que la revisión y el esfuerzo se traduce en mejores resultados. A continuación se presentan los mensajes entre 150 y 300 caracteres, conspiraron contra el tiempo que tomó para escribir. Como se puede ver, tomar su tiempo ayuda, hasta cierto punto. Pero la curva descendente de las líneas de tendencia es un consejero en los números, diciendo que ¡no pienses demasiado!



Ahora, el primer vertical de la izquierda, los mensajes que se llevaron a no más de diez segundos para escribirse, representa una enorme cantidad de líneas generales y debe levantar algunas cejas. Planteó la mía por cierto, y en este momento estoy tan harto de mi cara se congela - el Botox no tiene nada que ver con diez años trabajando en un sitio de citas. ¿Cómo hay tanta gente escribiendo mensajes que desde hace tiempo que rápidamente? La respuesta corta es, no lo son, y así es como yo lo sé.

A continuación se muestra un gráfico de dispersión de 100.000 mensajes, con el número de caracteres tipeados conspira contra los caracteres realmente enviados. Porque hay una amplia gama de cuentas, que va desde 1 hasta llegar a casi 10.000, esta gráfico es logarítmico, lo que básicamente significa que a medida que usted se mueve de menor a mayor en un eje, la velocidad a la que valor aumenta sube.



He añadido una línea diagonal, y que marca el lugar donde los dos ejes son iguales - lo que significa que los puntos rojos a lo largo de ella, el texto coincide con los golpes de teclado que entraron en ella. En esencia, el remitente escribió lo que tenía en su mente y golpeó Enviar, sin retroceso, no hay cambios. Por lo tanto, sabemos que el mensaje A, en la esquina superior derecha, se ha escrito más o menos en una huida hacia adelante, casi sin revisión. Volviendo a los registros, lo encontré tomó el remitente 73 minutos y 41 segundos para negociar esos 5.979 caracteres de hola - su mensaje final fue casi tan largo como cuatro páginas de este libro. No obtuvo respuesta. Tampoco el remitente caballero de B, que gana el premio Raymond Carver por brevedad mano de obra intensiva. Tomó 387 pulsaciones para llegar a "Hey."

Pero estos son los ejemplos en los extremos. El amplio esencia de la nube de puntos es: al acercarse a la diagonal, los mensajes muestran menos revisión. Avanzar hacia la parte inferior derecha, se llega mal editado, hacia la parte superior izquierda, se llega ... imposibilidad física. Geometría de Nuestra carta significa que tan pronto como usted cruza la diagonal en la mitad superior, usted está en la gente que debe de haber escriben menos caracteres de los mensajes contenidos en realidad. ¿Quiénes son estos invocadores arcanos, retorciéndose las palabras del pensamiento por sí solo? Ellos son el corte y los parches los, y son legión. (Piense en ello de esta manera: si se crea un nuevo mensaje y pulsa CTRL + V - el atajo estándar para pegar en un PC - sólo está utilizando dos pulsaciones de teclas para pegar en un mensaje que probablemente manera más de dos caracteres.)

Podemos aclarar el gráfico haciendo cada punto del 90 por ciento transparente. Esto le permite ver la densidad real de debajo. Es como que estamos tomando un examen de rayos X de los datos, y al hacerlo, vemos los huesos:



Esa banda densa de puntos que se ejecutan justo debajo de la diagonal son los tipos de escritura-desde-cero. Es sorprendentemente compacto. Hay, por supuesto, el límite superior de la línea dura, que separa los mensajes de-cero de los pegados queridos, como una frontera entre facciones en guerra. Pero límite inferior de la banda es casi tan nítidas. Parece que hay un límite natural a la cantidad de esfuerzo que una persona está dispuesto a poner en un mensaje. Si usted hace la aritmética, que es de 3 caracteres escritos por cada 1 en el producto acabado.

Por encima de la diagonal son las personas que decidieron ese tipo de esfuerzo era demasiado. Esa difusión de puntos en el centro superior izquierda es toda la gente que pegan un mensaje con plantilla e hicieron algunas modificaciones a la misma. Aquí la naturaleza logarítmica de la tabla puedes engañar - incluso sólo una pequeña cantidad en la línea central permite la mayor parte del contenido en el mensaje es de valores. Corriendo por el lado izquierdo, verá las líneas verticales densos, los surcos. Esos son los mensajes que se "escriben" con sólo pulsar unas pocas teclas. Hay un montón de ellos - dijo todo, el 20 por ciento de la muestra registró 5 o menos pulsaciones. Estos escritores se asentaron en algo que les gusta o que las obras, y se fueron con él.

No es correo no deseado en la forma en que normalmente usamos esa palabra - OkCupid es rápido para conseguir cuentas falsas o bots fuera del emplazamiento. Estos son verdaderos intentos de la gente en contacto, líneas de recolección digitales esencialmente memorizados. Muchos son tan perezosos y mundano como era de esperar: "¡Eh, tú eres lindo" o - sólo equivalentes digitales de "Ven aquí a menudo?" Pero algunos de los mensajes repetidos son tan idiosincrásico que es difícil de creer "¿Quieres hablar?" ellos incluso aplicar a varias personas. Aquí hay uno, presentado exactamente como se ha escrito:

Yo soy un fumador también. Lo cogí cuando mochilero en mayo. Lo que solía ser una cosa de beber, pero ahora me despierto y mierda, quiero un cigarrillo. A veces me gustaría que yo trabajaba en una oficina de Mad Men. ¿Has visto la exposición Le Corbusier en el MoMA? Suena bastante interesante. Acabo de ver a un display de Frank Gehry (sp?) de la semana pasada en Montreal, y cómo él utiliza modelos de computadora para diseñar una casa de locos en Ohio.

Ese es el mensaje - el remitente estaba tratando de recoger a las mujeres que fumaban y estaban en arte. La patología poco "(sp?)" Es mi favorito broche de oro. Cuarenta y dos mujeres diferentes recibieron este mismo mensaje.

Sitewide, la estrategia de copiar y pegar halagüeños desde cero mensajería en un 25 por ciento, pero en términos de esfuerzo-en los resultados de salida que siempre gana: medición de las respuestas recibidas por unidad de esfuerzo, que es muchas veces más eficiente enviar sólo todos más o menos lo mismo que para componer un nuevo mensaje cada vez. Le he dicho a la gente acerca de los chicos copiar y pegar, y la respuesta es por lo general una cierta variación de Cuando les digo que es repetitivo 75 por ciento tan eficaz como algo original, son escépticos "Eso es tan cojo." - Seguramente casi todo el mundo ve a través la fórmula. Pero este último mensaje es un ejemplo de un texto replicado que es imposible ver a través, y, en una fracción del tiempo que hubiera tomado lo contrario, el remitente tiene cinco respuestas de exactamente el tipo de mujer que él estaba buscando. Y déjenme decirles algo. Casi cada cosa en mi escritorio, en mi persona, probablemente en toda mi casa, fue hecha en una fábrica al lado de quién sabe cuántas copias. Yo sólo luché una multitud a recoger a mi almuerzo, que era un sándwich elegido de una pared de sándwiches. Las plantillas funcionan. Nuestro socio-fumador mochilero amante de la arquitectura-sólo está haciendo lo que la gente siempre lo han hecho: la tecnología de aprovechamiento. En este caso la innovación está utilizando algunos atajos de teclado para salvarse a sí mismo algún tiempo.

Como hemos visto, los teléfonos y servicios como Twitter exigen sus propias adaptaciones. La eterna aquí es que la escritura, como la vida misma, se atiene. Cambia la forma, que se replica de manera extraña, encuentra nichos inesperados ... aún, como todo lo vivo, de vez en cuando apesta. Pero debes saber esto: que estamos viviendo explosión cámbrica de la escritura, no su extinción masiva. El lenguaje es más variado que nunca, incluso si algunas de ellas se copia directamente desde el portapapeles - la variedad es la preservación de un arte, no una amenaza para él. Desde el lenguaje altisonante de la ficción literaria a la simple, aunque mal escrito, actualización de estado, a través de todo este escrito se ejecuta un propósito común. Ya sea de amigo a amigo, extraño a extraño, amante a amante, o autor al lector, usamos palabras para conectarse. Y mientras hay una persona aburrida, excitado, enfurecido, transportados, en el amor, por curiosidad o falta de su casa y teme por su futuro, que va a estar escribiendo sobre ello.

sábado, 2 de agosto de 2014

Siguen los experimentos en redes sociales: OKCupid

¿Necesita OKCupid nuestro consentimiento? 
Necesitamos un debate mejor calidad acerca de los algoritmos que rigen nuestras vidas en línea 


¿Qué significa para consentir a las empresas llevar a cabo experimentos en nuestras vidas en línea?

The Guardian

"¡Experimentamos con seres humanos!" Exclamó el gurú de datos de OKCupid Christian Rudder, en una entrada de blog que se convirtió en uno de los principales títulos de la BBC de ayer, y probablemente no le dolía la promoción de su próximo libro.

El mensaje fue una respuesta a la reciente reacción contra la manipulación de Facebook de fuentes de noticias para investigar "contagio emocional", y describió algunos de los muchos experimentos OKCupid ha ejecutar en sus propios usuarios a través de los años. En un ejemplo, el personal manipula las puntuaciones de compatibilidad del sitio, dando deliberadamente malos partidos una calificación más alta para ver cuál sería el efecto. O como Dylan Matthews en Vox (o su sub-editor al menos) lo expresó, "¿Acaso OkCupid enviar un grupo de personas incompatibles en las fechas a propósito?"

"No" es la respuesta pedante, porque OKCupid no envía a nadie en las fechas. Los usuarios eligen qué aplastante decepción reunirse el próximo mediante una combinación generalmente ineficaces para evaluar los perfiles de los candidatos, adivinando lo que se ha recortado en la salida de las imágenes, y por su propia voluntad. Ellos tienen acceso a una gran cantidad de información que se extiende mucho más allá de un solo número, el crudo con un hábito extraño de ti a juego para gente que ya conoce a quien no quiere tener relaciones sexuales.

Dejando eso de lado, Matthews describe el experimento, en el que "los usuarios se les dijo que tenían diferentes puntuaciones de compatibilidad (en una escala de 0 a 100) de lo que, de hecho, lo hicieron", como "referente". Luego hace una pregunta superficialmente razonable: "si el daño potencial de las intervenciones justifica la falta de consentimiento informado fuera de los términos y condiciones normales de OkCupid." Él da un ejemplo hipotético: "Los usuarios se les dijo a sus resultados de los partidos verdaderos después se concluyó el experimento . ¿Qué pasa si una pareja real, cuya relación comenzó cuando ellos pensaban que eran un partido de 90%, se informó entonces que eran un partido de 30%? "

Es un punto bastante decente, pero no tiene en cuenta un hecho fundamental - que los resultados fueron un experimento arbitrario en el primer lugar. Lo que Matthews se refiere como una "puntuación de partido verdadero" no existe. No hay una sola. Hay apenas cualquier sitio escupe en un momento dado en el tiempo, sobre la base de los datos disponibles y de un algoritmo que ha estado en continuo desarrollo desde hace varios años.

Si usted acepta que seamos permite tener sitios web de citas, entonces usted tiene que aceptar que tiene algún tipo de algoritmo para ayudar a los usuarios filtrar los candidatos, y por lo tanto hay que aceptar que la empresa tiene que ser capaz de construir, probar y ajustar que algoritmo. Ese proceso consiste en la experimentación desde el primer día. En otras palabras, si usted piensa que hay problemas éticos con los ajustes, usted tiene un problema con la ética de estar allí un algoritmo en el primer lugar.

¿Qué Rudder dice sobre esto en su entrada de blog sería considerado como el sentido común por parte de cualquier ingeniero de software utilizado para el desarrollo de experiencias de usuario: "OkCupid no sabe realmente lo que está haciendo. Tampoco ningún otro sitio web. No es que la gente ha sido la construcción de estas cosas por mucho tiempo, o usted puede ir a buscar un plan o algo así. La mayoría de las ideas son malas. Incluso las buenas ideas podría ser mejor. Los experimentos son cómo ordenar todo esto. "

Estos experimentos son absolutamente omnipresente en la industria, ya que sin ellos la mayor parte de la web tal como la vemos no existiría. Los algoritmos de OkCupid es sólo uno de una vasta clase de sistemas de recomendación que se utilizan para filtrar el contenido y ofrecer sugerencias a los usuarios de prácticamente todos los principales sitio web y servicios en línea que se pueda imaginar. Conducen sugerencias de productos de Amazon, el sistema de descubrimiento en Spotify, y eligen los programas de televisión Netflix piensa que deberías ver a continuación.

Y estos algoritmos no son sólo características; ellos son la razón por la cual pueden existir sitios como Netflix o Facebook en el primer lugar. Como Rudder dice: "¿adivinen qué, todo el mundo: si usted usa el Internet, usted es el objeto de cientos de experimentos en un momento dado, en todos los sitios. Así es como funcionan los sitios web. "

El problema es que la mayoría de las personas no se dan cuenta de eso. En un post preguntando por qué la historia OKCupid no ha tenido más tracción dada la respuesta a "experimentos humanos" de Facebook, Tim Carmody señala que: "algoritmo de coincidencia de OKC puede ser al menos tan opaca como feed de noticias de Facebook, pero es más claro a los usuarios que partidos de sitio y vistas se generan mediante un algoritmo. Según se informa, el 62% de los usuarios de Facebook no eran conscientes de que la alimentación de noticias de Facebook se filtró por un algoritmo en absoluto. "

Los expertos no les va mucho mejor. "Facebook juega con las emociones de más de medio millón de usuarios en el nombre de la investigación, sin su consentimiento," un escritor afirmó en el New Statesman, "Pero una cosa clave a recordar aquí - y lo que queda claro al leer a través de la mitad de una década de el valor de las noticias - es que Facebook ha estado haciendo esto durante años ".

Bueno, duh - de lo contrario no existiría el servicio, o de hecho la mayoría de los sitios web que utilizamos diariamente. Los escritores que abordan este tema no deberían tener que leer cinco años de informes de prensa que entender eso.

Cada redactor, editor y escritor - dentro o fuera de Internet - se dedica a un proceso permanente de "jugar con las emociones de la gente", porque eso es lo que averiguar la mejor manera de publicar contenidos significa inevitablemente. No hay ninguna diferencia funcional, práctico o ético entre Facebook elección de qué le viene a la fuente de noticias, y el Guardián de decidir si este artículo aparece en la primera página. Ambos sitios están tratando de las cosas - "experimentar" - en los usuarios, y la recogida de los resultados.

Eso no significa que debamos ignorar cualquier preocupación al respecto, pero es muy difícil tener un debate público significativo sobre una industria que ni los periodistas ni los usuarios tienen alguna idea de cómo funciona. Del mismo modo, la discusión de "consentimiento informado" en torno a estos algoritmos es bastante discutible si la gente no tiene idea de lo que son - no se puede consentir en algo de una manera significativa, si usted no entiende lo que es.

Eso es apenas el comienzo de los vastos problemas intratables, alrededor de la idea del consentimiento del usuario. Vamos a intentar un experimento mental. Imagina que una ley se promulgaron requiriendo que todos los editores en línea que lleva a cabo experimentos similares a OKCupid y Facebook para obtener el consentimiento explícito de sus usuarios. Ahora tener en cuenta que, dada la ubicuidad de estos algoritmos y las prácticas de recolección de datos, en esa norma se aplica a Facebook tendría que aplicar a casi todos los sitios de medios sociales, los sitios web de noticias, todos los servicios de vídeo en línea, todos los motores de búsqueda.

La "elección" en la medida en que se merece el nombre, sería hacer clic en "sí", o volver a 2003 Día uno podría presenciar una ejecución en masa de ventanas emergentes.; breves impresiones de consentimiento borrada por los apenas conscientes clics del ratón de mil millones de usuarios ligeramente frustrado. Como una bandada de pájaros que intentan aterrizar en una ametralladora de muy poca capacidad de atención. Usted también puede pedir a la despreocupación de la electricidad.

Tal vez otros tienen mejores ideas - una especie de código de las mejores prácticas voluntarias tal vez - pero lo más frustrante de todo esto es que el debate público sobre los algoritmos es alrededor de una década detrás de la tecnología. Pocos columnistas o bloggers tienen aún el entendimiento más rudimentario de los algoritmos modernos de análisis de datos, las prácticas de ingeniería de software, o los aspectos prácticos de la ejecución de un servicio web, y que el analfabetismo se extendió a lo largo y ancho, con cada nuevo susto.

Eso es un problema, porque ahora más que nunca necesitamos periodistas equipados para examinar las implicaciones del renacimiento "grandes datos", y los algoritmos aplicados a la misma. Una de las grandes ironías de la industria del software en 2014 es que los avances en el software de análisis de datos están superando la oferta de los científicos de datos necesarios para dar sentido a todo. El peligro es que nos enfrentamos a un futuro cercano de herramientas cada vez más sofisticadas en manos de la gente cada vez menos equipados para entenderlos.

No es que vamos a saber mucho al respecto, por un tiempo al menos. Ha tomado los periodistas tradicionales 10 años para detectar las implicaciones de los modelos de negocio y prácticas de ingeniería concebidas a principios de los 00s, y empezar a discutirlas de una manera significativa. ¿Qué van a notar en el 2024?