jueves, 18 de febrero de 2016

DARPA incentiva estrategias para combatir robots en Twitter

Cómo DARPA tomó la amenaza del Twitter Bot con una mano en su espalda
Cuando DARPA organizó un concurso para encontrar los robots de Twitter diseñado para influir en las discusiones en línea, inspiró a una nueva generación de estrategias anti-bot.


Uno de los fenómenos más preocupantes en Twitter es la proliferación de los robots que generan automáticamente tweets en un intento de distribuir spam, para ganar dinero de forma ilícita a través de fraude de clics, y, lo más preocupante, para influir en el debate sobre temas como el terrorismo y la política.


El número de cuentas de Twitter que participan en este tipo de actividad no es pequeña. En 2014, Twitter admitió que más de un 8 por ciento de sus cuentas estaban automatizadas, que es aproximadamente 23 millones de usuarios activos de Twitter.

La compañía señaló octubre Que muchos de estos eran perfectamente legítimo, muchas de estas cuentas volver a publicar o mostrar abiertamente tweets de otros usuarios. Sin embargo, un número significativo son claramente para nada bueno, y el "robots de influencia" son una preocupación particular.

Por ejemplo, el grupo autodenominado Estado Islámico utiliza medio social en línea para persuadir a los jóvenes a abrazar su causa. Algunos observadores creen que Rusia se embarcó en una importante campaña de desinformación de los medios sociales de la anexión de Crimea. Otros dicen que los robots juegan un papel importante para influir en el resultado de las elecciones en la India en 2014.

Así que la forma de detectar de forma fiable los robots de influencia en Twitter sería sumamente útil. El año pasado, la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) sep oct encontrar un método de este tipo mediante la ejecución de una competición de cuatro semanas en que se pidió a los equipos para detectar los robots en una corriente de publicaciones sobre el tema de las vacunas. Un equipo surgió como un claro ganador, y los resultados demostraron algunas nuevas estrategias importantes para la identificación de los robots en el mundo real.

Hoy en día tenemos una visión única de esta competencia y las estrategias de los equipos empleados gracias a un artículo de V.S. Subrahmanian en la Universidad de Maryland en College Park y Sentimetrix y algunos amigos.

La competencia era realista acerca de la DARPA podría hacerlo. Los tuits se cosecharon los mensajes de la cuenta de Twitter Durante el debate sobre las vacunas 2014. En este debate, el número de robots de Sido había creado la parte de una competencia para ver cómo podían influir en las discusiones. conocimiento verdad para DARPA había molido de los cuales eran cuentas artificial y que eran reales.

En total, el conjunto de datos contenía más de cuatro millones de mensajes de más de 7.000 cuentas de los cuales fueron 39 los robots en los vestíbulos o bien el pro- o anti-vacunación. Cada mensaje contiene el identificador único, el perfil de usuario que incluye una imagen, la URL, y la imagen, donde éstos fueron incluidos. La fecha también incluye un sello de hora y fecha, así como información sobre los seguidores y- Cuando una cuenta unfollowed otra. Todo esto se jugó a los competidores en el entorno sintético Twitter durante cuatro semanas en febrero y marzo.

A continuación, los equipos tuvieron que analizar esta cuenta de Twitter y adivinar los usuarios que fueron bots. Cada correcta adivinarlas consiguieron un solo punto, pero el equipo perdió 00:25 puntos para cada conjetura incorrecta. Que el equipo supuso que todos los robots de d días antes de la final del desafío también consiguió puntos d, ya que DARPA está interesada en particular en la detección temprana de los robots de influencia.

El equipo ganador fue de la compañía de análisis de redes sociales Sentimetrix, cosas que todas adivinado los robots de 12 días antes del plazo al tiempo que sólo una suposición incorrecta. Que les Casette una puntuación de 50,75 puntos. (El equipo de segundo lugar, de la Universidad del Sur de California, anotó 45 puntos, la búsqueda de todos los robots de seis días antes de la fecha límite con las suposiciones incorrectas.)

Las estrategias ganadoras son reveladoras. Los equipos comenzaron por intentar identificar un conjunto inicial de los robots en la fecha. Curiosamente, ninguno de los equipos fueron capaces de automatizar este paso y la intervención humana significativa más utilizado.

Sentimetrix algoritmo utilizado para pretrained para buscar un comportamiento similar bot. El equipo había entrenado este algoritmo en la fecha de Twitter desde el 2014 las elecciones indias que contó con muchos bots. Se buscó la gramática inusual, la similitud de la lingüística a chatbots lenguaje natural tales como Eliza y comportamientos inusuales, tales como períodos de twittear sin una cola ruptura del ser humano no se podría realizar fácilmente extendidas.

Este cuatro cuentas revelado Que eran claramente los robots, y Sentimetrix A continuación, utiliza estos para encontrar a otros. Una de las hipótesis era bot Que los responsables de la tendencia de producir muchos robots y similares vincularlos entre sí para inflar su popularidad. Así que el equipo fue capaz de utilizar la red y el análisis de conglomerados para encontrar otros robots probable es que se comparan después con los robots conocidos.

Asimismo, el equipo utilizó características tales como la actividad temporal de las cuentas en la cola supuesto de una cuenta automatizada mostraría regularidades inusuales. Sentimetrix también buscó usuarios que cambiaron la lealtad Durante el debate de pro a la lucha contra la vacunación (o viceversa). Se asumía que esto podría ser una estrategia bot para infiltrarse en uno de los lados del argumento y luego enviar argumentos opuestos.

La característica clave en el éxito de Sentimetrix fue la forma en que se visualizan los resultados de su trabajo en un tablero de instrumentos en línea para que la cola usuario humano ha podido ver fácilmente el estado de análisis para cada usuario.

En esta segunda etapa, Sentimetrix identificó a otros 25 robots. Casette que darles tiempo suficiente para entrenar a un algoritmo de aprendizaje automático para cazar hasta la fecha es otros bots. Y este enfoque les llevó a los 10 restantes los robots.

Los equipos no saben cuántos bots estaban en el trabajo son el principal problema era saber cuándo hay que dejar de buscar. Sentimetrix, por ejemplo, se detuvo cuando ya no se pudo encontrar cuentas que se parecía a los robots.

Eso es impresionante trabajo que podrían tener una influencia importante en los esfuerzos para encontrar los robots están Que de intentar influir en las discusiones en línea de formas inadecuadas. La publicación de las estrategias de este tipo debería ayudar a otros jugadores a desarrollar tácticas anti-bot, también.

Pero también podría tener un impacto negativo. La batalla entre los robots y bot-cazadores es uno que está en constante evolución. Con papeles de este tipo, los bot-cazadores están revelando su lado en el camino Que Permite bot de decisiones para el diseño de estrategias para derrotar Específicamente Estos algoritmos. En cierto modo, es como luchar con una mano atada a la espalda.

Sin embargo, la tentación de las estrategias de caza-bot mantener en secreto sería muy peligroso para promover. Este tipo de apertura es parte de nuestra sociedad libre y sin duda una de las razones clave que vale la pena luchar para preservar.

De cualquier manera, esta batalla del gato y el ratón va a continuar.

Ref: The DARPA Challenge Twitter Bot: arxiv.org/abs/1601.05140


miércoles, 17 de febrero de 2016

Las redes revolucionan el pensamiento humano

Cómo las redes están revolucionando el pensamiento científico (y tal vez humano) 
La ciencia y el sentido común se basan tanto en la experiencia humana. Sin embargo, estas formas de pensar sobre las cosas están a menudo en conflicto. A veces la simplicidad de la mayoría de las explicaciones de sentido común puede hacer que sea difícil ganarse a la gente a la complejidad y la incertidumbre de la mayoría de los argumentos científicos.
Por John Edward Terrell, Termeh Shafie y Mark Golitko
Scientific American





La ciencia y el sentido común se basan tanto en la experiencia humana. Sin embargo, estas formas de pensar sobre las cosas están a menudo en conflicto. A veces la simplicidad de la mayoría de las explicaciones de sentido común puede hacer que sea difícil ganarse a la gente a la complejidad y la incertidumbre de la mayoría de los argumentos científicos.
Considere el caso de libro del matemático y astrónomo Nicolás Copérnico (1473-1543). Durante siglos, hacer predicciones precisas acerca de dónde los planetas serían en cualquier noche era otra cosa que un pedazo de la torta. La ironía es que los cálculos implicados eran tan difícil porque todo el mundo estaba aceptando como la verdad del Evangelio, pero la idea equivocada común de que la Tierra se encuentra inmóvil en el centro del universo, mientras que el sol, la luna y los planetas se mueven a nuestro alrededor.


Nicolai Kopernicus.

Del mismo modo, la revolución darwiniana del siglo 19 no sólo desafió a la convicción de que vivimos en el centro de las cosas, sino también que somos los personajes principales en la historia de la vida en la Tierra. Muchos todavía no aceptan una visión de Darwin de que toda la vida en nuestro planeta ha evolucionado por medio de la selección natural.
En contraste con las revoluciones cognitivas provocadas por Copérnico y Darwin, preocupaciones aparentemente peatonales de hoy en día acerca de cuestiones como la neutralidad de la red o la privacidad de Facebook puede parecer intrascendente. Sin embargo, ambos son signos contemporáneos que hay otra revolución cognitiva en la fabricación.
La investigación moderna en la sociología, la psicología, la neurociencia y la antropología está demostrando que nuestro mundo no gira alrededor de nosotros mismos como individuos, contrariamente a la iluminación y más adelante afirma que somos criaturas inherentemente egocéntricos. En su lugar, lo que somos como individuos depende de manera crítica de cómo estamos vinculados social y emocionalmente con otros en redes de relaciones que llegan a lo largo y ancho.
¿Por qué? Hemos evolucionado como especie para ser criaturas sociales por excelencia. Se han propuesto muchas explicaciones plausibles de por qué somos tan. La línea de fondo, sin embargo, es una narración. A medida que los psicólogos carril Beckes y Jim Coan han observado, al ser un animal social nos da ventajas reales en la lucha por la existencia, una línea de base social de apoyo emocional y seguridad. Tanto es así, que tal vez mucho más que la mayoría de nosotros se dan cuenta, nuestras conexiones con los demás humanos son, en efecto, una extensión de la forma en que nuestro cerebro interactúa con el mundo.
La ciencia y la filosofía hoy en día están tratando de resolver algunos de los mayores implicaciones de esta visión de la vida. Por ejemplo, el antropólogo Fredrik Barth comentó una vez que la práctica totalidad razonamiento científico social se basa en la idea de que existen grupos discretos de personas en la Tierra que pueden rotularse diversamente como poblaciones, grupos étnicos, sociedades, culturas o razas.
Este entendimiento común de la diversidad humana, a menudo llamado tipológico o categóricos pensamiento-lo toma como auto-evidente que las cosas naturalmente vienen en diferentes clases o tipos, que pueden ser etiquetados como tales. Desde esta perspectiva, las palabras que usamos para describir las cosas son como contenedores vacíos en los que podemos poner las cosas una vez que hemos comprendido lo esencial ", que significa" de estos contenedores verbales.
La adopción de una perspectiva de redes, sin embargo, cambia la forma en que vemos el mundo y nuestro lugar en él. Tome el polémico asunto de la raza. Desde el punto de vista del sentido común, parece evidente que los diferentes tipos de personas viven en diferentes partes del mundo. ¿Quién podría confundir la gente de África, Asia o de ascendencia irlandesa? Desde una perspectiva de redes, sin embargo, es una obviedad para ver que todo el mundo en la Tierra está relacionada con todos los demás por "seis grados de separación".


Seis grados de separación, la visualización artística. 

O considerar por qué algunos de nosotros son más gordos que otros. La respuesta común es que algunos de nosotros comemos demasiado. ¿Pero por qué? Como parte del estudio del corazón de Framingham, Nicholas Christakis y James Fowler aprendieron el uso de la red se aproxima a la ganancia de peso individual en una red social de más de 12.000 personas se asoció con el aumento de peso en sus cónyuges, amigos, hermanos y vecinos, incluso más allá del nivel de directa sociales -en contacto con la gente que nunca ha conocido cara a cara puede influir en qué tan bien se mantiene a un peso deseado.
Finalmente considerar la difusión de las ideas a través de las redes sociales. El sentido común nos dice que las personas con los lazos más fuertes con los demás deberían ser las personas más influyentes para tener alrededor cuando, por ejemplo, usted está lanzando un nuevo producto o tratando de convencer a los demás para aceptar una nueva idea. investigación de la red, sin embargo, se ha demostrado que es los que tienen lazos más débiles con otras personas fuera de su círculo social inmediato que están realmente en la mejor posición para hacer correr la voz.
El impacto de nuestras redes sociales en nuestras vidas puede ser sustancial. Por ejemplo, grupos muy unidos que tienen pocos vínculos con otras fuera del círculo inmediato de amigos, familiares o compañeros de trabajo pueden ser motivo de ideas y prácticas, tales extrañas ya veces perjudiciales como los suicidios contagiosas reportadas entre los adolescentes en lugares como cultural y geográficamente dispares cría como América del Norte urbana y Micronesia.
Este cambio en el pensamiento no sólo está ocurriendo en las ciencias sociales. Las redes también están teniendo un impacto importante en las ciencias biológicas y físicas. Tome esa conocida unidad más básica de nuestro ser biológico, el gen. Se ha convertido en sentido común pensar que los genes codifican todo, desde el color de nuestro cabello para nuestra propensión para usar bandas de goma en las muñecas. Sin embargo, los biólogos evolutivos están modelando serie de relaciones complejas en red a múltiples niveles que van desde "letras" individuales en el genoma de las redes de proteínas de genes a las redes de interacción entre los organismos, lo que demuestra que nuestros genes son sólo nuestros destinos en la medida en que se enlazan entre sí y a los alrededores mundo-tanto social como natural.
El pensamiento en red nos permite comprender científicamente el mundo que nos rodea como una de las conexiones que dan forma a los fenómenos observados, en lugar de como una donde las propiedades intrínsecas de las personas, los genes, o partículas determinan los resultados. Al igual que las revoluciones científicas anteriores, la revolución de las redes también tiene la promesa de la remodelación de nuestras expectativas de sentido común básicos del mundo que nos rodea, y nos puede permitir reconocer que no somos una criatura básicamente individualista, asocial, y pendenciero que viene en lingüística acotada, étnica , tipos raciales o religiosas, sino una especie social vinculados entre sí por lazos de largo alcance de la red.

viernes, 12 de febrero de 2016

La brecha bibliográfica en sociología en redes de citas

Revelando la brecha cuantitativa-cualitativa en sociología con el uso de la visualización bibliométrica
Vicente Traag, Thomas Franssen

CWTS - Universidad de Leiden

La elección entre los enfoques cuantitativos y cualitativos es una división larga data en la sociología. Vicente Traag y Thomas Franssen, sociólogos afiliados a CWTS, utilizan el análisis bibliométrico para estudiar esta brecha y para ver lo que queda de ella hoy.

Desde los albores de la sociología ha sido un tema de división: cuantitativa frente cualitativa. La misma palabra sociología (de sociología francesa) fue sugerido por uno de los académicos fundadores, Auguste Comte, como alternativa a la física social (de nuevo desde sociale físico francés) un término apropiado por Adolphe Quetelet, que lo utilizó para describir su investigación estadística. Hasta la década de 1920, los objetos, se consideró que ya sea de un cuantitativa o carácter cualitativo. Esta dicotomía cambió después de la década de 1920 debido a un aumento constante de los métodos estadísticos en la sociología. En la sociología contemporánea, ambos enfoques se utilizan cada vez más para estudiar los mismos temas generales. Sin embargo, como se verá más adelante, la brecha no se calmó por completo. Por otra parte, nos encontramos con que los temas de investigación están íntimamente ligadas a sus métodos. El universo de la sociología cuantitativa consta de términos como "encuesta", "datos" y "escala" sino también de "clase social", "mujeres", "hombres" y "carrera". El universo de la sociología cualitativa consiste en términos tales como "discurso", "práctica" y "significado", sino también de la "identidad" de "energía" y "masculinidad".

En la cienciometría, la brecha entre los enfoques cualitativos y cuantitativos es igualmente evidente. Las citas se pueden contar (aunque no sin un esfuerzo considerable). Estos número de citas en la alimentación a su vez indicadores más complejos, por ejemplo, para corregir las diferencias de campo en cultivos de citas. La dinámica del número de citas se pueden analizar, ver el flujo y reflujo de atención académica. En resumen, la parte cuantitativa está bien representada. Pero lo que dicen las citas sobre la calidad científica, la calidad de la forma en que una presunción de parcialidad, y cómo el análisis de citas a su vez afecta a las prácticas académicas, no puede ser respondida por cifras por sí solas. Además, la interpretación de las estadísticas de citas sin conocer el contexto más amplio de fondo puede llevar a conclusiones distorsionadas. Lo que se analizan las publicaciones? ¿Cuál es su tema, y ​​cómo los diferentes temas se relacionan entre sí?

Curiosamente, esto se presta a un análisis que es una combinación de tanto cuantitativo como un enfoque cualitativo. En CWTS, una de las herramientas a nuestra disposición para tratar de dar sentido a las grandes series de publicaciones es un mapa plazo. La idea es que extraemos los términos más relevantes de los títulos y los resúmenes de las publicaciones que estamos estudiando. Esos términos surgen de los títulos y resúmenes a sí mismos, no cubierto por las técnicas de minería de texto sofisticados, y no son de ninguna manera predeterminada. Visualizamos y agrupar estos términos en una forma tal que con frecuencia términos concurrentes están colocados relativamente cerca unos de otros, y forman parte del mismo grupo. Estas técnicas se implementan en el VOSviewer de libre disposición, proporcionamos algunos detalles más (técnicas) de abajo. Aunque una visualización de este tipo se basa en la minería de textos de grandes cantidades de datos en un enfoque textual-los mapas resultantes requieren un conocimiento experto de dominio, sustantiva para entender e interpretar ellos, en lugar de un enfoque cuantitativo cualitativo.



Figura 1. Mapa de campos de la sociología 2010-2015. Los términos son de color de acuerdo a la agrupación. El mapa revela la brecha cuantitativa-cualitativa. Haga clic aquí para abrir un mapa interactivo en el VOSviewer.

Cuando aplicamos estas técnicas para todos los artículos publicados en revistas clasificadas como sociología en la Web of Science in 2010-2015, vemos aparecer un patrón interesante. Es de esperar que un campo de la ciencia que se subdivide en los temas: las palabras que a menudo co-ocurren al mismo tiempo tienden a referirse a algún tema común. En sociología, el mapa revela una división bastante diferente, es decir, entre los enfoques cuantitativos y cualitativos. Es bastante sorprendente ver este fenómeno dominan la división, en lugar de decir, temas como la desigualdad, movimientos u organizaciones sociales. Por supuesto, estos temas también están incluidos en el mapa, pero que parecen ser parte de la brecha más amplia entre cuantitativo y cualitativo. Por ejemplo, muchas publicaciones sobre movimientos sociales tienden a ser caso basado e implicar el análisis del discurso. Del mismo modo, las cuestiones de identidad tienden a ser estudiado usando métodos cualitativos, etnográficos. Por otra parte, los temas relacionados con el empleo, el ingreso y la educación (presumiblemente se trata de la desigualdad) emplean con mayor frecuencia una metodología cuantitativa. Podría ser interesante ver estos temas estudiados desde el otro método: la identidad desde un punto de vista cuantitativo y el empleo, el ingreso y la educación desde una perspectiva cualitativa.

Hay algunos cruces interesantes cuantitativo al cualitativo que muestran cómo el mismo tema general se aborda de manera diferente en los dos métodos. Las diferencias entre "macho" y "hembra" parecen ser estudiado más en un entorno cuantitativa. Pero el tema también se estudió cualitativamente, en torno a temas como la identidad y la sexualidad, donde vemos términos tales como "masculinidad" emergente. Los asuntos religiosos se estudian de manera similar desde ambas perspectivas. Por un lado, se trata de una variable de control típico en los estudios cuantitativos (ir a la iglesia, por ejemplo). Pero la religiosidad es, por supuesto, también está profundamente arraigado en cuestiones de identidad y significado. En temas de desarrollo, la globalización y el cambio climático, el enfoque cualitativo no está en la identidad y significado, pero en las comunidades y pueblos, especialmente en el mundo en desarrollo. El enfoque cuantitativo se centra más en la redistribución, el crecimiento económico y la comparación nacional de cruz. Por último, algunas otras metodologías como el análisis de redes sociales y la teoría de la elección racional también se sitúan en el límite cuantitativo-cualitativo. Para la teoría de la elección racional, esto parece contrario a la intuición, pero tal vez la teoría de la elección racional es tan frecuentemente criticado por los papeles cualitativos, ya que es empleado por los documentos cuantitativos. En términos más generales, mapas plazo proporcionan sólo una visión muy de un campo basado en la co-ocurrencia, y el contexto de co-ocurrencia no se considera. Si un término co-produce porque es criticado o empleado, por tanto, no está claro. por tanto, debemos evitar darle demasiada importancia a este tipo de mapas.

Tal vez podemos concluir de esta pequeña incursión en la brecha cuantitativa-cualitativa que determinados temas de investigación a menudo se limitan a un solo método. Un enfoque cualitativo se obtiene una descripción más grueso más rica, e incrusta un análisis en un contexto más amplio. Al mismo tiempo, puede desencadenar preguntas que requieren una respuesta más cuantitativa, que a su vez puede requerir de nuevo un análisis más cualitativo. Así, podemos cambiar continuamente entre los métodos cualitativos y cuantitativos. En lugar de tratar de integrar los dos, que está promovida por ejemplo, bajo la denominación de métodos mixtos, deberíamos quizá sobre todo seguir desafiando ambas vistas desde otro punto de vista. No debemos cerrar los ojos ante los desafíos planteados por la otra perspectiva, pero aceptar que la otra perspectiva puede completar y matizar nuestras conclusiones, en lugar de los invalida. Afortunadamente, cuando se mira en la distribución de publicaciones en revistas, algunas de las revistas más generales, tales como la American Sociological Review and American Journal of Sociology sí incluyen las publicaciones de ambas perspectivas (aunque parece más presente el punto de vista cuantitativo). revistas más especializadas, como la sociología de la cultura y de las fuerzas sociales, se centran principalmente en la investigación cualitativa y cuantitativa, respectivamente. Por lo menos, hay algunos foros común para la discusión, pero hay margen de mejora.



Figura 2. Mapa que muestra la frecuencia relativa de los términos en revistas. El azul representa pocas ocurrencias mientras que el rojo representa las apariciones más frecuentes. Haga clic aquí para abrir mapas interactivos en el VOSviewer.

Métodos y Referencias

Métodos


Recogimos todos los artículos publicados en revistas que pertenecen a la categoría de materias de Sociología en la Web of Science, publicada entre 2010-2015. En total, hay 14.613 artículos publicados en ese período, de 146 revistas diferentes. Nos entrada los títulos y los resúmenes en el VOSviewer, que identifican los términos del texto (técnicamente conocida como frases nominales) usando un algoritmo de procesamiento de lenguaje natural. A continuación, excluir términos que se producen menos de 20 veces en este corpus, lo que resulta en 2450 términos. El uso de estos términos, el VOSviewer calcula una denominada puntuación de relevancia para excluir términos genéricos. Por ejemplo, un término como "conclusión" aparece con frecuencia, pero co-ocurre con casi cualquier otro término. Tales términos genéricos están excluidos de esta manera sobre la base de una puntuación baja relevancia. Seleccionamos los 60% términos más relevantes que quedan, lo que se traduce en términos 1470. Ver Van Eck et al. (2011) para más detalles técnicos sobre cómo estos términos se extraen y cómo los resultados de relevancia se calculan, y ver Van Eck y Waltman (2010) para una descripción general de la VOSviewer. La brecha cuantitativa-cualitativa en general parece bastante robusto con respecto a las diferentes opciones de parámetros ligeramente. Por ejemplo, utilizando un punto de corte de 15 apariciones y la selección de los 1500 términos más relevantes revela un mapa casi idénticos, y lo mismo ocurre con un punto de corte de 25 apariciones y la selección de las 1000 términos más relevantes.


Los términos se visualizaron utilizando un método que intenta posicionar con frecuencia términos cercanos unos de otros concurrentes. Para aquellos con un poco de formación técnica, la técnica se asemeja a una variante ponderada de escalamiento multidimensional. Más información se puede encontrar en Van Eck et al. (2010). Por último, los términos se agruparon utilizando el mismo marco matemático que se utiliza para la visualización, como se explica en Waltman, Van Eck y Noyons (2010). La técnica de agrupación se asemeja a la modularidad, un método bien conocido para la detección de las comunidades en las redes, pero hay algunas diferencias sutiles. En particular, los diferentes niveles de detalle de la agrupación se pueden encontrar, y tenemos que configurar algunos parámetros resolución. La configuración por defecto en el VOSviewer es 1, que sigue identifica algunos subtemas en el campo de la sociología, tales como las cuestiones de género. La división más grueso entre cuantitativa-cualitativa se revela a una resolución en algún lugar en el intervalo de aproximadamente 0,55 hasta 0,85. Por último, se normaliza la frecuencia de un término en un diario de manera que la media es igual a 1, para llegar a escalas comparables para los colores (visualizamos en una escala común de 0-2).


Referencias


Van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 84(2), 523–538.

Van Eck, N.J., Waltman, L., Dekker, R., & Van den Berg, J. (2010). A comparison of two techniques for bibliometric mapping: Multidimensional scaling and VOS. Journal of the American Society for Information Science and Technology, 61(12), 2405-2416.

Van Eck, N.J., & Waltman, L. (2011). Text mining and visualization using VOSviewer. ISSI Newsletter, 7(3), 50-54.

Waltman, L., van Eck, N. J., & Noyons, E. C. M. (2010). A unified approach to mapping and clustering of bibliometric networks. Journal of Informetrics, 4(4), 629–635.

martes, 9 de febrero de 2016

Marketing: Construyendo influencia en Twitter

La influencia es un grafo - S01E04

Social Media Clarity

Este episodio se habla de la influencia web - es lo que es, cómo se mida, y lo que puede hacer con él.
- Enlaces -

Goel, Sharad, Ashton Anderson, Jake Hoffman, y Duncan Watts. “The structural virality of online diffusion.”

How to Build a Collection of Influential Followers in Twitter Using Social Network Analysis and NodeXL

- Transcripción -


Randy: Tenemos un poco de noticias. Bryce comenzó una nueva posición y no estará con nosotros este episodio. Lo felicitamos.
Este episodio, vamos a discutir algo central en la internet: Influencia.
Para nuestro principal segmento de esta semana, vamos a entrevistar a nuestra co-anfitrión, Marc Smith.
Marc, ¿qué queremos decir por influencia?

Marc: La sociología ha estudiado la idea de influencia y ha desarrollado una serie de diferentes nociones acerca de lo que puede ser influencia. La influencia es más que sólo una cosa. La influencia es sobre dónde se encuentra en una red y sobre lo que fluye de usted a otras personas y de otras personas a usted. En el Internet hoy en día, hay una sensación de que hay personas que son influyentes y se hace un esfuerzo para identificar a estas personas que son influyentes. [Estos son ...] personas que pasan mensajes a otras personas y que tienen esos mensajes tomadas a un ritmo mayor que la persona promedio. La mayoría de la gente tiene relativamente pocas personas siguen [ing] ellos. Hay algunas personas que tienen muchas, muchas personas que siguen ellos. Esa es una noción de influencia; cómo muchas personas que siguen.
Hay personas que tienen muchos seguidores, pero, tal vez, no mucha influencia u otros tipos de energía. Considerando que, hay algunas personas con relativamente pocos seguidores, estoy pensando en Twitter en este momento, y sin embargo tienen más potencia.
Creo que el ejemplo más famoso es cuando Justin Bieber fue calificada como factor de influencia que tienen una puntuación más alta que el presidente Barack Obama. [Es] una noción torcida de influencia. A lo mejor de mi conocimiento, el Sr. Bieber no tiene su propio arsenal nuclear, por ejemplo. Probablemente podríamos estar en desacuerdo acerca de lo que es la influencia. ¿Es que usted tiene una gran cantidad de seguidores? Tal vez tal vez no. Podría ser que las personas con muchos menos seguidores ocupan posiciones en sus redes que son muy, muy importante a pesar de que no tienen la visibilidad.
En la Teoría de Redes, pensamos en estas personas como "puentes". Los puentes podrían tener muy pocos seguidores, dos podrían ser el mínimo, sin embargo, esas conexiones podrían ser más valioso. Pueden ser más influyente, porque son las personas que llevan un mensaje de un grupo a otro.
¿Cuál es la influencia? La respuesta corta es influencia no es sólo una cosa.

Randy: La definición común dice que es la capacidad de tener un efecto en una persona, su carácter, su desarrollo o su comportamiento. Puede afectar a alguien en una capacidad y no tienen ningún efecto sobre ellos en otro. Por ejemplo es la diferencia entre la gente que decide ser tus amigos y la gente que trabaja. Esos son diferentes dominios de influencia.
Bryce y me han escrito sobre esto. Los llamamos "contextos", pero creo que podemos desempaquetar que un poco más.
¿Podría hablar un poco acerca de los diferentes tipos de influencia?

Marc: Es un muy buen punto. Influencia tiende a no ser uniforme a través de los temas. Yo sepa mucho sobre restaurantes en mi vecindario, pero sabemos muy poco acerca de las inversiones. Mi influencia sobre ti en términos de donde usted pasa su noche del viernes podría ser alto y en el que pasar su jubilación podría ser baja. Creo que reconocer que la mayoría de las personas tienen algún tipo de interés especial. Muchas personas se vuelven genios o expertos. Estoy, por supuesto, la invocación de algunos de la jerga del punto de inflexión de Malcolm Gladwell donde habló sobre mavens y conectores.
Creo Teoría de Redes tendría un poco más de las categorías de dos. También voy a señalar que el Sr. Gladwell sostiene que sólo puede ser sólo unas pocas personas con esta influencia no estándar para establecer una tendencia, para que un grupo de personas que siguen algún nuevo patrón de consumo o [cambiar su] foco de atención.
Otros investigadores han discutido en realidad esta afirmación. Discutieron con datos. Estoy pensando en el trabajo de Duncan Watts, que es un científico sociólogo y el equipo ahora en Microsoft Research, que es lo que sugiere que no hay sólo un uno o un pequeño grupo de personas influyentes, sino que varios cientos inicio a corto abanico en cascada - como las estructuras donde voy a Tweet acerca de algo y luego otras 10 personas a pío al respecto y luego 2 o 3 seguirá cada uno de ellos. Voy a tener una cierta cantidad de influencia de los medios sociales a causa de eso.
La idea de que no va a ser sólo uno o sólo un puñado de personas que pueden conducir todas las otras personas en la repetición de algo o después de algo o participar en algún comportamiento, que parece no ser cierto. No estaba en los datos.

Randy: [La reciente] "primavera árabe" traer a la mente esta [fenómeno: se trataba de un] distribuida masivamente [network] que no tenía centro claro, no hay "supernodos" obvias.
Usted ha mencionado Gladwell y datos, ya que hablamos de personas influyentes, [se ha producido un] tipo de una carrera para producir una puntuación de reputación como usted ha mencionado. Justin Bieber tuvo brevemente una puntuación perfecta Klout.
El reto con estos como hemos mencionado ya es el contexto. Más allá de contexto, incluso si se puede romper cosas en categorías que sirven para medir la influencia, la forma en realidad ¿Cómo se mide?

Marc: Creo que lo que probablemente vamos a encontrar es que todas las mediciones o alguna aproximación son sustituto de otra cosa. No hay una sola medida que captura todos los aspectos de su influencia. Hay tal vez un puñado de métricas de red, que cuando se utiliza en combinación, nos proporcionan la capacidad para triangular en su ubicación dentro de un grafo.
Entonces yo diría que lo que realmente depende de lo que es su meta. Diferentes personas tienen diferentes valores [influencia] dependiendo de lo que estamos tratando de lograr. Si usted está tratando de conseguir un nuevo mensaje a una gran comunidad, es posible ir a buscar a las personas que están en la forma de un cubo que hay en el centro de un grafo.
[Pero] si usted está tratando de obtener un mensaje que ya está bastante generalizado para pasar a una nueva comunidad, que podría estar buscando para un puente. Esa persona podría tener muchas menos conexiones.
La teoría de redes, nos permite calcular métricas que capturarían tanto, un cubo y un puente. En cierto modo, esto es como la forma en que los geógrafos utilizan latitud y longitud y altitud para localizar todos los puntos de forma única en el planeta.
[Pero los medios sociales] no es exactamente [lo mismo que] geografía. Teoría red utiliza su propio sistema de coordenadas para tratar de averiguar: "esta persona es, metafóricamente, lo que equivale a un pico de la montaña, o es esta persona realmente en las tierras bajas"? ¿Cuántos otros picos de las montañas hay?
Esa metáfora podría funcionar en redes. Podríamos encontrar que hay diferentes lugares [en redes] y la [Red] métricas calcularíamos tiene que ver con eso. ¿Dónde estás? ¿Cuánto en el centro de la red es usted? Creo que todos hemos tenido esa intuición. Usted ha estado en una multitud o en un grupo. Tal vez has ido a una conferencia, que ha estado en un salón de baile con una gran cantidad de gente en ella. La gente se mueve en torno a otro sin problemas. Ellos pueden ir donde quieran.
La mayoría de las personas están hablando con uno o dos otras personas. [Pero] existe en el centro de la habitación, por lo general hay una o dos terrones [de personas] y que son más grandes. En el centro de estos grupos, por lo general, no va a ser alguien importante. Alguien que podría atraer a un grupo grande alrededor de ellos. Ellos tienden a ser poco frecuente.
De la misma manera, en una red, algunas personas tienen estas coordenadas que los hacen las cumbres. Ellos tienden a ser poco frecuente. Podemos argumentar que tienen la influencia. Están posicionados en el grafo de una manera única. Teoría red nos permite calcular un montón de métrica y medir que tiene esta centralidad y otros atributos como: ¿Cuántas conexiones [realmente] tienen? Considerando que, la centralidad [de red] habría [que representan] cómo es único son sus conexiones?

Randy: Usted ha mencionado número de conexiones y centralidad. He oído hablar de algo llamado intermediación [betweenness].

Marc: Es cierto. Esa es una idea de centralidad. Centralidad viene en varios sabores que capturan algunos [diferentes] aspecto [s] de dónde se encuentra en el grafo. La "centralidad de intermediación" es uno que a veces se considera como la puntuación de "puente".
[Se define como una medida de] la cantidad, si tuviera que ser retirado de la grafo, se separó el grafo, como si cortada por un río?
Hay [otro tipo de centralidad:] "centralidad del vector propio", que mide no cuán central es uno sino si cuán centrales son a quienes uno está conectado pero ¿cómo son las personas que son centrales?. [Es] un concepto interesante. Reconoce que está conectada a personas que son a su vez bien comunicada y es en sí misma una especie de poder.

Randy: A veces hay una restricción de recursos en la persona bien relacionada. Hay demasiadas personas tratando de conseguir su atención. Eso [alternativa] contacto en realidad puede ser mejor para que usted pueda comunicarse o obtener información [éxito].

Marc: Es cierto. Es guardián del guardián. Aquellas personas a menudo son reconocidos por esta métrica llamada "centralidad del vector propio". Considerando que, "intermediación centralidad" a menudo se encuentra la gente que, si tuvieran que salir de la red, dejaría atrás a dos islas separadas ahora.

Randy: Gracias, Marc. Eso suena como algunos grandes métricas de influencia que deberíamos de seguimiento. Vamos a pasar en nuestra sección de punta y continuar la conversación. Para nuestro consejo, me gustaría continuar la discusión sobre Influencia con Marc Smith.
Ahora que tenemos formas de medir y nombres para las mediciones de influencia, ¿qué hacemos con ella? ¿Cómo podemos aprovechar esta información para lograr nuestros fines, ya sea para comunicarse con alguien o proporcionar marketing o incluso sólo para recoger sus comentarios?

Marc: Mucha atención se presta a, ¿cómo encontrar el factor de influencia? Nuestra respuesta es calcular métricas de red y encontrar personas que son o hubs o puentes o, en algunos casos, islas.
Vamos a hablar de [islas], probablemente, en otro episodio.
¿Qué se hace cuando las encuentre? Hay un enlace en nuestras notas de espectáculo de este episodio sobre un artículo en mi blog, How to Build a Collection of Influential Followers in Twitter Using Social Network Analysis and NodeXL. Tiene un diagrama de flujo. Unas flechas persiguen unos a otros en ese diagrama.




Se sugiere una estrategia: ¿Qué hacer una vez que realmente tiene una lista de personas influyentes? Respuesta: Usted los va a seguir (follow) y va a tratar de conseguir que se repita su mensaje. Vas a hacer eso, primero, en siguiéndolos y luego repitiendo sus mensajes. Esa es la primera etapa.

La etapa dos es que vas a estudiar sus mensajes y crear mensajes que tengan algunos elementos de sus mensajes mezclados con elementos de sus mensajes. Es posible usar los hashtags que utilizan. Es posible vincular a los recursos web que previamente han enlazadas.

Al hacer esto, usted está indicando a las personas adecuadas los símbolos correctos. A menudo hay una gran cantidad de personas que hablan sobre el tema, pero sólo unas pocas personas son las cimas de las montañas o los puentes. Hay relativamente pocas personas en el centro del grafo.
Al elegir a centrar su atención en las relativamente pocas personas más que a otros, usted puede enfocar su energía y tienen algún tipo de conexión con ellos. De esa conexión viene de la [mayor] probabilidad de que van a repetir lo que han estado produciendo.
Si usted pie y no tiene seguidores, su tweet es poco probable que sea escuchado. Si tiene muchos seguidores, es posible que aún no se oirá mucho porque sus seguidores no pueden tener seguidores.
Lo que queremos hacer es encontrar personas que tienen, no sólo, muchos seguidores, pero que tienen un hábito de Twitter y ser escuchado y que se repite ampliamente en toda la red.


Randy: Creo que ese es el punto principal es darse cuenta de que no es una simple medida de una métrica. Incluso si lo pones en una sola métrica, un solo número como una puntuación de Klout, [e incluso] si [tiene una puntuación con] una etiqueta adecuada adjunto. [Por ejemplo:] "Randy Farmer es un experto en sistemas de reputación en línea".
[A la vista de red de influencia] es, de hecho, una visión mucho más amplia [porque considera] el paso de la información. ¿Quién está pasando a quién y cuándo. La parte importante de influencia es que nunca ha representado por un único número o una sola etiqueta. Es un grafo.

Gracias, Marc. Estoy seguro de que esto es sólo el primero de muchos episodios acerca de la influencia y reputación.

domingo, 7 de febrero de 2016

Comprendiendo tu propia red personal en Reddit

La importancia de la comprensión de su red: Una lección de Reddit



Por: Jess Reif - Medium


A principios de julio, Reddit fue noticia cuando su gran comunidad en línea a ejecutar el usuario se sublevó en respuesta a la decisión de Reddit liderazgo para despedir a un empleado administrativo clave. [1] A pesar de Reddit emitió varias disculpas formales y Ellen Pao, director general interino de la compañía, renunció única días después del incidente, el foro se agitó a fondo. Las empresas despiden empleados todos los días; ¿por qué esta terminación causar tal escena?
La comprensión de la gravedad de la cocción error de Reddit requiere saber un poco acerca de cómo funciona Reddit. La comunidad internacional en línea cuenta con 36 millones de usuarios activos y 169 millones de visitantes únicos cada mes [2] (que, como referencia, es el equivalente a un poco más de la mitad de la población estadounidense). Fiel a su lema de "la primera página de la Internet", Reddit es también un espacio para compartir artículos de divulgación y la promoción de un debate significativo sobre ambos temas apremiantes y sin importancia. Aunque comúnmente conocida como el parque infantil más grande en el ciberespacio para el trolling Internet, Reddit es inherentemente una plataforma para el diálogo abierto.
El negocio de Reddit es único, ya que se basa en miles de moderadores voluntarios que vigilan sus cerca de 700.000 "subreddits", o sub-comunidades que intercambian contenidos relacionados con temas particulares. Una de las características más populares del sitio es su AMA o la serie "Pregúnteme cualquier cosa", en el que un cliente le responderá cualquier pregunta publicados en el hilo. Miles de figuras públicas - incluyendo a Bill Gates, Jerry Seinfeld, Madonna, Bill Nye el individuo de la ciencia, e incluso el presidente Barack Obama - han llevado a cabo AMAs en el sitio.
Victoria Taylor fue la heroína silenciosa detrás de las escenas de esta función con éxito. Taylor fue Directora de Talento de Reddit y trabajó con moderadores voluntarios para coordinar AMAs. Su repentina salida (presumiblemente despedida) provocó conmoción instantánea y masiva en la comunidad de Reddit. No sólo eran los que estaban llevando a cabo AMAs ese día quedó sin apoyo y orientación, pero cientos de moderadores cerraron sus páginas en protesta por su despido.

Reddit emitió una disculpa, pero ya era demasiado poco y demasiado tarde. El daño estaba hecho. Después de su partida, muchos moderadores expresaron que Taylor era el único administrador (a tiempo completo pagados empleado Reddit) que los moderadores de confianza. Sin ella, la red estaba en un completo caos. ¿Por qué pasó esto? ¿Qué hizo Victoria Taylor es tan importante?
"Director de Talento" no intuitivamente suena como función más importante de una empresa, sin embargo, el despido de esta posición en Reddit resultó poco menos que monumental. Tal revuelo es la prueba de que las relaciones en las empresas son más complejos que sus organigramas muestran. Las organizaciones son redes densas con lazos relacionales imprevisibles que suelen ir sin medida y sin control hasta que un empleado como Taylor se dispara y la red se colapsa.
A veces los empleados influyentes perder la marca y tienen que ser dejar ir, pero las empresas deben primero hacer la debida diligencia para asegurarse de que la red puede soportar en ausencia del empleado. Hay dos variables líderes pueden considerar para ayudarles a evitar cometer el mismo error en el disparo de un empleado clave:

  1. ¿Quién, interna y externamente, requiere el acceso a esta persona para hacer su trabajo o usar su producto?
  2. ¿Quién, interna y externamente, confía en esta persona para obtener información?

Examen profundo de estas dos preguntas puede ayudar a cualquier organización a comprender la influencia de un solo nodo en su red. Para algunos empleados influyentes, habrá conmoción interior después de un disparo, y para los demás, habrá conmoción externa. El fallo clave para Reddit estaba fallando para anticipar la caída de salida externa de disparar Taylor. Todos los moderadores conducen AMAs (por no hablar de los huéspedes AMA) requiere acceso a Taylor para lograr sus objetivos. Su repentina ausencia dejó incapaces de hacer su trabajo y sin una línea de vida. Muchos de los otros moderadores dependido de Taylor como una fuente de información y no tienen otras relaciones existentes con el personal administrativo de Reddit. Debido a que el liderazgo de Reddit no entendía la posición de Taylor en la red, no pudieron ejecutar correctamente un plan de contingencia para hacer frente a las repercusiones de su despido repentino.
Nada de esto quiere decir que las personas influyentes no pueden ser despedidos o dejan las empresas - por supuesto que pueden. Pero las organizaciones deben estar preparadas para enfrentar las consecuencias cuando voluntaria o involuntariamente pierden talento clave. Un organigrama tradicional no reflejaría con precisión la influencia de Taylor, y cada organización tiene alguien como ella: un empleado cuya criticidad no proviene de su título o la responsabilidad por escrito, pero a partir del impacto que su partida tendría sobre la vida y los sentimientos de los que dependen sobre su. La única manera de comprender el impacto de tal empleado es dejar de mirar a su organización como una jerarquía y empezar a verlo como lo que realmente es: una red.


[1] Schiavenza, Matt. “Reddit Gets Ugly, Then Gets What It Wants”. 10 July 2015. http://www.theatlantic.com/technology/archive/2015/07/ellen-pao-ousted-at-reddit/398330/
[2] Smith, Craig. “50+ Amazing Reddit Statistics.” 25 June 2015. http://expandedramblings.com/index.php/reddit-stats/

viernes, 5 de febrero de 2016

Redes sociales de profesores de TIC

Social Networks of Teachers in Twitter
Redes sociales de profesores en Twitter

Hernán Gil Ramírez
College of Education
Carrera 27 #10-02
Barrio Alamos
Pereira, Risaralda (Colombia)
ZIP code 660003
hegil@utp.edu.co

Rosa María Guilleumas García
College of Humanities and Fine Arts
Carrera 27 #10-02
Barrio Alamos
Pereira, Risaralda (Colombia)
ZIP code 660003
roguiga@utp.edu.co

Esta investigación tuvo como objetivo identificar las tendencias en los temas de interés de los tweets publicados por 43 profesores expertos en el campo de las TIC y la educación y la red de sus seguidores y seguidos en el altavoz de agudos, así como su relación con las características de la red. Con este fin, NodeXL fue empleado para importar, directa y automáticamente, 185.517 tuits que dieron origen a una red de conexiones de 49.229 nodos. Análisis de los datos involucrados análisis social de la red, la extracción de texto y minería de texto usando NodeXL, Excel y T-Lab. La hipótesis de la investigación fue que existe una correlación directa entre las tendencias identificadas en los temas de interés y las características de la red de conexiones que emergen de la tweets.Among importado las conclusiones del estudio podemos destacar que la mayoría de las tendencias identificadas a partir los tweets analizados estaban relacionados con la educación y las tecnologías educativas que podrían mejorar los procesos de enseñanza y aprendizaje; la asociación entre la educación y las tecnologías que se encuentran a través del procedimiento de minería de texto aplicado a los tweets; y, finalmente, que el análisis de lemas parece ser más prometedor que el de hashtags para detectar tendencias en los tweets.

Enlace al original

jueves, 4 de febrero de 2016

Los 3,57 grados de separación de Facebook

Facebook dice que sus 1,59 mil millones de usuarios están conectados por una media inferior a los seis grados de separación


Bono, a la derecha, se inclina para hablar con Sheryl Sandberg, el director de operaciones de Facebook, en la Iniciativa Global Clinton, martes, 24 de de septiembre, 2013, en Nueva York. (Foto AP / Marcos Lennihan)

Disculpe, pero no te conozco de algún lado? (Foto AP / Marcos Lennihan)


Escrito por Mike Murphy - Quartz


"Seis grados de separación" es una teoría de larga data, en primer lugar sugerido por el autor húngaro Frigyes Karinthy en 1929, que todo el mundo en la Tierra es de sólo seis introducciones lejos de cumplir con todos los demás en la Tierra.

En Facebook, sin embargo, las conexiones son significativamente más fuertes.

Una nueva investigación de lo social sugiere que para los 1,59 mil millones de usuarios activos de Facebook, hay sólo 3,57 grados de separación, en promedio, entre todos en la red social.
Facebook dice que la mayoría de los usuarios tienen entre 2.9 y 4.2 grados de separación. (Número de separación CEO de Facebook, Mark Zuckerberg es de 3.17, mientras que la puntuación del jefe de operaciones Sheryl Sandberg es de 2.92) Si está conectado a Facebook, puede ir aquí para ver la investigación, junto con los grados de separación, la compañía ha calculado para usted.


Lo conectados todo el mundo está en Facebook. (Facebook Reesarch)

Según la compañía, un estudio anterior, realizado en 2011, encontraron que había alrededor de 3,74 grados de separación entre los usuarios de Facebook. En aquel entonces, el sitio tenía cerca de 721 millones miembros, lo que significa que a medida que el sitio ha crecido, casi duplicando su base de usuarios activos entre los dos estudios, sus usuarios se han vuelto más o menos 5% más conectados.

A medida que Facebook intenta conectarse aún más de 7,4 millones de personas de todo el mundo, tal vez todos vamos a ser aún más estrechos, especialmente a Kevin Bacon.