Mostrando entradas con la etiqueta hiperenlaces. Mostrar todas las entradas
Mostrando entradas con la etiqueta hiperenlaces. Mostrar todas las entradas

jueves, 24 de diciembre de 2015

Mapeo de la comunidad tecnológica cívica en GitHub (1/2)

(Obsoleta) Mapeo de la comunidad tecnológica cívica en GitHub

Civic Hacking and Journalism

Compruebe versión actualizada aquí

¿Cómo podemos describir la comunidad global de tecnología cívica? Hasta la fecha, es bastante difícil de encontrar respuestas a esta pregunta ya que no hay ni siquiera un consenso sobre cómo definir tecnología cívica. Sin embargo, hay algunos proxies interesantes para explorar esta comunidad. Uno de ellos es GitHub como la mayoría de los proyectos de tecnología cívicos y desarrolladores están utilizando. Otra es la comunidad Poplus, que es un intento deliberado de crear una "federación mundial de tecnología cívica".

Tomé esta lista de miembros Poplus y añadí unas pocas organizaciones que se mencionaron en las entrevistas que tuve con miembros de mySociety. Entonces busqué cada organización en GitHub y terminé con esta lista de cuentas:

mysociety
poplus
everypolitician
sinar
opennorth
okfn
codeforamerica
Code-for-All
okfde
openaustralia
ushahidi
sunlightlabs
datauy
congresointeractivo
ciudadanointeligente
govtrack
MuckRock
g0v
civio
openkratio
KohoVolit
regardscitoyens
teampopong
openpolis
TEDICpy
e-democracy
azavea

Entonces escribí un raspador GitHub para recopilar información sobre las actividades de los miembros de estas organizaciones. Debo señalar directamente que GitHub es sólo un proxy incorrecto para describir esta comunidad. Para ilustrar esto con un ejemplo muy concreto, hablé con Mark Longair que es un desarrollador senior de mySociety. Ha trabajado en muchos proyectos en los últimos años y es un miembro activo de la comunidad Poplus - pero esto no está bien reflejado en mis datos porque no está haciendo mucho uso de las características sociales de GitHub como seguir a otros usuarios o protagonizada repositorios. Por lo tanto, estos resultados deben ser recibidas con escepticismo. Sin embargo, creo que un par de tendencias interesantes surgieron.

La red de seguidores

Me genera una red seguidor a ver cómo estas organizaciones están conectados entre sí y que los individuos están mejor conectados dentro de la comunidad tecnológica cívica más grande, es decir, que tiene la mayor cantidad de conexiones a través de las diferentes organizaciones. Este es el resultado (con el tamaño de los nodos que refleja el número de seguidores un usuario tiene):





  1. El resultado más llamativo es la posición clave de maxogden. Una razón: Él desarrolla algunas de las herramientas más populares entre los hackers cívicos, especialmente dat (ver más abajo). Otra, la explicación más simple es que se hace un uso extensivo de las características sociales de GitHub.
  2. Es interesante ver cómo los diferentes grupos organizaciones por regiones. En la parte superior derecha tenemos grupos asiáticos, especialmente G0V (verde). En el fondo es los EE.UU. con el Código de los Estados Unidos (rojo) es el actor dominante. Lo más interesante, en la parte superior izquierda tenemos una mezcla de grupos en su mayoría de Europa y Latinoamérica, sino también algunos grupos de Canadá o Australia. Esto podría ser sorprendente teniendo en cuenta que la federación Poplus fue fundada por mySociety del Reino Unido y Ciudadano Inteligente de Chile. Aún así, es curioso que los grupos europeos y latinoamericanos parecen estar tan bien conectados, mientras que América del Norte y grupos asiáticos son relativamente independiente (con la excepción de maxogden, que está muy bien conectado con todos los continentes).
  3. En el extremo izquierdo es la ONG africana Ushahidi, que sólo tiene unas pocas conexiones con grupos europeos. Yo habría esperado que sean mejor conectados. Tal vez esto se debe a GitHub ser un proxy incorrecto para ilustrar estas estructuras más grandes.

Los repositorios más populares

Para tener una idea de que los repositorios son las más populares entre los hackers cívicos, miré a GitHub de 'protagonizada por' función:




  1. El lado izquierdo muestra los repositorios de propiedad de las organizaciones cívicas tecnología ordenados por el número de estrellas. Esto significa que se muestra que los repositorios de tecnología cívicos son los más favoritos entre los usuarios de GitHub en total, incluyendo aquellos que no son parte de ninguna organización cívica tecnología. Lo más leído, con mucho, es reclinable, una biblioteca para 'la creación de aplicaciones de datos en pura Javascript y HTML. Ushahidi aparece dos veces en el top 20, lo que indica una vez más que la red seguidor de arriba es un poco apagado. En general, es interesante ver cómo los repositorios tecnología cívicos más populares son una mezcla de herramientas de datos, tutoriales, y 'prueba de concepto' ejemplos de aplicaciones de tecnología cívicos.
  2. El lado derecho muestra los repositorios que han sido protagonizadas por los miembros de las organizaciones cívicas tecnología enumerados anteriormente, independientemente de si los repositorios con estrellas son propias de las organizaciones cívicas tecnología o no. Un poco sorprendentemente, no hay repositorios cívicos tecnología en la parte superior 20. Además de eso, los resultados son más o menos lo que uno esperaría: Herramientas para ayudar el desarrollo de sitios web y trabajar con datos. La popularidad de impress.js y reveal.js indica que la presentación en conferencias o talleres sobre ideas y experiencias es muy común. Sugiero que es también una expresión de tecnología cívica siendo un campo relativamente nuevo con una gran cantidad de experimentación. Lo que no podía imaginar es que la popularidad de discurso, una plataforma de discusión de código abierto.


Los lugares y las diferencias en tecnología civil de todo el mundo

GitHub permite a los usuarios especificar su ubicación. Sin embargo, los usuarios tienen la libertad de hacerlo en la forma que quieran, si especifica su ubicación en absoluto. A menudo, los usuarios sólo mencionar su país de origen o en algunos casos el continente que viven. No hace falta decir que el mapa resultante es inexacta, pero lo suficientemente bueno para mostrar la dirección general:



A pesar de ser cada vez más global, esto mapas muestra la cantidad de tecnología cívica es un fenómeno occidental. Esto se refleja en las entrevistas que tuve con miembros de mySociety, donde se señaló los sitios web del Reino Unido son una "magnitud más ocupado y tal vez más éxito" que en otros lugares (especialmente en África) porque tenían diez años para crecer.

Dado que GitHub es la plataforma para los desarrolladores, este mapa también parece subrayar algunos de los otros comentarios de mis entrevistas sobre las diferencias culturales en tecnología civil de todo el mundo. El predominio de los desarrolladores en Europa y los EE.UU. podría ser debido al hecho de que la tecnología cívica tiene raíces fuertes en la escena la tecnología en estas áreas. Por el contrario, tecnología cívica en América Latina es impulsado con más fuerza por grupos de activistas que han descubierto la utilidad de las aplicaciones de tecnología cívicas pueden ser apoyar su causa.

viernes, 24 de julio de 2015

Marketing: ARS en análisis de hiperenlaces

El uso de redes de hipervínculos a los datos de las minas de la Web

Junio ​​de 2015, página 26
Autor: Michael Lieberman - Quirks


Michael Lieberman explora el proveedor VOSON datos, un plug-in para el análisis de las redes de hipervínculo.

Nota del editor: Michael Lieberman es fundador y presidente de Multivariate Solutions, una firma de consultoría estadística de Nueva York.

Muchos grupos de investigación y empresas de nueva creación han desarrollado herramientas para el análisis de redes de medios sociales y la visualización. Hoy en día, las métricas de la red se han convertido en un lugar común y la funcionalidad de diseño de algoritmos de clustering y ha expandido dramáticamente, produciendo avances que han elevado radicalmente la calidad de lo que es posible visualizar.

El gráfico de la red más grande, cuando las páginas web enlazan entre sí, es la World Wide Web. Las decenas de miles de millones de páginas en la Web pueden cada uno ser vistos como un vértice en un grafo cuyas aristas son hipervínculos URL de conexión de una página a otra. No hay mayor fuente de información interrelacionada.

El profesor Robert Ackland de la Universidad Nacional de Australia ha pasado mucho tiempo en este tema. Él escribe: "Estos hipervínculos pueden apuntar a otras páginas en el mismo sitio web o con sitios de otras organizaciones, empresas, instituciones y naciones. El resultado es, literalmente, una red de conexiones que se menciona a menudo, pero rara vez vistos. La red de sitios web relacionados, aunque basado en 'Web 1.0' tecnologías básicas, representa importantes relaciones sociales, económicas e institucionales que pueden revelar importantes conocimientos para investigadores, responsables políticos y estrategas corporativos ".

Ha habido un gran despliegue publicitario acerca de Twitter, Facebook y Flickr, pero las páginas web siendo la mina de oro sin explotar de la información grande de datos. Toda una industria, marketing en buscadores, ha crecido en torno a la explosión de Internet. Pero quién es su sitio Web está conectado a, y que se conecta a su sitio web, es realmente la veta madre de comida para llevar de la red. Con la nueva tecnología, estos vínculos han llegado en línea usando software libre de código abierto y pueden ser analizados mediante gráficos de Excel.

Recopilación y análisis de datos de red hipervínculo le permite responder preguntas críticas como: ¿Cómo su presencia en la web de la organización se compara con su línea de marca presencia? ¿Cómo su presencia en la Web de la organización en comparación con el de sus competidores? Datos de hipervínculo también pueden ayudar a identificar nuevos competidores. Si usted está entrando en un nuevo mercado, estos datos le puede dar una sensación de que los jugadores actuales son y cómo están relacionados. Si su organización está en el área de los asuntos públicos, lo que otras organizaciones están vinculadas a ella? Si ejecuta una sin fines de lucro, que vincula a usted? En otras palabras, ¿dónde está la mejor fuente de recaudación de fondos?

El proveedor de datos VOSON

El Proveedor VOSON datos es un plug-in de importación de datos de Excel para la recogida y análisis de datos de la red hipervínculo. Proporciona una interfaz a una colección de datos y servicio de procesamiento que forma parte del Observatorio Virtual para el Estudio de las redes en línea (VOSON). Este servicio de recolección y procesamiento de datos consiste en un rastreador web que rastrea sitios semillas nominados por el usuario, la extracción de hipervínculos a otros sitios. El servicio también encuentra hipervínculos entrantes a los sitios de semillas dadas.



Uno tiene una cuenta con VOSON sino una versión gratuita está disponible para un máximo de 10 bases de datos. Por supuesto, rastreo web es nada nuevo: Los spammers han estado haciendo desde la web se tejió primero. Veo VOSON como particularmente útil, ya que es un servicio de búsqueda hipervínculo especializado que trabaja en el marco de Excel. Los resultados, que se entregan en un formato muy similar, por ejemplo, enlaces de Twitter, hace que sea fácil para los no programadores con un poco de Excel astuto para editar, forma y en última instancia, visualizar y analizar los datos.

Un examen de los efectos visuales de hipervínculo revela que los mapas vienen en diferentes grados. Un mapa de un grado - conocida también como una red ego - muestra el resultado cuando sólo un sitio de semilla ha sido rastreado. La Figura 1 es un ejemplo de un mapa hipervínculo de un grado sin etiquetas. Me gusta llamarlo "el puercoespín".

Un mapa 1,5 grados tiene en cuenta cada página a la que un sitio Web está conectado y si estas páginas están conectados a otro. Es decir, por Quirks.com, quisiéramos ver a todos los puntos, además de flechas para los puntos que están conectados entre sí.

Un mapa de los dos grados recoge todas las páginas a las que un sitio Web se conecta y cada página a la que están conectados. Aquí es donde las inmersiones profundas reales mienten. Sin embargo, los puntos de datos mapa de dos grados se expanden exponencialmente. Si un sitio Web está conectado a otros 100 sitios y cada uno de los que está conectado con otros 100 sitios, habría 10.000 puntos. La mayoría de los sitios web más importantes están conectados a mucho más de 100 sitios web o blogs.


Un mapa de la industria de la investigación de mercados

La figura 2 muestra un mapa social hipervínculo de la industria de investigación de mercados. Comenzó con Quirks.com. Sin embargo, he añadido unos 10 otros sitios de semillas, organizaciones de investigación de marketing importante (por ejemplo, el ARM, CASRO) y algunas de las más grandes firmas internacionales de investigación de mercados (Kantar, Yougov).

La base de datos resultante tenía más de 1.000 enlaces. Por razones de espacio y claridad, esta red es propensos a sufrir de un desbordamiento de etiquetas y puede ser difícil de analizar. La forma más común para contrarrestar esto es crear una subred que consiste solamente en sitios de semillas además de enlaces importantes. Esto requiere el filtrado de la base de datos en Excel y etiquetado de esos sitios que producirán la mayor claridad para la red. Esto requiere calcular visualmente y el filtrado de la base de datos en Excel o el empleo de una función VLookup. Sin embargo, el proceso de filtrado no está más allá de las habilidades de cualquier usuario moderado Excel.

Lo hemos hecho para nuestra red hipervínculo investigación de mercados. Entonces nos encontramos con la red a través de un algoritmo de agrupamiento (en concreto, el multi-escala rápida Harel-Koren). La visualización resultante se muestra en la Figura 2.

El grafo describe varios puntos que ilustran el poder de la técnica. Se resumen a continuación.

  • La mayoría de las principales organizaciones de investigación de marketing están conectados.
  • PMRG.org, no un sitio de la semilla, está conectado a Kantar Health, que se especializa en la investigación farmacéutica.
  • El sitio Web de WPP, propietaria de Kantar, se conecta a la mayoría de los sitios Web de Kantar.
  • Quirk de sienta lleno en el medio del espacio Web de investigación de mercados, teniendo también en cuenta los sitios de información como Rockstar Investigación y Marketing Profs.

Estudio de caso: restaurantes de comida casual

A continuación, he intentado una red hipervínculo para una industria para la que hago un montón de trabajo, los restaurantes de comida casual (CDR). Los sitios de semillas fueron varios de los restaurantes más populares, como el Olive Garden, el Cheesecake Factory, Buffalo Wild Wings y Applebee, entre algunos otros.



En la Figura 3 he círculo algunos de los sitios de siembra y etiquetados algunos de los enlaces más interesantes. Varios elementos de la gráfica vienen a nuestra atención.

  • Hay un vínculo entre Applebee y el equipo de hockey Detroit Red Wings. Como resultado, los Red Wings y Applebee ha tenido un esfuerzo co-branding para que los fans Red Wings disfrutarían de una comida en Applebee antes del partido de hockey.
  • The Cheesecake Factory tiene un enlace a Craigslist. Una nueva ubicación Cheesecake Factory en la lista de oportunidades de empleo en Rochester, Nueva York, en Craigslist.
  • MoneyTalksNews.com está conectado a varios de los principales CDRs.
  • Muchos sitios de la vida estudiantil universitaria conectan a CDR restaurantes.
  • HarryandDavid.com, el sitio Web de caja de regalo, está conectado a CheesecakeFactory.com.
  • On The Border está conectado a Groupon, lo que indica un esfuerzo de esa cadena para atraer a los clientes a través del sitio web de Groupon.
  • Darden.Com/Careers conecta con el jardín de oliva, que es propiedad de restaurantes Darden.

El resultado de este grafo pesadamente filtrado y marcado con es que el espacio Web de la industria de comida casual conecta a las sociedades matrices y para muchos medios de comunicación que cubren la industria. Hay blogs de Urbanspoon.com, escritos nutricionales de CNN Health, etc.

El análisis de redes de hipervínculos carece de la fluidez, de, por ejemplo, Twitter, y ahí radica su utilidad. Se puede ejecutar un rastreo Web para un espacio de la industria y estar bastante seguro de que la estructura estará intacta por un período de un mes o más. Por otra parte, los rastreos de hipervínculo se pueden filtrar para mostrar sólo los blogs, medios de comunicación y otros medios especificados.

Todavía un aspecto vital

Las redes de hipervínculos han existido desde los albores de la Web y que siguen siendo un aspecto vital del comportamiento en línea de las entidades comerciales, particulares y el gobierno. Los datos de hipervínculo se han utilizado para la investigación de marketing y para la inteligencia empresarial competitiva. Por ejemplo, los investigadores han construido redes de sitios web de las compañías de telecomunicaciones a partir de datos de co-link y mostrar que la visualización de estas redes los mapas correctamente las empresas en los sectores de la industria.

Esperamos que la disponibilidad de herramientas como VOSON para tener un impacto positivo en la investigación hipervínculo. Como se mencionó anteriormente, el análisis hipervínculo dinámico es un área fructífera de estudio, ya que es la investigación de enfoques para analizar conjuntamente los datos de hipervínculo y el texto de contenido. Muchas empresas han aprendido a aprovechar el poder de los líderes de opinión, expertos y personas influyentes para promover sus productos y con visualizaciones espaciales Web hipervínculo, los investigadores pueden visualizar fácilmente y analizar estas relaciones a menudo complejos.