Mostrando entradas con la etiqueta marketing. Mostrar todas las entradas
Mostrando entradas con la etiqueta marketing. Mostrar todas las entradas

martes, 25 de septiembre de 2018

Análisis de marcas en Twitter con NodeXL

Cómo realizar un análisis de marca de redes sociales de Twitter utilizando NodeXL


NodeXL


La ciencia de la red proporciona métodos poderosos para resolver problemas centrales en el espacio de marketing de redes sociales. Las visualizaciones y el análisis de las redes sociales son métodos útiles para identificar y evaluar rápidamente a personas influyentes y contrastar la forma de la conversación en torno a diferentes temas y marcas.



Hasta hace poco, estos métodos requerían habilidades avanzadas de desarrollo de software, pero las herramientas de análisis de redes están evolucionando y ahora están surgiendo soluciones de señalar y hacer clic que pueden identificar rápidamente subgrupos y segmentos de mercado y describir los temas y los recursos de alto valor en cada uno. Los conceptos clave de red como "betweenness" y "centrality" pueden proporcionar información que va más allá de los conteos de cosas como me gusta, seguidores o respuestas.

Una perspectiva de red mira a las redes sociales como una "colección de conexiones" y revela la forma emergente de la multitud. La investigación de Pew ha demostrado que hay un pequeño conjunto de estructuras de redes sociales que comúnmente aparecen en muchas formas de plataformas de medios sociales que permiten la "respuesta".

Los patrones de centro y rayo divididos, unificados, fragmentados, agrupados y entrantes y salientes son comunes en las redes sociales. Estas formas pueden informar las estrategias de las redes sociales al reconocer la forma actual y posiblemente deseada de la conversación al tiempo que proporcionan nuevos KPI para guiar la transición.

Esta es una guía paso a paso para crear un análisis de marca de redes sociales con NodeXL Pro.

Cada marca involucrada en las redes sociales necesita
  • Identifica los jugadores clave en su ecosistema social.
  • Realice análisis de la competencia e inteligencia de campaña.
  • Generar identificación de campaña - [filtrando el ruido, luego identificando + analizando tweets con la mayor interacción, o mediante hashtag (s) específicos]
  • Produzca información del contenido, para contenido / marketing social, para saber qué temas son de mayor interés para orientar la creación de contenido relacionado y relevante

NodeXL Pro (el complemento Network Discovery Discovery and Exploration para la conocida hoja de cálculo de Microsoft Office Excel ™) de la Social Media Research Foundation puede analizar sistemáticamente las redes sociales para revelar información procesable. En esta guía usaremos NodeXL Pro para mapear temas en Twitter, incluidas las discusiones sobre una marca, producto y problema.

NodeXL se puede utilizar para explorar tres mapas distintos de red de medios sociales que utilizan diferentes perspectivas de datos para obtener una variedad de valiosos conocimientos:


Red ego Red de marca Red de comunidades
Creado de tweets publicados por la cuenta de la marca. Basado en todas las menciones de la marca en los tweets actuales. Basado en los tweets actuales conteniendo el nombre de la cuenta de la marca.


Perspectivas de datos de red de Twitter

Tipo de red Datos recolectados Información de la red Información de contenido
Ego red 1.0 grado Tweets publciados en el cuenta de la marca o datos de seguidor Usuarios altamente conectados por el pondedaro del enlace Actividad de Tweet, estrategia de contenido, campañas de hashtag
Ego red 2.0 grado Tweets publicados por usuarios/amigos altamente conectados Posición en la red, densidad, influenciadores y agrupamientos Tópicos relacionados, hashtags, URLs
Red de industria Tweets publicados por una lista seleccionada de competidores Métricas relacioandas con el análisis de redes ego Tópicos relacionados con la industria, items mas mencionados
Red de comunidades Tweets actuales conteniendo el nombre de la cuenta de la marca Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados
Red de marca Tweets actuales mencionando el nombre de la marca Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados
Red discursiva Tweets actuales acerca del tópico Agrupamientos, influenciadores, spammers/bots Sentimiento, top items, topicos relacionados

Egored


(NodeXL>Data>Import > From Twitter Users network)



Acerca de: explore una red basada en el material publicado por la cuenta de marca oficial con el importador de la "red de usuarios de Twitter". Los últimos 3.200 tweets (incluidos los retweets y las respuestas) están disponibles en la API pública de Twitter, que es suficiente para revelar contenido reciente y estrategias de red.

Información de la red: ¿Cuáles son las cuentas de usuario más importantes mencionadas en los tweets, retweets y respuestas de la cuenta de marca? ¿Qué tan fuertes son las conexiones hacia esos usuarios?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados? ¿Cuál es el patrón de tiempo de los tweets? ¿Cuántos retweets y me gusta se ganaron?

Red comunitaria


(NodeXL>Data>Import > From Twitter Search network: e.g. @Tesla)



Acerca de: explore los tweets actuales y las conversaciones de los usuarios de Twitter que hablan directamente con la cuenta de marca con el importador de la "red de búsqueda de Twitter". Cada análisis de red es una instantánea única e histórica de las discusiones con la cuenta de marca. Los datos pueden contar historias interesantes sobre la marca, las campañas de marketing o la satisfacción del cliente.

Información de la red: ¿Qué usuarios de Twitter desempeñan un papel importante en las interacciones con la cuenta de marca? ¿Los grupos de usuarios forman grupos alrededor de ciertos temas o hashtags? ¿Cómo se ven estos clusters?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados en toda la red y dentro de los clústeres detectados? ¿Cuál es el sentimiento?


Red de marca


(NodeXL>Data>Import > From Twitter Search network: e.g. Tesla)

Acerca de: explorar quién está hablando actualmente sobre la marca. Esta recopilación de datos amplía la red de la comunidad y mostrará la gama completa de menciones de la marca.

Información de la red: ¿Qué cuentas de usuario juegan un papel importante en las conversaciones sobre la cuenta de marca? ¿Los grupos de usuarios forman clusters? ¿Cómo se ven estos clusters?

Información del contenido: ¿Cuáles son los hashtags, URL, palabras y pares de palabras más utilizados en toda la red y dentro de los clústeres detectados? ¿Sentimiento? ¿Patrón de tiempo?


¿Qué hay en un libro de trabajo NodeXL Pro?




Una red social completa y un análisis de contenido pueden contener hasta 14 hojas de trabajo que se crean durante el proceso de análisis automatizado.



Los enlaces, vértices y hojas de trabajo del grupo están entrelazados entre sí y también con el panel de grafo.

Cada libro de trabajo contiene información importante sobre una faceta o dimensión de una red:

  • La hoja de trabajo Edges muestra las conexiones entre usuarios de Twitter en base a tweets, menciones y respuestas. Además de los contenidos de los tweets, esta hoja de trabajo también proporciona metadatos como la cantidad de retweets, me gusta, fecha de tweet, idioma y dispositivo de origen. Además, se han creado columnas que muestran los resultados del análisis de sentimiento.
  • La hoja de trabajo Vertices proporciona detalles sobre cada usuario mencionado en la hoja de trabajo de enlaces y se puede ordenar por varias métricas de red para llevar las cuentas más influyentes a la parte superior de la tabla. Twitter también proporciona métricas como Seguido, Seguidores, Tweets, Favoritos, Descripción, Ubicación, Sitio web y Fecha de incorporación en Twitter, que pueden ser útiles para un análisis posterior. Además, los conteos de sentimiento de la hoja de trabajo de enlaces se resumen para cada usuario.
  • La hoja de trabajo de Groups contiene detalles sobre cada grupo o clúster en la red, como el número de usuarios y enlaces en un grupo, la densidad de la red del grupo, los elementos de contenido superior y la opinión del grupo.
  • La hoja de trabajo de Overall metrics informa las medidas de resumen que definen las dimensiones principales de una red, como la cantidad de usuarios y las conexiones entre ellos.
  • La hoja de trabajo Twitter Search Network Top Items contiene un resumen formateado del análisis de contenido que muestra las URL, los hashtags, las palabras, los pares de palabras y los usuarios que se mencionan con más frecuencia en cada grupo y la red en general.
  • La hoja de trabajo Time Series contiene un gráfico que informa la actividad de tweets en la red durante minutos, horas, días o meses al analizar la columna de fecha de Tweet en la hoja de trabajo de enlaces.



Estudio de caso: Tesla

Todos los datos relacionados con este análisis se pueden encontrar en la Galería de grafos NodeXL en #nxltsl

Explore la egored

Con el importador de la red de usuarios de Twitter, exploraremos la red del ego de la cuenta de marca de Tesla en Twitter. Eso significa recopilar y analizar los tweets anteriores publicados por la cuenta de marca en sí.

La estructura de red out-hub-spoke resultante muestra todos los usuarios de Twitter conectados a través de tweets por la cuenta de marca Tesla.

Cómo crear un análisis de red de ego:

  • Paso 1: abre NodeXL Pro. 
  • Paso 2: descargue e importe este archivo de opciones de NodeXL Pro para utilizarlo en la automatización (¿cómo automatizar?) 
  • Paso 3: Abra el importador de datos de la red de usuarios de Twitter: Import > From Twitter users network
  • Paso 4: ingrese el controlador de Twitter que prefiera y seleccione las opciones como se muestra en la imagen.





  • Paso 5: haz clic en Aceptar y espera a que termine la automatización. El libro resultante de NodeXL Pro se ve así:





Puede encontrar un resumen del informe y el archivo NodeXL Pro completo:

https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141201

Antes de profundizar en los datos, es útil echar un vistazo a la hoja de cálculo de análisis de series de tiempo que muestra la actividad de tweets de la cuenta de marca:

Puede ver que los últimos 3.200 tweets se remontan a febrero de 2014: un cambio importante en la actividad de tweets puede observarse después de agosto de 2014. Y también la producción anual ha disminuido de un año a otro: de 541 tweets por año en 2015 a 174 en 2017.

Información de la red:


En los últimos 3.200 tweets, Tesla se ha conectado a 1.913 (= columna fuera de término en la hoja de cálculo de vértices) de otras cuentas de Twitter, lo que arroja una proporción de 0,60 usuarios conectados por tweet, este valor es 0,44 si solo se consideran los 500 tweets anteriores. Este valor se considera promedio en comparación con otras marcas, p. Toyota (0.88), Ford (0.78), Nissan (0.42), Volkswagen (0.01).

La columna de ponderación de enlace en la hoja de cálculo de enlaces muestra la clasificación de la red de los usuarios principales de Twitter conectados. Este ranking no es sorprendentemente dirigido por Elon Musk, seguido por otras cuentas de Tesla y cuentas relacionadas con la industria:




Estos usuarios conectados principales se consideran nodos importantes de la red circundante de la cuenta de marca.

Análisis de red extendido: la red circundante

Para obtener una visión más profunda de las redes que rodean una cuenta de marca, agregue los principales usuarios conectados al importador de la "Twitter Users Network". De esta forma podemos averiguar en qué medida se hace referencia a la marca por sus propias cuentas en red.

Asegúrese de limitar la cantidad de tweets que se recopilarán, más tiempo obtendrá su lista. Terminar con 10k tweets en general es siempre una buena medida para el manejo de datos. Puede usar el mismo archivo de opciones que antes.

Visite esta página para ver las 23 cuentas principales conectadas por Tesla: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141965

Información del contenido:

Todos los tweets y las estadísticas de tweets están disponibles en la hoja de cálculo de enlaces. P.ej. al ordenar los enlaces por conteo de retweets de columnas y conteo favorito, podemos identificar los tweets más o menos populares:

Tweet más favorito del 16 de noviembre de 2017: la mayoría de los tweets retuiteados a partir del 25 de abril de 2015:





Varias clasificaciones de contenido están disponibles en la hoja de cálculo Elementos principales de la red, como hashtags incrustados superiores, URL, palabras y pares de palabras. Aquí está el ranking de hashtags usados con mayor frecuencia que reflejan las principales campañas de marketing de la compañía durante los últimos años:

Principales Hashtags in eweet en el grafo entero:

[60] goelectric
[32] modelx
[23] model3
[20] tesla
[14] drivefree
[12] meetmodelx
[10] wallpaperwednesday
[9] teslacharging
[7] supercharger100
[6] earthday

Análisis de red extendido: análisis de principales hashtag

Utilice el importador de "Twitter Search Network" para explorar las conversaciones actuales sobre estos hashtags principales. Aquí hay un análisis completo de la red NodeXL Pro en el hashtag # model3: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=140941

Explore la red de la comunidad


La red comunitaria actual de una marca se explora con el importador de "Red de búsqueda de Twitter" al ingresar el nombre de la cuenta de marca (incluido el @) en la barra de búsqueda del importador.

Con una cuenta de marca popular en el centro de este análisis, los mapas de red resultantes suelen estar dominados por la estructura de red en el centro y el radio ya que las marcas no hablan mucho, pero al mismo tiempo se les habla mucho.

Cómo crear un análisis de red comunitaria:


Paso 1: descargue e importe este archivo de opciones de NodeXL Pro para utilizarlo en la automatización (¿cómo automatizar?)

Paso 2: abra el importador de datos de la red de búsqueda de Twitter: Import > From Twitter Search network

Paso 3: ingrese @Tesla en la barra de búsqueda y seleccione las opciones como se muestra en la imagen.




Paso 4: haz clic en Aceptar y espera a que se complete la automatización. El libro de trabajo NodeXL Pro resultante puede verse así y ahora está listo para una mayor exploración:



Puede echar un vistazo al informe y descargar el archivo de datos aquí: https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=141668

Información del contenido


El mapa de red creado arriba muestra la visualización de 9,481 tweets recogidos el 8 de febrero de 2018, dos días después del lanzamiento del SpaceX Falcon Heavy que llevaba un Tesla Roadster perteneciente al fundador de SpaceX, Elon Musk. La hoja de trabajo de los elementos principales de Twitter revela el impacto abrumador de este evento en este conjunto de datos cuando se buscan las palabras principales, los pares de palabras y los hashtags. Aquí están los hashtags principales en todo el grafo y dentro de los cuatro grupos principales:

Top Hashtags in Tweet in Entire Graph Entire Graph Count Top Hashtags in Tweet in G1 G1 Count Top Hashtags in Tweet in G2 G2 Count Top Hashtags in Tweet in G3 G3 Count Top Hashtags in Tweet in G4 G4 Count
roadster 974 roadster 884 falconheavy 322 falconheavy 179 starman 9
falconheavy 867 falconheavy 299 spacex 192 spacex 128 spacex 6
spacex 467 space 148 falconheavylaunch 100 tesla 93 mars 5
tesla 263 crypto 140 starman 72 teslaroadster 88 roadster 4
starman 255 spacex 97 tesla 58 starman 57 falconheavy 4
space 214 starman 59 teslaroadster 40 roadster 45 tesla 3
teslaroadster 152 tesla 57 mars 40 teslainspace 33 usaf 3
crypto 143 mars 38 dontpanic 36 model3 24 falconheavycargo 2
falconheavylaunch 126 model3 31 elonmusk 29 space 23 aimhigh 2
model3 117 teslaroadster 17 roadster 28 elonmusk 22 space 2


Información de la red

Grandes grupos de usuarios de Twitter se reúnen en torno a cuatro cuentas centrales de Twitter en esta red: @Tesla (G1), @elonmusk (G2) y @spacex (G3). El Grupo 4 está formado alrededor de un tweet por el Comando Espacial de la Fuerza Aérea Twitter @afspace. Estas cuentas se identifican como las más influyentes al ordenar la hoja de cálculo de vértices por Betweenness Centrality (columna U).

Puede desplazarse hacia abajo para ver la lista completa de usuarios en esta red o desplazarse hacia la derecha para buscar más información sobre cada usuario, como descripción, sitio web, zona horaria, cantidad de tweets, cuentas de seguidores, etc.




Tenga en cuenta que una centralidad de intersección alta no significa automáticamente influencia en la red. Un Out-Degree alto emparejado con un In-Degree bajo puede ser un indicador para bots (re) tweet y por lo tanto no requieren mucha atención.

Puede eliminar estas cuentas de su análisis haciendo clic en Show/Hide > Workbook columns > Visual properties y pegando Skip en la columna Visibility (H). Actualice la ventana del grafo después de eso, o vuelva a ejecutar un análisis completo para ver si la forma de la red cambia después de filtrar el ruido de datos.

Análisis extendido: una serie de análisis de red

Las redes creadas con Twitter Search Network son altamente dinámicas, por eso las actualizaciones periódicas son necesarias, p. identifique líderes de opinión, grupos emergentes de usuarios sobre ciertos temas o monitoree los puntajes de opinión. A continuación, presentamos una serie de informes de NodeXL que contarán diferentes historias:


@Tesla Twitter Community Network 2018-04-30


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=150028

Palabras positivas: 7.07%
Palabras negativas: 0.85%

El clúster @elonmusk (G1) supera al clúster @Tesla en este mapa y muestra una vez más el enorme impacto de Musk en la marca Tesla.


@Tesla Twitter Community Network 2018-05-07


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=150922

Palabras positivas: 3.09%
Palabras negativas: 1.91%

Esta instantánea de discusión se tomó unos días después de la cambiante entrevista de Elon Musk sobre el informe financiero del primer trimestre ...


@Tesla Twitter Community Network 2018-05-23


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=152874

Palabras positivas: 1.56%
Palabras negativas: 1.08%

Este análisis de red se creó dos días después de que Consumer Reports revelara preocupaciones de seguridad sobre el sistema de frenado de Tesla.


@Tesla Twitter Community Network 2018-06-01


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=153997

Palabras positivas: 3.15%
Palabras negativas: 2.24%

Crear un análisis de red de marca


Al eliminar el @ de la consulta de búsqueda, los resultados de la búsqueda se ampliarán. Encontrará un poco de ruido de fondo en los datos ya que también hay menciones y conversaciones sobre Nikola Tesla. Sin embargo, hay muchas historias de autos de Tesla que se pueden encontrar.

Para crear un análisis de red de marca, siga todos los pasos del análisis de la red de comunicación y el mapa resultante de la red NodeXL Pro tendrá el siguiente aspecto:


Información de la red


La estructura de red dominante de este tipo de análisis es la "Red de marca". El grupo más grande de usuarios son los aislados que se encuentran en G1. El tamaño de este grupo y un gran número de pequeños grupos aislados es una buena medida para el conocimiento de la marca y el alcance de la marca.

El mapa de la red también muestra el alcance global de Tesla, ya que puede ver clusters de idiomas regionales que se pueden explorar más. Aquí hay una descripción general creada a partir de la columna de enlace AG (Idioma):


Análisis extendido: más análisis de red



Otra serie de análisis de Tesla que hemos creado con el importador de la red NodeXL Pro Search:
Tesla Twitter Brand Network 2018-03-26
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=146166
Palabras positivas: 3.83%
Palabras negativas: 1.41%
El grupo más grande (G1) en esta red se centra en crypto marketplace @vestarin y su anuncio de asociarse con Tesla.



 
Tesla Twitter Brand Network 2018-05-24
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=152963
Palabras positivas: 2.60%
Palabras negativas: 2.93%

Este análisis de red se creó tres días después de que Consumer Reports revelara preocupaciones de seguridad sobre el sistema de frenado de Tesla .


.
Tesla Twitter Brand Network 2018-06-01
https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155439
Palabras positivas: 3.12%
Palabras negativas: 1.72%



Crear un análisis de red de la competencia


Hay diferentes formas de recopilar datos comparativos de red. Obviamente, puede comenzar desde el principio y realizar todos los análisis previos en cualquier marca de su elección. Aquí hay un análisis de red que abarca los tweets en torno al vehículo más popular en el mercado estadounidense: el Nissan Leaf:


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=151748

Otro enfoque es crear una lista de cuentas de marca y utilizar el importador de la "red de usuarios de Twitter" para recolectar datos de la red. Aquí puede descargar un análisis completo de la red NodeXL Pro con datos comparativos de las 52 principales marcas de automóviles:



Una vista alternativa de los mismos datos:



https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=143291

Aquí se puede encontrar una vista más enfocada con solo cuatro competidores directos en el mercado de vehículos eléctricos: @Tesla @NissanElectric, @RenaultZE y @ ChevyElectric:



https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155520

Un enfoque diferente para comparar marcas es poner varios nombres de cuenta de la competencia en una consulta del importador de la "red de búsqueda de Twitter": @NissanElectric OR @RenaultZE OR @ ChevyElectric OR @Tesla:


https://nodexlgraphgallery.org/Pages/Graph.aspx?graphID=155525

También puede comparar las conversaciones en torno a los hashtags superiores de los vehículos eléctricos más populares: # model3 OR #nissanleaf O # MissionE:

miércoles, 4 de julio de 2018

Otra introducción al ARS

Análisis de redes sociales: estado del arte


Contribuido por: Bart Baesens | datamining apps


Introducción

En las últimas décadas, el uso de sitios web de redes sociales en la vida cotidiana de todos está en auge. Las personas pueden continuar sus conversaciones en sitios de redes sociales como Facebook, Twitter, LinkedIn, Google+, Instagram, etc., y compartir sus experiencias con sus conocidos, amigos, familiares, etc. Solo hace falta un clic para actualizar su ubicación al resto de el mundo. Hay muchas opciones para transmitir sus actividades actuales: por una imagen, video, ubicación geográfica, enlaces o simplemente texto sin formato.

Los usuarios de los sitios de redes sociales en línea revelan explícitamente sus relaciones con otras personas. En consecuencia, los sitios de redes sociales son un mapeo casi perfecto de las relaciones que existen en el mundo real. Saben quién eres, cuáles son tus aficiones e intereses, con quién te casas, cuántos hijos tienes, tus amigos con los que trabajas todas las semanas, tus amigos del club del vino, etc. Esta red interconectada de gente que sabe el uno al otro de alguna manera es una fuente de información y conocimiento extremadamente interesante. Los gerentes de marketing ya no necesitan adivinar quién podría influir en quién crear la campaña adecuada. Está todo allí ... cuál es el problema. Los sitios de redes sociales reconocen la riqueza de las fuentes de datos que tienen y no están dispuestos a compartirlos sin costo. Esos datos a menudo se privatizan y regulan, y están bien ocultos para uso comercial. Por otro lado, los sitios de redes sociales ofrecen muchas facilidades incorporadas a los gerentes y otras partes interesadas para lanzar y administrar sus campañas de mercadotecnia explotando la red social, sin publicar la representación exacta de la red.

Sin embargo, las empresas a menudo se olvidan de que pueden reconstruir una parte de la red social utilizando datos internos. Los proveedores de telecomunicaciones, por ejemplo, tienen una base de datos transaccional masiva donde registran el comportamiento de llamadas de sus clientes. Bajo el supuesto de que los buenos amigos se llaman entre sí más a menudo, podemos recrear la red e indicar la fuerza de enlace entre las personas en función de la frecuencia y / o duración de las llamadas. Los proveedores de infraestructura de Internet pueden mapear las relaciones entre las personas que usan las direcciones IP de sus clientes. Las direcciones IP que se comunican frecuentemente están representadas por una relación más fuerte. Al final, la red de IP contemplará la estructura relacional entre las personas desde otro punto de vista, pero hasta cierto punto, como se observa en la realidad. Se pueden encontrar muchos más ejemplos en las industrias de banca, venta minorista y juegos en línea. En este artículo, discutimos cómo se pueden aprovechar las redes sociales para el análisis.

Definiciones de redes sociales

Una red social se compone de nodos (vértices) y enlaces. Ambos deben estar claramente definidos al comienzo del análisis. Un nodo (vértice) podría definirse como un cliente (privado / profesional), hogar / familia, paciente, médico, papel, autor, terrorista, página web ... Un enlace puede definirse como la relación de un amigo, una llamada, la transmisión de un enfermedad, una relación de "seguimiento", una referencia, etc. Tenga en cuenta que los enlaces también se pueden ponderar según la frecuencia de interacción, la importancia del intercambio de información, la intimidad, la intensidad emocional, etc. Por ejemplo: en una configuración de predicción de abandono, el enlace puede ponderarse de acuerdo con el tiempo (total) en que dos clientes se llamaron durante un período específico. Las redes sociales se pueden representar como un sociograma. Esto se ilustra en la figura siguiente por la cual el color de los nodos corresponde a un estado específico (por ejemplo, revuelto o no revuelto).


Ejemplo de sociograma.

Los sociogramas son útiles para representar redes de pequeña escala. Para redes de gran escala, la red se representa típicamente como una matriz (ver a continuación). Estas matrices serán simétricas [1] y típicamente muy dispersas (con muchos ceros). La matriz también puede contener los pesos si se producen conexiones ponderadas.


C1 C2 C3 C4
C1 1 1 0
C2 1 0 1
C3 1 0 0
C4 0 1 0

Representación matricial de una red social.

En lo que sigue, discutimos cómo se pueden aprovechar las redes sociales para los análisis descriptivos y predictivos.


Análisis descriptivo: métricas de redes sociales y minería comunitaria


Recuerde, el objetivo del análisis descriptivo es describir un conjunto de datos utilizando un conjunto de estadísticas o métricas clave. Una red social se puede caracterizar por varias métricas de centralidad. Las medidas de centralidad más importantes se muestran en la siguiente tabla.


Geodésica Ruta más corta entre dos nodos en la red.
Grado Número de conexiones de un nodo (dentro versus fuera de grado si las conexiones están dirigidas).
Cercanía La distancia promedio de un nodo a todos los demás nodos de la red (recíproco de lejanía).
Intermediación Cuenta el número de veces que un nodo o enlace se encuentra en la ruta más corta entre dos nodos de la red.
Centro teórico de grafos El nodo con la distancia máxima más pequeña a todos los otros nodos de la red.



Medidas de centralidad de red común.

Estas métricas ahora se pueden ilustrar con el ejemplo de juguete de red Kite representado en la siguiente figura [2]:




La red barrilete.


Grado CercaníaIntermediación
6 Diane 0.64 Fernando 14 Heather
5 Fernando 0.64 Garth 8.33 Fernando
5 Garth 0.6 Diane 8.33 Garth
4 Andre 0.6 Heather 8 Ike
4 Beverly 0.53 Andre 3.67 Diane
3 Carol 0.53 Beverly 0.83 Andre
3 Ed 0.5 Carol 0.83 Beverly
3 Heather 0.5 Ed 0 Carol
2 Ike 0.43 Ike 0 Ed
1 Jane 0.31 Jane 0 Jane

Medidas de centralidad para la red Kite.

La tabla anterior informa las medidas de centralidad para la red Kite. Según el grado, Diane es la más importante ya que tiene la mayoría de las conexiones. Ella trabaja como un conector o concentrador. Sin embargo, tenga en cuenta que solo conecta a los que ya están conectados entre sí. Fernando y Garth son los más cercanos a todos los demás. Son los mejor posicionados para comunicar mensajes que deben fluir rápidamente a todos los demás nodos de la red. Heather tiene la mayor intersección. Ella se sienta entre dos comunidades importantes (Ike y Jane contra el resto). Ella juega un rol de intermediario entre ambas comunidades, pero también es un punto único de falla. Tenga en cuenta que la medida de intersección a menudo se utiliza para la minería comunitaria. Una técnica popular aquí es el algoritmo de Girvan-Newman que funciona de la siguiente manera [3]:
  • La intersección de todos los enlaces existentes en la red se calcula primero.
  • El enlace con la mayor intersección se elimina.
  • La interdependencia de todos los enlaces afectados por la eliminación se vuelve a calcular.
  • Los pasos 2 y 3 se repiten hasta que no quedan enlaces.
El resultado es esencialmente un dendrograma (similar a, por ejemplo, agrupamiento jerárquico), que luego se puede utilizar para decidir el número óptimo de comunidades. La minería comunitaria sirve para varios propósitos. Permite comprender el comportamiento de subconjuntos homogéneos en su red que pueden ser especialmente relevantes en análisis de marketing (por ejemplo, para recomendaciones específicas) o detección de fraude (para detectar, por ejemplo, anillos de fraude). Además, la información de la comunidad también puede aprovecharse para el análisis predictivo, utilizando, p. procedimientos de producción como explicamos a continuación.


Análisis predictivo: aprendizaje de redes sociales


En el análisis predictivo, el objetivo es medir una variable objetivo de interés. Los ejemplos podrían ser abandono, fraude, valor predeterminado o valor de vida del cliente (CLV). En el aprendizaje de redes sociales, el objetivo es calcular la probabilidad de membresía de clase (por ejemplo, probabilidad de abandono) de un nodo específico, dado el estado de los otros nodos de la red. Varios desafíos importantes surgen cuando se aprende en las redes sociales. Un desafío clave es que los datos no son independientes y están distribuidos de forma idéntica (IID), una suposición que a menudo se hace en modelos estadísticos clásicos (por ejemplo, regresión lineal y logística). El comportamiento de correlación entre los nodos implica que la pertenencia a la clase de un nodo puede influir en la pertenencia a la clase de un nodo relacionado. A continuación, no es fácil crear una división en un conjunto de capacitación para el desarrollo del modelo y un conjunto de prueba para la validación del modelo, ya que toda la red está interconectada y no se puede cortar en dos partes. Además, muchas redes son de gran escala (por ejemplo, un gráfico de llamadas de un proveedor de telecomunicaciones) y es necesario desarrollar procedimientos computacionales eficientes para hacer el aprendizaje. Finalmente, no se debe olvidar la forma tradicional de hacer análisis utilizando solo información específica de nodo (es decir, sin los aspectos de red) ya que esta información puede ser muy valiosa para la predicción también.

Una forma directa de aprovechar las redes sociales para el análisis predictivo es resumir la red en un conjunto de características que luego se pueden combinar con características que no sean de red (es decir, locales) para el modelado predictivo. Un ejemplo popular de esto es la regresión logística relacional según lo introducido por Lu y Getoor (2003) [4]. Este enfoque básicamente parte de un conjunto de datos con características locales específicas del nodo y le agrega características de red de la siguiente manera:
  • La clase de vecino más frecuente (modo-enlace);
  • Frecuencia de las clases de los vecinos (enlace de frecuencia);
  • Indicadores binarios que indican presencia de clase (enlace binario).

Esto se ilustra en la figura siguiente para el cliente Bart.


Regresión logística relacional.


Luego, se puede estimar un modelo de regresión logística o árbol de decisión utilizando el conjunto de datos con características locales y de red. Tenga en cuenta que existe una cierta correlación entre las características de red agregadas, que deben filtrarse durante un procedimiento de selección de entrada. La creación de características de red también se llama Featurization, ya que las características de la red se agregan básicamente como características especiales al conjunto de datos. Estas características pueden medir el comportamiento de los vecinos en términos de la variable objetivo (por ejemplo, abandono o no) o en términos de las características específicas del nodo local (por ejemplo, edad, promociones, etc.). La figura a continuación proporciona un ejemplo en el que se agrega una característica que describe la cantidad de contactos con churners. La columna final etiquetada 'Churn' es la variable objetivo.


Ejemplo de Caracterización con características que describen el comportamiento objetivo de los vecinos.

La figura a continuación proporciona un ejemplo donde se agregan características que describen el comportamiento del nodo local de los vecinos.


Ejemplo de Caracterización con características que describen el comportamiento del nodo local de los vecinos.

Privacidad

Obviamente, el uso de datos de redes sociales para fines analíticos también requiere una reflexión exhaustiva sobre la privacidad. Con frecuencia, los clientes desconocen sus rastreos de datos, tanto en línea como fuera de línea, y cómo pueden analizarse. Por lo tanto, especialmente bajo la regulación GDPR actual, es de vital importancia que las empresas siempre divulguen adecuadamente qué datos recopilan y cómo los usan. Al hacerlo, no solo deben enfocarse en posibles beneficios de privacidad sino también en los beneficios para el cliente, de modo que los clientes puedan tomar una decisión bien informada sobre si, cuándo y cómo se pueden usar sus datos.

Conclusión

En este artículo, nos acercamos al análisis de redes sociales. Comenzamos brindando definiciones clave de redes sociales. A continuación, ilustramos cómo se pueden aprovechar las redes sociales para el análisis descriptivo resumiéndolos mediante métricas de redes sociales como cercanía, interdependencia, etc. A continuación, desarrollamos el uso de redes sociales para el análisis predictivo utilizando varios procedimientos de presentación. Es importante señalar que aunque las redes sociales representan un nuevo tipo de información, definitivamente no se debe sobreestimar su poder. Más específicamente, uno no debería abandonar los datos tradicionales que no pertenecen a la red para hacer análisis. A lo largo de nuestra investigación, encontramos que los mejores modelos analíticos para, p. Predicción de abandono de pagos: la detección de fraudes generalmente se genera utilizando una combinación de datos de red y no de red. Finalmente, es importante tener en cuenta que siempre que se analicen datos de redes sociales, la privacidad siempre debe respetarse.


Referencias y notas

  • [1] Tenga en cuenta que este es solo el caso de las redes no dirigidas. Para redes dirigidas, que representan p. una relación 'siguiente' que no es necesariamente recíproca, la matriz no será simétrica.
  • [2] Krackhardt, D, Assessing the Political Landscape: Structure, Cognition, and Power in Organizations, Administrative Science Quarterly, 35, pp. 342-369, 1990.
  • [3] Girvan M., Newman M. E. J., Community structure in social and biological networks, Proceedings of the National Academy of Sciences, USA 99, pp. 7821–7826, 2002.
  • [4] Lu Q., Getoor L., Link-based Classification, Proceeding of the Twentieth Conference on Machine Learning (ICML-2003), Washington DC, 2003.

martes, 26 de junio de 2018

Curación de datos en Big Data


Cómo hacer curación de contenido con los datos

Dr. Who



El contenido es el rey: siempre lo escuchamos cuando hablamos de la cura del contenido. Producir contenido valioso es difícil, si no tenemos idea, es prácticamente imposible. El valor de un contenido puede tener múltiples significados. Una cosa es segura: además de su originalidad, debe reflejar la demanda del mercado; debe reflejar, es decir, lo que las personas buscan en la red. Los datos en la web pueden ayudarnos en este sentido y, una vez procesados, pueden brindarnos diferentes maneras de hacerlo.

Curación de contenido guiados por datos: Pasos operacionales

Comienza desde el tema: definido el tema es necesario para dibujar la arquitectura de análisis. La arquitectura de análisis no es más que un documento simple para registrar los principales elementos de nuestro análisis, como son: el lapso de tiempo a considerar, la identificación de los canales donde residen los contenidos, el análisis de la pregunta específica.

Estos cuatro elementos básicos se deben expandir de acuerdo con los hallazgos que proporciona el raspado de datos. Un elemento fundamental es tener un buen crowler para obtener los datos de partida sin procesar.

El tema que traigo como ejemplo, y cuyos datos se tomaron hace más de un año, es el de la salud digital. El período de tiempo considerado fue de 30 días. La elección de este tiempo ajustado se debe al hecho de que es necesario evitar la dispersión de la demanda: un tiempo ajustado asegura que los datos se recopilan de los eventos recientes.

El cuestionamiento de la red permitió extraer más de 1700 contenidos con un duopolio de canales en los que viajó este contenido. Los tweets y artículos en línea dividían, hace un año, los contenidos sobre el tema de salud digital.

A partir de esta información, es posible ampliar la estructura arquitectónica de nuestro análisis: extraer información de la web para realizar el análisis de extracción de texto y comprender la existencia de aspectos particulares; lleve a cabo el análisis de las conversaciones de twitter para comprender cómo se debatió el tema e identifique, si existieran, personas influyentes específicas.


Curación de contenido: análisis SERP


El análisis SERP nos permite identificar tanto la competencia existente sobre el tema, como los segmentos que lo componen. El enfoque es el del análisis de cola larga que muchos de ustedes conocen. El análisis de cola larga, sin embargo, no es el único tipo de actividad que se puede realizar en un SERP: una vez tomada, también se puede analizar a través del análisis de minería de texto, en particular en la dimensión de metadescripción. La metadescripción es uno de los elementos fundamentales que guían nuestra investigación al facilitar la elección de clikkare, o no, en uno de los diversos enlaces que nos devuelve una consulta en Google. Dado el tiempo y el tema, hace un año tomé unos 980 sitios (igual al 50% del SERP completo) con una opción aleatoria estratificada. La estratificación permite considerar diferentes grupos de agregaciones y tener una representación estadística.

Para evaluar la oportunidad de llevar a cabo el análisis minería de texto en profundidad, el primer indicador que vemos es el de la tabla Zipf: un gráfico denso nos muestra que los temas resumidos en la meta descripción se argumentan; hay algún material sobre el cual trabajar y avanzar con el análisis.

Curación de contenido: análisis de minería de texto


Las ideas que surgieron hace un año fueron muy interesantes: la mayor parte del contenido en línea se relacionó con artículos / publicaciones para personajes locales y esto ensucia la capacidad del análisis para resaltar el estado de ánimo subyacente.



Al eliminar estos aspectos, fue posible identificar dos macroconjuntos: uno relacionado con la identidad digital, el otro más específico sobre el tema de la innovación digital en el sector hospitalario (lado derecho del gráfico).

La lectura de los contenidos de los dos clusters identificados: 4 referencias web para el clúster de identidad digital y 10 referencias para el clúster de innovación digital.

Estos 14 sitios representan las fuentes relevantes para una primera identificación del estado de ánimo subyacente en un tema determinado. Al combinar estas instancias con la segmentación hecha con el análisis de la cola larga, tenemos excelentes indicaciones para identificar el área temática que queremos cubrir con nuestro contenido.

Curación de contenido: evaluación de tema con el SNA

Se recopilaron más de 728 conversaciones en Twitter y se encontró una red de 526 oradores que generaron más de 500 informes.

Al aplicar los indicadores estadísticos apropiados, se resaltaron algunos conglomerados de conversación. En particular:

  • Mercado de salud digital (clúster verde)
  • Innovación en asistencia sanitaria digital (racimo rojo)
  • Dossier electrónico (clúster negro)
  • Observatorio PoLIMI (grupo naranja)
  • Convención del observatorio digital (clúster central)



Los principales contenidos fueron extraídos de cada grupo individual.

Ambos análisis, aunque con matices obvios, confirman los conocimientos que se pueden utilizar en términos de datos de curación de contenido impulsados, lo que respalda tanto la demanda del mercado como las conversaciones relacionadas con ella. No solo eso: el análisis de redes sociales también nos permite identificar cuáles de los actores analizados son los mejores para "contactar" para compartir el contenido que vamos a crear.

jueves, 7 de diciembre de 2017

Análisis de datos y sitios para funciones de SEO

SEO: cómo los datos pueden revelar errores y oportunidades ...
Virgile Juhan | JDN





La explotación de datos para mejorar el SEO fue uno de los principales temas de SEO Camp'us. Al final del día, dos retroalimentaciones instructivas, incluida la de Priceminister..

La explosión de datos también concierne a los SEO, y la explotación de este depósito de información está comenzando a madurar y tiene un fuerte impacto en la gestión del SEO. Esta es una de las lecciones que se pueden aprender de SEO Camp'us, el evento estrella de SearchBridge el 9 y 10 de marzo de 2017, del cual JDN fue socio.

"Los datos pueden provenir de Google y sus herramientas, como su webmaster. Pero también hay herramientas de terceros, tales Botify, Yooda o Majestic que puede proporcionar aún más datos. Cruzarlos a continuación, utilizando todos estos datos se utiliza para salir de una lógica empírica para la construcción de las estrategias impulsadas por datos-, "observó Olivier Tassel, consultor de NetBooster en su precisión en base a este tema de la conferencia (" empíricamente SEO a SEO de datos centrada en cómo su estrategia corporativa en 2017? "). Este especialista también señala que todos estos datos pueden ser monitorizados con soluciones personalizables de cuadros de mando muy flexibles y potentes, además de código abierto, como Superserie, desarrollado por Airbnb. Arriba: hábilmente explotados todos estos datos se pueden alimentar los sistemas de aprendizaje automático, y por lo tanto abierto a la senda predictiva.

Un DataViz para la detección de un fallo de funcionamiento

Para tomar un ejemplo la primera base, los datos de una herramienta útil SEO pueden ser explotadas por una solución DataViz para extraer rápidamente la atención a un problema importante. El caso fue presentado por Simon Georges, consultor de Makina Corpus. Este experto SEO Drupal y utilizó por primera vez el rastreo Screaming Frog herramienta para navegar por un sitio como Google haría. Gritando rana está en la lista que incluye las direcciones URL visitadas dentro de este sitio web. entonces esta lista se ha subido a la herramienta DataViz Gephi de código abierto. Y luego, sorpresa: si el sitio se supone que tiene tres secciones, una cuarta apareció muy claramente en el gráfico. la respuesta del propietario del sitio: "se ve como un tumor". Y eso es todo, de hecho.


DataViz realizado por Gephi que muestra 4 colores correspondientes a las cuatro partes de un sitio ... que se supone que hace que el recuento 3! © Simon Georges

Lo que pasa es que el sitio de la casa incluye un calendario de eventos. En esta agenda, no eran tan absolutamente clásico, un enlace "próximo mes" y "mes anterior". El rastreador se vio envuelto en un sinfín de estos enlaces. Volvió décadas atrás, y lo mismo antes. Esta es la cuarta sección del sitio, que aparece muy visual (púrpura aquí-contra) en Gephi, y por lo tanto en realidad corresponde a ... un calendario. "Luego, cuando se estudió el verdadero rastreo robot de Google, se confirmó que estaba tomando exactamente el mismo camino que el robot Screaming Frog. Por lo tanto, Google desperdiciando su tiempo para rastrear páginas sin ningún interés, mientras que para otras páginas con un gran potencial de SEO fueron descuidados o no del todo exploradas", lo que lleva Simon Georges.

SEO predictivo en PriceMinister

También hay ejemplos mucho más avanzadas en el campo de la minería de datos, predictivo y tendiendo a. SEO Priceminister Cecile Beroni, ha compartido su trabajo en el campo de datos grandes. Su entorno es uno de los sitios con alto volumen, un sitio con no menos de 24 millones de páginas, incluyendo 17 millones indexadas en Google. Por supuesto, SEO es altamente estratégica, con 30 a 40% de las visitas SEO (excluyendo consultas decir "marca", navegación).


Cécile Beroni, Priceminister SEO para SEO Camp'us © 2017 JDN

"Queríamos utilizar los primeros datos disponibles para mejorar la indexación de Google. El propósito era específicamente para aumentar el número de páginas indexadas o mejorar la rotación de URL rastreadas," resume SEO. Para este primer proyecto, el rastreo de Google es estudiado en profundidad, y cambios en el sitio para ayudar a guiar robots de Google ayudaron mucho mejor predecir qué páginas serán cubiertos. Un algoritmo de casa, confidencial, se ha desarrollado.

"Ahora sabemos que el 80% de las URL que Google rastree, mientras que en el principio era el 61%," dice SEO. "Al final, el número de páginas que se arrastró en realidad no ha aumentado. Especialmente la rotación viajó URL que ha sido mejorado." PriceMinister puede entonces "empujar" y almacenar millones de URL estratégicas - una cifra que tiende a limitar su caché solución sin barniz. "Anteriormente, Google podría obtener más de seis meses para recorrer todo el catálogo, ahora Google puede tener acceso a un mayor número de direcciones URL en un tiempo bastante corto. Este fue nuestro principio", recuerda Cécile Béroni.

Luego fue el blanco de una mejor predicción de palabras clave estratégicas "las principales palabras clave",. Para este proyecto, el sitio era capaz de confiar en un equipo interno (SEO, inteligencia de negocios, grandes volúmenes de datos), sino también en un proveedor de servicios externo, Authoritas, que proporciona gran cantidad de datos. Entre ellos: las palabras clave sobre la que se colocan Priceminister con su volumen de búsquedas y competidores que también están en sus resultados de búsqueda, entre otros. "Era necesario poner de relieve las oportunidades", dijo Seo. Ellos tomaron la forma de una lista bastante cruda de 2,4 millones de palabras clave que podrían apuntar sitio de comercio electrónico.

"A continuación, tuvo que trabajar en la lista, respondiendo a varias preguntas: ¿Tenemos el producto afectado por palabra clave ¿Cuál es la competencia para esa palabra clave, la presencia de Google Shopping también puede dar pistas interesantes de este tema ", detalla el empleado PriceMinister. Una vez que estos filtros producen, 1,4 millones de nuevas páginas de destino fueron creados o mejorados. El resultado anunciado por el sitio del comerciante es espectacular: 40% más de visibilidad en los resultados de reensamblaje de Google, según la herramienta de Searchmetrics.

martes, 18 de julio de 2017

Marketing: Cómo ayuda a la gestión de SEO el uso de grafos

SEO: Cómo impulsar su tráfico de Web con visualización de grafos

Grégory DOMINÉ | Linkurious
En esta entrada de blog nuestros amigos de NetBooster explican cómo convertir los datos de su sitio web en una visualización de grafos para mejorar su palabra clave y las decisiones de contenido de SEO.


Search Engine Optimization es una disciplina de marketing digital que tiene como objetivo mejorar la visibilidad de sitios web en los motores de búsqueda. Una gran parte del trabajo consiste en la minería de datos semánticos para medir el interés y localizar el potencial de crecimiento del tráfico.

Mientras tanto, mediante la ingeniería inversa algoritmo de búsqueda de Google, los expertos SEO tienden a organizar los sitios web en arquitecturas significativas que se rastrean, entendido e indexado por las arañas de Google.

De su blog personal a la venta al por menor en línea de primera clase, la semántica y la arquitectura de la información se convierten en críticas de hecho cuando Google tiene que decidir qué página - de un competidor o de su Web site - alineará primero en las páginas de los resultados de la búsqueda.

SEO orientado a datos

Durante muchos años, la experiencia SEO se basó principalmente en tácticas de prueba y aprendizaje, pero nosotros, en NetBooster, fomentamos el uso de datos para predecir y medir el éxito de SEO.

Mientras que la recolección de datos para dar forma a la estructura del sitio web era un desafío complejo, se hizo obvio que la visualización del gráfico podía ayudarnos a hacer sentido fuera de él: un Web site es apenas otra red de nodos (Webpages) ligados.

Así que empezamos recogiendo datos de SEO: rastreo de sitios, búsqueda centrada en el sitio, búsqueda centrada en el usuario, clasificaciones de sitios.

Rastreo del sitio

Por definición, un sitio web es una red de archivos (la mayoría de las veces los documentos HTML también se llaman páginas web) vinculados entre sí. Pero una página también puede vincularse a otra sin reciprocidad.

De acuerdo con el tamaño del sitio web, la gran cantidad de páginas y enlaces entre ellos puede ser rápidamente abrumadora. Por lo tanto, los expertos SEO utilizan el software para rastrear cada página y cada enlace de un sitio web. El rastreo del sitio resulta en una tabla en la que se enumeran todos (ver datos de ejemplo a continuación: la página car.html tiene un enlace hacia la página plane.html).

Esta red de nodos y enlaces será la base de nuestra base de datos de gráficos.


Búsqueda centrada en el sitio

Google Search Console es una herramienta gratuita que proporciona datos de búsqueda para un sitio determinado. Ofrece a los webmasters una visión general de las actuaciones de su sitio web para cada consulta específica buscada por sus visitantes (ver ejemplos de datos a continuación: la palabra clave ha conducido 20 visitas de Google a la página car.html).


Página fuentePágina destino
mysite.com/transportation/car.htmlmysite.com/transportation/plane.html

Estos datos serán útiles para determinar qué consultas, buscadas en Google, realmente dirigen tráfico a la página de un sitio web. La mayoría de las veces, resulta en miles de entradas.

Búsqueda centrada en el usuario

Google Keyword Planner es otra herramienta gratuita proporcionada por la empresa de Mountain View. Ayuda a los expertos de SEO a pesar volúmenes de búsqueda de miles de consultas y acciones de prioridad (ver ejemplo de datos a continuación: la palabra clave coche se ha buscado 12.000 veces el mes pasado).



CategoryKeyword
Monthly average search volume
Transportationcar
12,000
Transportationplane
8,000
Transportationtrain
4,000


A medida que cada palabra clave está completamente categorizada, los expertos en SEO pueden agruparlos en grupos de intenciones y extrapolar la demanda de búsqueda para propósitos más amplios (por ejemplo, palabras clave como coche, avión y tren podrían agruparse en un grupo de transporte y acumular un volumen de búsqueda de 24.000 consultas por mes).

Esta taxonomía es fundamental para reducir el alcance de las asignaciones de sitios y para priorizar los temas más estratégicos: puede decidir fácilmente si priorizar la creación de contenido dedicado al transporte o al alojamiento.


Visualización del sitio

Después de recopilar e importar los datos en una base de datos de grafos (decidimos usar Neo4J asociado con Linkurious después de resultados infructuosos usando Gephi) pudimos solicitar cualquier nodo de nuestro sitio web y mostrar enlaces entre ellos:

  • Nodos de palabras clave, recopilados a través de datos de búsqueda centrados en el sitio y datos de búsqueda centrados en el usuario;
  • Nodos de página, recopilados a través de datos de rastreo de sitios.

Esto es cuando empezamos a convertir los datos de nuestro sitio web en visualización.

Clasificación por categoría de palabras clave

Una vez importados en la base de datos Neo4J y mostrados a través de Linkurious, ahora podríamos mostrar todas las palabras clave relacionadas con una categoría y ver cuáles de ellas estaban dirigiendo el tráfico al sitio web.

En el siguiente ejemplo, las palabras clave relacionadas con management (strategic management) generaron visitas a 2 páginas del sitio web (nodos grises). El tamaño de los nodos de palabras clave muestra su volumen de búsqueda mensual (manager es más solicitado que management).



Visualización del cluster de palabras clave de management y sus conexiones a páginas web.

En este otro ejemplo, las palabras clave relacionadas con finance no generan tráfico alguno en el sitio web.



Visualización del cluster de palabras clave finance.

Siguiendo esta metodología, el análisis de todos los temas identificados en los datos de búsqueda centrados en el usuario puede caracterizar el tráfico a un sitio web y revelar el potencial de crecimiento: los temas que no tienen una página de respuesta pueden abordarse a través de la creación de contenido.

Creación de página

La creación de páginas que reflejan estructuras semánticas consistentes era una tarea fastidiosa. Y por desgracia, tuvimos que mover cada nodo manualmente para diseñar patrones significativos, ya que aún no sabíamos sobre la opción de peso de ForceLink Layout (que distribuiría nodos según el peso de su enlace) disponible en el SDK.

En la siguiente figura, creamos una nueva página (nodo gris con estrellas) destinada a capturar tráfico de las palabras clave relacionadas con las finanzas: our-finance-programs.html


Visualización de las nuevas conexiones entre la página web y el clúster de palabras clave finance.

Pero estas estructuras pueden ser mucho más complejas, dependiendo del tamaño de los clústeres de palabras clave. En el siguiente ejemplo, las palabras clave relacionadas con el grado de tema, se han reorganizado manualmente en varios subclases, cada uno vinculado a una nueva página dedicada.


Visualización de subgrupos de palabras clave degree y sus respectivas conexiones a páginas web.

Despliegue de contenido

Por último, la visualización de estructuras web que mezclan páginas (existentes o nuevas) y palabras clave (que conducen tráfico o aún no) a menudo resulta en una cartografía compleja.

Pero más allá de su complejidad aparente, tal visualización puede ofrecer una hoja de ruta consistente para la creación y el despliegue de contenido con el fin de ganar más visitantes: cada página existente debe ser editada para dirigir su campo semántico correctamente; Cada nuevo campo semántico puede ser abordado a través de la creación de un contenido específico. Y todos deben estar unidos entre sí dentro de una organización significativa.


Representación de grafos de una estructura de sitio web y las conexiones entre palabras clave, tráfico y páginas web.

PDs: muchas gracias a Olivier Tassel por inspirar esta visualización ya Dimitri Tacita por hacerla posible.