Mostrando entradas con la etiqueta website. Mostrar todas las entradas
Mostrando entradas con la etiqueta website. Mostrar todas las entradas

sábado, 19 de mayo de 2018

Software: SocNetV trabaja muy bien

Revisión del software para ARS

Social Network Visualizer SocNetV-2.3



Fuente



Lo primero que uno encuentra en el SocNetV es sencillez. Pero no se engañen, es muy poderoso y versátil también. Se instala rápidamente y, para un usuario extendido de diversos paquetes de software, uno posa la mirada rápidamente en una opción de "Web Crawler" que intriga porque uno supone que promete extraer redes de sitios webs y sus hiperenlaces. Uno sospecha bien pero no todo es color de rosa. Volveremos a esto después.






Instalación

La última versión de SocNetV se puede descargar desde la página de descargas del proyecto.

Se distribuye tanto en código fuente como en paquetes binarios para distribuciones de Linux, instalador para Windows e imagen de disco para MacOS.

Instrucciones detalladas a continuación.


Windows

Para instalar y ejecutar SocNetV en Windows, simplemente descargue el último instalador de SocNetV para Windows desde la página de Descargas.

Haga doble clic en el ejecutable SocNetV-2.x-installer.exe. El programa se instalará automáticamente y creará un acceso directo en el menú Inicio.





Introducción a la interfaz de usuario

SocNetV tiene una interfaz gráfica de usuario (GUI) simple compuesta de:

  • El menú
  • La barra de herramientas
  • Los paneles
  • El lienzo
  • La barra de estado con mensajes útiles durante el tiempo de ejecución.

Ejemplo de ventana principal de SocNetV


El menú

En la parte superior de la ventana, está la barra de menú, llena de comandos y opciones, organizada en 6 menús:

  • Network: opciones para cargar y guardar una red, exportarla, crear redes aleatorias, etc
  • Edit: opciones para agregar / eliminar nodos y bordes, cambiar colores, filtrar bordes / aislar nodos, etc.
  • Analysis: le da herramientas para analizar la red activa (densidad, diámetro, centralidades, matriz de distancia, etc.).
  • Layout: opciones para aplicar métodos de diseño, es decir, reubicar todos los nodos según su centralidad.
  • Options: le permite mostrar / ocultar bordes, flechas de borde, activar / desactivar el antialiasing, etc.
  • Help


La barra de herramientas

Debajo del menú, la barra de herramientas te permite llevar a cabo una serie de acciones con un solo clic. Puede crear una red nueva, cargar un archivo de red, guardar la red actual e imprimir. También puede cambiar entre relaciones, agregar nuevas relaciones y mostrar mensajes de ayuda para las opciones del menú. En la barra de herramientas, hay botones para editar los nodos (agregar / eliminar / buscar / propiedades), los enlaces (agregar / eliminar / filtrar) y abrir la Configuración de la aplicación.

La parte principal de la ventana de la aplicación está ocupada por los paneles de la barra lateral (izquierda-derecha) y un "lienzo" virtual (lado derecho) donde aparecen los nodos y bordes de la red.

Los paneles

El panel a la izquierda de la ventana es el Panel de control. El panel de la derecha es el Panel de estadísticas.


Panel de control

El Panel de control se compone de 3 grupos de opciones:

  • Edit
  • Analyze
  • Visualize

En el grupo Edit, puede crear subgrafos a partir de nodos seleccionados, cambiar el modo Edge y simétrizar la red.

En el grupo Analyze, las opciones se clasifican en cinco submenús:

  • Matrix: visualización o diagrama de adyacencia, cálculo Laplaciano, Grado o Matriz de Cocitación.
  • Cohesion: distancias, geodésica, excentricidad, diámetro, así como conectividad, coeficiente de agrupamiento, caminatas y matriz de alcance.
  • Prominence: los índices de Centrality y Prestige que SocNetV admite.
  • Communities: camarillas de cómputo, censo de tríada, etc.
  • Equivalence: los métodos de equivalencia estructural compatibles con SocNetV, como el Análisis jerárquico de conglomerados, las diferencias de perfil del vínculo, etc.

Cuando selecciona una opción, SocNetV calcula lo que pidió y muestra el informe (en formato HTML) en una nueva ventana del navegador.


Ejemplo de informe SocNetV (en HTML): coeficientes de Pearson

En el grupo Visualize, hay menús y casillas de verificación para incrustar diseños de visualización en la red actual.

Con un solo clic, SocNetV puede visualizar la red de formas intuitivas. Hay dos categorías de diseño:

  • Por índices de prominencia. Aquí puede seleccionar una métrica de prominencia (es decir, entrelazamiento) y un tipo de disposición (es decir, circular). Presiona "Aplicar" y ¡voila!
  • Por modelos dinámicos (es decir, dirigido a la fuerza), como el modelo Eades.



Ventana principal anotada

El lienzo

El lienzo es el área principal de interacción. Usted puede:

  • señalar y hacer clic en un nodo / enlace para seleccionarlo, haga clic con el botón izquierdo para abrir el menú contextual
  • haga doble clic en el espacio vacío para agregar un nodo,

Haga clic con el botón central en un nodo para agregarle un borde dirigido.
El color de fondo inicial se establece en "blanco", pero puede cambiarlo desde Editar -> menú Colores.

A continuación, describimos cómo trabajar con SocNetV.



miércoles, 21 de febrero de 2018

Optimización de motores de búsquedas a través de redes de texto

Tutorial de SEO: visualización de palabras clave para la optimización del motor de búsqueda

Nodus Lab


La visualización de redes de texto de los resultados de búsqueda de Google puede ser muy útil para las comprobaciones de optimización de motores de búsqueda (SEO). Los fragmentos de texto que los motores de búsqueda muestran en sus resultados de búsqueda se consideran los más relevantes para la consulta de búsqueda. Por lo tanto, sería muy útil saber qué otras palabras contienen esos fragmentos, de modo que podamos crear contenido que sea más relevante tanto para Google como para la audiencia.

Demostraremos nuestro enfoque utilizando el ejemplo de este artículo sobre análisis de redes de texto y visualización de datos para la optimización de motores de búsqueda.

Paso 1: identificar las consultas de búsqueda relevantes: contexto de SEO

Queremos que este artículo sea leído por aquellos interesados ​​en SEO, análisis de redes de texto y visualización de datos. Entonces, el primer paso es comprender mejor lo que las personas realmente están buscando cuando buscan esos términos: el contexto. Una búsqueda rápida en la Herramienta de palabras clave de Google y la función de autosugestión de Google revela que las siguientes frases de búsqueda más destacadas se utilizan en este contexto:



en todos los casos, los usuarios están buscando
"Herramientas", "técnicas", "software" y "tutorial"

Por lo tanto, vemos que hay un gran interés para el software y los tutoriales relacionados con la optimización del motor de búsqueda, así como la visualización de datos.

Lo que significa que este artículo se escribirá específicamente para incluir esas palabras clave tanto en su título principal (etiquetas) como en todo el texto.


Paso 2: Análisis de red de texto de resultados de búsqueda de Google: visualización de datos de SEO

Ahora que sabemos lo que los usuarios realmente están buscando, necesitamos ver qué resultados de búsqueda ven realmente. Esto es importante por dos razones diferentes:

  1. Los fragmentos de resultados de búsqueda contienen el texto que los motores de búsqueda consideran relevante para la consulta de búsqueda. Por lo tanto, sabremos qué otras palabras clave debe incluir nuestro texto para aparecer en los resultados de búsqueda.
  2. Al utilizar la visualización de la red de texto, identificaremos las lagunas, o las áreas vacías entre los grupos de palabras clave que tienden a coincidir en los fragmentos de texto. Estas lagunas nos mostrarán lo que falta en los resultados de búsqueda, de modo que podamos incluir esas partes faltantes en nuestro texto y asegurarnos de que aparezca en la parte superior de los resultados de búsqueda de Google.

Usaremos la herramienta de visualización de red de texto InfraNodus para visualizar fragmentos de texto de diferentes resultados de búsqueda. Este instrumento nos mostrará un gráfico de las palabras que tienden a coincidir una al lado de la otra en los mismos fragmentos (de las primeras 5 páginas de resultados). También nos mostrará las palabras clave más relevantes que se utilizan con la consulta de búsqueda que estamos estudiando.

Usando la función "Importar" de InfraNodus creamos una visualización de red de texto de los siguientes términos de búsqueda:

"SEO de optimización de motores de búsqueda"



Los propios términos de búsqueda se excluyen del gráfico, por lo que podemos ver el contexto real en el que aparecen en los resultados de búsqueda.

Hay tres clústeres prominentes en este gráfico, lo que significa que esas palabras tienden a coincidir más a menudo juntas:

1. "mejorar", "visibilidad", "sitio web", "ranking"



2. "optimizar", "google", "rango"



3. "servicio", "marketing", "agencia"



Esto demuestra que los resultados de búsqueda de Google básicamente tienen 3 temas principales: mejorar la visibilidad de un sitio web, optimizar el rango del sitio web de Google y también propuestas de / para agencias de marketing.

Lo que significa que si queremos encajar bien en esa constelación con nuestro artículo, tenemos que hacer dos cosas.

Primero, debemos incluir todos esos términos en este artículo (especialmente en,, y otras etiquetas). Hicimos eso de manera automática porque hemos estado escribiendo sobre las palabras anteriores.

En segundo lugar, el gráfico muestra lo que los usuarios realmente encuentran. Necesitamos proponerles algo original, algo que aún no encuentran. Esto se puede hacer cerrando las brechas en el gráfico entre los clústeres de términos de búsqueda que identificamos.

Puede jugar con el gráfico usando la interfaz a continuación. Haga clic en el icono del gráfico de la esquina superior derecha para eliminar los fragmentos de texto, haga clic en los nodos del gráfico para ver en qué resultados de búsqueda aparecen y cómo se relacionan entre sí.

Paso 3: mejore la visibilidad y el ranking de Google de la página de su sitio web - escriba algo original

Es importante notar aquí que Google todavía tiene en cuenta cuántas páginas externas se vinculan a su página y esto afectará la clasificación. Sin embargo, las palabras clave, especialmente para los sitios web que ya tienen un alto rango, son muy importantes.

Ahora demostraremos cómo puede mejorar la visibilidad y clasificación de esta página

  1. cerrar las brechas entre los diferentes clústeres de palabras clave que aparecen en el grafo y también
  2. proponer algo nuevo (que nuestros competidores en los resultados de búsqueda no escriben).

El primer punto ya está algo completo porque este artículo contiene todos los posibles conglomerados de palabras (contextos) que ya aparecen en los resultados de búsqueda. No nos arriesgaremos a repetirlos una vez más para evitar penalizaciones por spam de Google.

En cambio, puede ser interesante mencionar algunas veces más algunos términos que los usuarios están buscando junto con "seo" y "optimización de motores de búsqueda", pero que realmente no aparecen en los resultados de búsqueda. Estos serán mencionados más adelante.

El segundo punto también se cumple por el hecho de que estamos escribiendo sobre un nuevo tema: la visualización de la red de texto de los resultados de búsqueda de Google, que no encontrará en ningún otro lado.

Es importante tener esto en cuenta cuando se crean textos optimizados para SEO: cerrar las brechas entre diferentes temas y agregar nuevos aumentará su clasificación en los motores de búsqueda.

Paso 4: InfraNodus como herramienta SEO - Software para visualización de red de texto

Hemos mostrado más arriba cómo la herramienta de visualización de red de texto InfraNodus se puede utilizar para los resultados de búsqueda de Google.

Cree una cuenta (obtenga un código de invitación de nosotros), haga clic en "Importar", elija "Búsqueda de Google", escriba su consulta de búsqueda, elija el nombre para el Contexto (la categoría / lista donde se guardan los resultados), elija el número de los fragmentos de resultados de búsqueda que desea ver en el gráfico (preferimos 50), haga clic en "Guardar" y visualice el gráfico.



También puede usar el análisis de red de texto para sus textos, para que pueda ver qué tan relevantes son para las consultas de búsqueda y los resultados de búsqueda en su tema. Para hacer eso, simplemente copie y pegue el texto en InfraNodus (o use la función de importación) y se visualizará como una red:



Si excluimos los términos como "búsqueda", "seo", "optimización" que deben figurar en este texto, vemos que las palabras clave como "resultado", "google" y "palabra clave" son las más destacadas. Tal vez los dos últimos están bien, pero el primero, "resultado", no fue prominente en las consultas de búsqueda y en la búsqueda ... err ... respuestas. Por lo tanto, tendría sentido revisar este artículo y eliminar esa palabra clave, por lo que no es tan prominente.

Paso 5: Salga de la burbuja del filtro: mejore el discurso en línea

Demostramos más arriba cómo se puede usar el análisis de red de texto para optimizar las páginas de sitios web para la búsqueda. El enfoque no es nuevo, sin embargo, esperamos que las herramientas y técnicas que proponemos sean útiles para cualquier persona interesada en SEO y visualización de datos.

Una cosa interesante de agregar es que la mayoría de las páginas en la web en realidad se crean con motores de búsqueda en mente, lo que significa que la mayoría de las veces vemos lo que esperamos encontrar. Por lo tanto, si le interesa darles a sus usuarios un poco de valor agregado y ayudarlos a salir de la burbuja de filtro de los motores de búsqueda, intente identificar los temas que serían novedosos para el discurso ya existente disponible en línea. Los gráficos de red de texto pueden ser muy útiles para eso y ofrecen una clara metáfora visual para la interacción digital.





PD
Después de dos días, este artículo ha estado en línea:

jueves, 7 de diciembre de 2017

Análisis de datos y sitios para funciones de SEO

SEO: cómo los datos pueden revelar errores y oportunidades ...
Virgile Juhan | JDN





La explotación de datos para mejorar el SEO fue uno de los principales temas de SEO Camp'us. Al final del día, dos retroalimentaciones instructivas, incluida la de Priceminister..

La explosión de datos también concierne a los SEO, y la explotación de este depósito de información está comenzando a madurar y tiene un fuerte impacto en la gestión del SEO. Esta es una de las lecciones que se pueden aprender de SEO Camp'us, el evento estrella de SearchBridge el 9 y 10 de marzo de 2017, del cual JDN fue socio.

"Los datos pueden provenir de Google y sus herramientas, como su webmaster. Pero también hay herramientas de terceros, tales Botify, Yooda o Majestic que puede proporcionar aún más datos. Cruzarlos a continuación, utilizando todos estos datos se utiliza para salir de una lógica empírica para la construcción de las estrategias impulsadas por datos-, "observó Olivier Tassel, consultor de NetBooster en su precisión en base a este tema de la conferencia (" empíricamente SEO a SEO de datos centrada en cómo su estrategia corporativa en 2017? "). Este especialista también señala que todos estos datos pueden ser monitorizados con soluciones personalizables de cuadros de mando muy flexibles y potentes, además de código abierto, como Superserie, desarrollado por Airbnb. Arriba: hábilmente explotados todos estos datos se pueden alimentar los sistemas de aprendizaje automático, y por lo tanto abierto a la senda predictiva.

Un DataViz para la detección de un fallo de funcionamiento

Para tomar un ejemplo la primera base, los datos de una herramienta útil SEO pueden ser explotadas por una solución DataViz para extraer rápidamente la atención a un problema importante. El caso fue presentado por Simon Georges, consultor de Makina Corpus. Este experto SEO Drupal y utilizó por primera vez el rastreo Screaming Frog herramienta para navegar por un sitio como Google haría. Gritando rana está en la lista que incluye las direcciones URL visitadas dentro de este sitio web. entonces esta lista se ha subido a la herramienta DataViz Gephi de código abierto. Y luego, sorpresa: si el sitio se supone que tiene tres secciones, una cuarta apareció muy claramente en el gráfico. la respuesta del propietario del sitio: "se ve como un tumor". Y eso es todo, de hecho.


DataViz realizado por Gephi que muestra 4 colores correspondientes a las cuatro partes de un sitio ... que se supone que hace que el recuento 3! © Simon Georges

Lo que pasa es que el sitio de la casa incluye un calendario de eventos. En esta agenda, no eran tan absolutamente clásico, un enlace "próximo mes" y "mes anterior". El rastreador se vio envuelto en un sinfín de estos enlaces. Volvió décadas atrás, y lo mismo antes. Esta es la cuarta sección del sitio, que aparece muy visual (púrpura aquí-contra) en Gephi, y por lo tanto en realidad corresponde a ... un calendario. "Luego, cuando se estudió el verdadero rastreo robot de Google, se confirmó que estaba tomando exactamente el mismo camino que el robot Screaming Frog. Por lo tanto, Google desperdiciando su tiempo para rastrear páginas sin ningún interés, mientras que para otras páginas con un gran potencial de SEO fueron descuidados o no del todo exploradas", lo que lleva Simon Georges.

SEO predictivo en PriceMinister

También hay ejemplos mucho más avanzadas en el campo de la minería de datos, predictivo y tendiendo a. SEO Priceminister Cecile Beroni, ha compartido su trabajo en el campo de datos grandes. Su entorno es uno de los sitios con alto volumen, un sitio con no menos de 24 millones de páginas, incluyendo 17 millones indexadas en Google. Por supuesto, SEO es altamente estratégica, con 30 a 40% de las visitas SEO (excluyendo consultas decir "marca", navegación).


Cécile Beroni, Priceminister SEO para SEO Camp'us © 2017 JDN

"Queríamos utilizar los primeros datos disponibles para mejorar la indexación de Google. El propósito era específicamente para aumentar el número de páginas indexadas o mejorar la rotación de URL rastreadas," resume SEO. Para este primer proyecto, el rastreo de Google es estudiado en profundidad, y cambios en el sitio para ayudar a guiar robots de Google ayudaron mucho mejor predecir qué páginas serán cubiertos. Un algoritmo de casa, confidencial, se ha desarrollado.

"Ahora sabemos que el 80% de las URL que Google rastree, mientras que en el principio era el 61%," dice SEO. "Al final, el número de páginas que se arrastró en realidad no ha aumentado. Especialmente la rotación viajó URL que ha sido mejorado." PriceMinister puede entonces "empujar" y almacenar millones de URL estratégicas - una cifra que tiende a limitar su caché solución sin barniz. "Anteriormente, Google podría obtener más de seis meses para recorrer todo el catálogo, ahora Google puede tener acceso a un mayor número de direcciones URL en un tiempo bastante corto. Este fue nuestro principio", recuerda Cécile Béroni.

Luego fue el blanco de una mejor predicción de palabras clave estratégicas "las principales palabras clave",. Para este proyecto, el sitio era capaz de confiar en un equipo interno (SEO, inteligencia de negocios, grandes volúmenes de datos), sino también en un proveedor de servicios externo, Authoritas, que proporciona gran cantidad de datos. Entre ellos: las palabras clave sobre la que se colocan Priceminister con su volumen de búsquedas y competidores que también están en sus resultados de búsqueda, entre otros. "Era necesario poner de relieve las oportunidades", dijo Seo. Ellos tomaron la forma de una lista bastante cruda de 2,4 millones de palabras clave que podrían apuntar sitio de comercio electrónico.

"A continuación, tuvo que trabajar en la lista, respondiendo a varias preguntas: ¿Tenemos el producto afectado por palabra clave ¿Cuál es la competencia para esa palabra clave, la presencia de Google Shopping también puede dar pistas interesantes de este tema ", detalla el empleado PriceMinister. Una vez que estos filtros producen, 1,4 millones de nuevas páginas de destino fueron creados o mejorados. El resultado anunciado por el sitio del comerciante es espectacular: 40% más de visibilidad en los resultados de reensamblaje de Google, según la herramienta de Searchmetrics.

viernes, 13 de mayo de 2016

Marketing: Usando Gephi para tareas de SEO


SEO y sitio web para ver: ir más allá con Gephi
Simon Georges | Makina Corpus


Podemos diagnosticar muchos problemas de SEO durante la visualización de una página web con Gephi, siempre que sean metódica.

La visualización es ahora una necesidad para un SEO (véase, por ejemplo este artículo) y esta es una razón para el aumento de las herramientas de Saas reservadas. Usando Gephi (OSS de visualización de redes) es especialmente frecuente para múltiples usos, incluyendo la visualización y optimización de la red interna.

Sin embargo, lo que hace que la visualización término SEO era un poco revolucionado recientemente por Cocon. Esta su visión circular.


Motivado por la herramienta durante la presentación del video SearchCast Laurent Bourrelly, quería tratar de replicar algunas de las visualizaciones disponibles en esta herramienta sólo usando Gephi.
Atención en el resto del artículo, las fórmulas se dan para Libre Office (viva el software libre!). Por lo tanto, hay que adaptarse a Excel, incluyendo el reemplazo de "Data.A1" con "datos! A1".

La base: los enlaces internos y PageRank

Esta parte no será una sorpresa para quienes están familiarizados con Gephi que pueden ir directamente a la URL de vista u orugas Vista: presento en efecto el mismo que el conjunto de tutoriales sobre el uso Gephi para SEO: visualización de los enlaces internos del sitio.

En primer lugar vamos a preparar los datos que necesitaremos: Así que empieza explorando el sitio usando Screaming Frog. Vamos a copiar el rastreo completo de los datos en una hoja de cálculo, que llamaremos ficha "Datos". A continuación, exportar los enlaces internos en una pestaña segundo "Enlaces":




  • Primer paso: calcular el PageRank y, posiblemente, la modularidad, a partir de los enlaces internos. Para esto :
    • No tener en exportación de enlaces internos que href líneas de tipo y sólo las columnas que contienen URLs (origen y destino), y cambiar el nombre de la "Fuente" y "destino";
    • Exportar hoja de CSV.
    • Gephi abierta, crear un nuevo proyecto, vaya a la pestaña "Laboratorio de Datos" e importar el archivo recién creado (por lo general, se detecta sólo que son enlaces, y todas las opciones son correctas).
    • A continuación, puede cambiar a la primera pestaña ( "Información general"). A continuación, ver una visualización de su sitio en la forma de un gráfico no organizada ninguna:




  • Antes de ver, vamos a utilizar las funciones de estadísticas Gephi:



Aquí vamos a iniciar directamente el cálculo de los 2 algoritmos que nos va a interesar: Modularidad y PageRank.



El PageRank determina la probabilidad de llegar en la página independientemente de la página en su sitio donde se llega, vamos a decir que es importante que su sitio proporciona una página (atención aquí, sólo hablamos de enlaces , la popularidad interno y externo no se tiene en cuenta).

La modularidad es un concepto puramente "red" no se utiliza en SEO: la modularidad rompe una red en subredes. Si todo va bien, esto hará que los valores de "conglomerados" de páginas de su sitio.


  • Ahora vamos a utilizar estos cálculos para mejorar la visualización:




    • El primer icono al lado de "nodos" y "bordes" representa el color: haga clic en "Atributos", elegir el "modularidad" atributo (que no está presente si no se ha iniciado el cálculo), y haga clic "Aplicar": su visualización debe iluminar.
    • Al hacer clic en el icono al lado de usted puede elegir la opción "PageRank", como atributo de tamaño. Elegir un rango de tamaño que se adapte a usted (yo uso 30 a 150, por ejemplo), y haga clic en "Aplicar" página debe empezar a diferenciarse.
  • A continuación, puede jugar con algoritmos de organización espacial para representar mejor su sitio.



No conseguimos nada satisfactoria: surge ningún clúster, hay demasiados enlaces internos en el sitio para analizar cualquier cosa, desde este punto de vista (pero contras, ya podemos pensar que abogará una racionalización de los enlaces internos).

Ahora vamos a tratar las visualizaciones más específicos, con la esperanza de identificar otros problemas del sitio.

La vista "URL"

Cocon.se ofrece una vista "URL", que muestra una vista en la que el padre es el URL de la página principal. A partir de los datos que ha copiado del ScreamingFrog, es bastante fácil de encontrar al padre de un URL de la página: crear una nueva hoja. En la segunda columna, utilice la fórmula

= Data.A1

en la celda A1 y, a continuación, copiar toda la columna. En la primera columna de esta hoja, a continuación, utilizar la fórmula

= LEFT (B1; FIND ( "/ [^ /] * $", B1) -1)

Tendrá una columna rellena con la url "padre" de la página. Trate de mantener sólo los enlaces a páginas web (archivos de extraer), que será más eficaz en términos de visualización.

Tenga en cuenta que algunos sistemas, tendrá que añadir final "/" porque las direcciones URL de su sitio contienen (que alcanzó los límites de la automatización, y no siempre se ajustará algunas URL).

Si se utiliza la hoja de trabajo que ha creado como fuente de "enlaces" en Gephi (después de eliminar los enlaces importados en el párrafo anterior, pero manteniendo los nodos para mantenerlos involucrados y colores), se obtiene una representación las direcciones URL de la estructura del sitio, una especie "humana" de la visión de cómo el sitio fue diseñado.



En este ejemplo, no es completamente grupos separados: esto es porque en algunos casos no existiera la página "padre". Aquí está un sitio Drupal con el módulo de reescritura de URL (Pathauto) en su configuración por defecto, todas las URL de las páginas están en "/ content / [titulo-de-la-página]", y no hay página "/ contenido" en el sitio (el bloque en la parte superior izquierda). Este problema es, por supuesto manchado directamente de los datos de rastreo, pero permite la visualización de ilustrar de manera efectiva al cliente.

El bloque inferior de la derecha representa las páginas de "etiquetas", la estructura no se integra bien con el resto de la página web o bien (sin página "/ tag", mientras que todas estas URL son "/ tag / [tag-name]." se podría proponer una URL reescritura, tal vez podría proporcionar ventajosamente una simple supresión de estas páginas (excepto tal vez de los que se PageRank interna es significativa, probablemente merece ser convertido en la sección "real" de la página).

Finalmente, la última observación, todos los colores se mezclan en este punto de vista, lo que indica que los enlaces internos no tienen nada que ver con la estructura de URL, por lo que no hay silos de la organización.

La vista "Crawler"

Cocon.se también ofrece una visión "orugas", destacando el primer enlace que llevó al descubrimiento de una página. Para simular este punto de vista con Gephi, vamos a reanudar nuestro fichero de identificación de los enlaces internos, pero esta vez vamos a cruzar los datos con el "nivel" de la columna Screaming Frog datos que muestran el número de clics necesarios para acceder a la página.

Al lado de cada columna "Fuente" y "destino", utilizo la fórmula

= BUSCARV (A2; Datos $ A $ 2. Datos $ Z $ 1000; 26; 0).

buscará el contenido de la celda A2 de mi hoja actual en la primera columna indica el área I (A2 -> Z1000), de manera que la columna A es que las direcciones URL, y una vez que el valor encontrado, me conviene devolver el valor de la columna 26 columnas a la derecha (columna Z aquí) la columna del "nivel": entonces consigo el nivel de profundidad de cada una de las páginas interiores que participan en mis prisiones.

Última operación, vamos a filtrar los enlaces para mantener sólo aquellos con "nivel" de la fuente es directamente debajo del punto de destino (mediante la creación de una fórmula que contiene colone

= (B2 + 1 = D2)

y mantener sólo las filas cuya célula es "TRUE").

más vamos a borrar la tabla de enlaces Gephi a utilizar estos nuevos datos como "mesa de enlace", y jugar un poco con los algoritmos espaciales, obtenemos una representación completamente diferente:



Aquí, dos cosas son rápidamente destacaron:

  • La mayoría de las páginas se descubren a través de la página de mapa del sitio (el gran redondel central verde en el centro del bloque);
  • Muchas páginas no están ligados: son páginas descubrimientos a través de las etiquetas "canónicos" o páginas cuyas URL contener parámetros que he suprimido para ejecutar diferentes fórmulas). Cabe aquí probablemente adaptar nuestras fórmulas para dar cuenta de estos casos. Sin embargo, se identificaron una fuente potencial de problemas: las páginas no canónicos directamente o muchos de paginación (el parámetro suprimirse en relación con una paginación) que se rastree e indexe.

En caso de que no se elimina el parámetro de búsqueda, es también por este punto de vista se puede identificar canales de búsqueda (como largas cadenas de nodos), o "trampas" para el robot (generaciones muchas de las páginas dinámicas que no devuelven ningún contenido (incluso la identificación gráfica que las cadenas de paginación)).

Una vez más, esto también es identificable en la lectura de los datos de rastreo, pero no necesariamente como de inmediato, y se puede utilizar para ilustrar la situación de su cliente.

Conclusión

Se lograron los objetivos iniciales: podemos identificar los problemas directamente de visualizaciones, e ilustrar a nuestros clientes para entender mejor.

Está claro que contra Cocon.Se pone mucho más las cosas hacia adelante, especialmente para todos los problemas de "fuga" capullos semánticas: aquí podemos obtener un resultado que se acerca la observación de los colores que intervienen en cada grupo, porque las clases modulares deben corresponder normalmente a los capullos.

Dicho esto, los resultados obtenidos por nuestro método nos encontramos hoy en día, aunque los técnicos de agradecimiento Cocon.Se por empujarme a mano Gephi visualización de la pregunta fundamental.

Si usted tiene otras ideas de análisis o visualización, por favor hágamelo saber!

miércoles, 26 de junio de 2013

Visualización: Nube de palabras de la conversación política estadounidense


Campaign visualizations: the a moving picture of the national conversation

I've been working with postdoctoral fellow of mine at Northeastern and IQSS, Yu-ru Lin, on visualizations that capture campaign 2010. Over the next couple of days we will be posting some of the visualizations on the blog. The first visualization is a dynamic word cloud based on daily snapshots of all Democratic and Republican campaign websites in October. So, for example, the words for the home pages of all Democratic candidates for the House were pooled together, and for each day, a word cloud was created, where words were sized based on their frequency (certain functional words were omitted, and word counts were normalized so no one website could dominate the count). This process was repeated for Republicans in the House, and for both parties in Senate and gubernatorial races. Below we show the dynamics for the Republican and Democratic websites. For the full set of 6 graphics, with interactivity, we have set up a dedicated website.
A brief perusal suggests some interesting contrasts. You can see jobs in both websites, but more prominently for Democrats, and tax and spending are a lot more visible for Republicans. America is big for Republicans, and education for Democrats. Democrats talk more about veterans and security, and Republicans about business. Republicans use "Republican" a lot, and Democrats "Democrat" very little. Notably missing are: Iraq, Afghanistan, health, and Obama. (For health, there is an interesting contrast with Senate campaign websites, where both parties feature health very prominently.)ç