domingo, 9 de abril de 2017

Interpretando la evolución de precios a través de una red de correlaciones

Características de la estructura de correlación de los índices de precios
Xiangyun Gao, Haizhong An y Weiqiong Zhong


PLoS One. 2013; 8(4): e61091.
Published online 2013 Apr 8. doi: 10.1371/journal.pone.0061091

Resumen
¿Cuáles son las características de la estructura de correlación de los índices de precios? Para responder a esta pregunta, se seleccionaron como datos de muestra 5 tipos de índices de precios, incluyendo 195 índices de precios específicos de 2003 a 2011. Para construir una red ponderada de índices de precios cada índice de precios está representado por un vértice, y una correlación positiva entre dos índices de precios está representada por una arista. Estudiamos las características de la estructura de red ponderada aplicando la teoría económica al análisis de parámetros de red complejos. Se encontró que la frecuencia de los índices de precios sigue una distribución normal contando los grados ponderados de los nodos e identificamos los índices de precios que tienen un impacto importante en la estructura de la red. Encontramos grupos pequeños en la red ponderada por los métodos de k-core y k-plex. Descubrimos huecos de estructura en la red calculando la jerarquía de los nodos. Finalmente, encontramos que la red ponderada de índices de precios tiene un efecto de pequeño mundo calculando el camino más corto. Estos resultados proporcionan una base científica para las políticas de control macroeconómico.

Introducción

Los índices de precios son indicadores importantes para medir la inflación y el desarrollo económico. El gobierno influye en los precios de los productos básicos por una variedad de políticas reguladoras para mantener la estabilidad del mercado. Los índices de precios incluyen el índice de precios al consumidor (IPC) de los residentes, el índice de precios al productor (IPP), el índice de precios al por menor (RPI), el índice de precios de la producción agrícola y del material de producción agrícola y las materias primas, Índice de precios de compra (RFPPI) [1] - [9]. Estos 5 tipos de índices de precios se dividen en muchos índices de precios específicos. Por ejemplo, en China, el IPC se clasifica en ocho categorías: alimentos, tabaco y licor, ropa, equipo y servicios domésticos, productos de salud y personales, transporte y comunicaciones, entretenimiento y productos educativos y servicios y vivienda. Estos 5 tipos de índices de precios se obtienen calculando índices de precios específicos con pesos. Por lo tanto, en comparación con el IPC, PPI, RPI, API y RFPPI, los índices de precios específicos reflejan más directamente los cambios en los precios de los productos básicos. Por esta razón, estudiamos índices de precios específicos en lugar de estos 5 tipos de índices de precios.

Hay relaciones entre los índices de precios que se han encontrado en la investigación anterior. Modelos y métodos de econometría se aplican para probar que hay relaciones causales [4], relaciones de cointegración [5], relaciones interactivas [10] y relaciones de transmisión [11] - [13] entre los 5 índices de precios. Estas relaciones se basan en la correlación entre los índices de precios [14]. Sin embargo, hay muchos índices de precios específicos para cada tipo, entre los que las relaciones desconcertantes forman una red complicada [15] - [17]. En esta red de índices de precios, ¿cuáles índices de precios tienen un mayor impacto? ¿Cómo se afectan entre sí? Cuando uno de ellos cambia, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? ¿Hasta dónde puede llegar el proceso de transmisión y cuál es el camino de transmisión? Debido a que los modelos econométricos tradicionales no pueden incluir tantos índices de precios, si lo hacemos, el modelo será demasiado difícil de usar [14]. Para responder a las 4 preguntas anteriores, primero debemos averiguar las características de la estructura de relación entre los índices de precios. La teoría de la red compleja puede resolver eficazmente los problemas relativos a las características de la estructura de la relación. El concepto central de teoría de red compleja es ver la relación entre las variables en el sistema real como una red compleja, describir la relación entre las variables en el sistema complejo real en forma de red y obtener una mejor comprensión de Su naturaleza analizando la estructura del sistema [18] - [20]. Esta teoría proporciona un enfoque adecuado para analizar cuantitativamente el comportamiento de las redes complejas en el sistema económico, como el fenómeno del mundo pequeño [16], [21]. La diversidad de las relaciones de los individuos está fuertemente correlacionada con el desarrollo económico de las comunidades [22]. Los investigadores han analizado las relaciones de los individuos entre los índices bursátiles basados ​​en la red de correlación. Descubrieron las características de la volatilidad y las existencias dominantes en los índices bursátiles [23], [24], [25]. En el sistema económico, cientos de índices de precios interactúan y se afectan entre sí, y la estructura de correlación forma una red compleja. Así, podemos analizar la estructura de correlación por la teoría de la red compleja.

Materiales y métodos

Materiales

En el presente estudio se recopilaron datos sobre índices de precios específicos de 2003 a 2011 del país en desarrollo China (Anuario Estadístico de China, 2003-2011). Se utilizaron los datos de los cinco tipos de índices de precios siguientes: IPC, RPI, API, PPI y RFPPI. Cada índice de precios se divide en índices de precios específicos, con un total de 195 índices. Los principales elementos de los diversos tipos de índices de precios se muestran en el cuadro 1, por ejemplo, el índice de precios de los alimentos incluye un índice de precios de los alimentos, un índice de precios del petróleo, un índice de precios de carne y aves, Índices de precios.

Tabla 1

Principales elementos de los índices de precios.
Tipo de índice de preciosElementos principales
Índice de Precios al Consumidor (CPI)Alimentos, Tabaco, Licor y Artículos, Vestuario, Instalaciones Domésticas, Artículos y Servicios, Cuidado de la Salud y Artículos Personales, Transporte y Comunicación, Recreación, Educación y Cultura Artículos, Residencia, et al.
Índice de precios al por menor (RPI)Bebidas, Tabaco y Licor, Ropa, Calzado y Sombreros, Textiles, Electrodomésticos, Equipo de Música y Video, Instrumentos Musicales y de Oficina, Artículos de Uso Diario, Artículos de Deportes y Recreación, Plata y Joyería, Medicina Tradicional China y Occidental y Artículos de Salud, Libros, Periódicos, Revistas y Publicaciones Electrónicas, Combustibles, Materiales de Construcción y Ferretería, et al.
Índice de precios al productor de bienes manufacturados (PPI)Industria metalúrgica, industria del petróleo, electrodomésticos, equipo de música y video, industria de fabricación de máquinas, industria de materiales de construcción, industria maderera, industria alimentaria, industria textil, industria de la confección, industria del cuero, industria del papel, Artículos Educativos y Artesanales, et al.
Índice de Precios de Productos Agrícolas y Índice de Precios de Material Productivo Agrícola (API)Fertilizantes Químicos, Fertilizantes Químicos, Plaguicidas y sus Aparatos, Petróleo para Maquinaria Agrícola, Otros Productos de la Ganadería, Productos de la Pesca, Productos Farmacéuticos Medios de Producción Agrícola, Servicio de Producción Agrícola, et al.
Índice de precios de compra de materias primas, combustible y energía (RFPPI)Combustible y energía, Metales ferrosos, Metales no ferrosos, Materias primas químicas, Electrodomésticos, Equipo de música y video, Materiales de construcción, Productos agrícolas, Materiales textiles, et al.

Redes ponderadas de índices de precios

Para estudiar las características de la estructura de correlación de índices de precios específicos, primero debemos establecer la red ponderada por el índice de precios (PIWN) por la teoría de redes complejas. Una red es una colección de nodos y enlaces, N = (V, E). Representamos cada índice de precios como un vértice, y representamos la relación entre dos índices de precios como un borde en la red; Por lo tanto, volvimos el estudio de la estructura de correlación de los índices de precios en un estudio de una compleja red de correlaciones de precios.

El conjunto de vértices V en la red compleja de correlaciones de índices de precios se expresa como

equation image      (1)

Donde vi representa el i-ésimo índice de precios.

El conjunto de nodos E en la red compleja de correlaciones de índices de precios se expresa como

equation image       (2)

Donde e(i, j) representa la relación entre el i-ésimo índice de precios y el j-ésimo índice de precios.

En el curso de este estudio, se intentó definir y cuantificar la relevancia de la red. Cuantificamos el enla ce e(i, j)  y usamos el coeficiente de correlación rij para representar el grado de correlación entre el i-ésimo índice de precios y el j-ésimo índice de precios. El coeficiente de correlación, también conocido como el coeficiente de correlación de Pearson, es un indicador que mide el grado de correlación entre las tendencias cambiantes de las variables, con un rango de [-1,1]. Cuanto mayor sea el valor absoluto del coeficiente de correlación, mayor será el grado de correlación entre las variables.

equation image          (3)

Donde im es el valor de la serie temporal del i-ésimo índice de precios, un archivo externo que An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e004.jpg es el valor promedio de la serie temporal del i-ésimo índice de precios,  jes el valor de la serie temporal del índice de precios j-th, An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e005.jpg es el valor medio de la serie temporal del índice de precios j-ésimo, y s es el número de elementos de la serie de índices de precios.

Así, la matriz de coeficientes de correlación del índice de precios R se forma como

equation image           (4)

Si todos los coeficientes de correlación se reflejan en la red con pesos, entonces la red está completamente conectada y no está disponible para el análisis de topología. Además, para establecer con mayor exactitud la relación y la estructura entre los índices de precios, debemos eliminar las correlaciones débiles y las no correlaciones estableciendo un umbral. El PIWN es una red basada en umbrales, y como todas las redes basadas en umbral, es muy sensible al valor del umbral. Los bordes cuyo peso sea menor que el valor umbral pueden omitirse [23], [24]. A medida que el umbral aumenta, la red se vuelve más informativa sobre la estructura de correlación parcial del sistema, pero la selección de correlación parcial podría verse afectada por la incertidumbre estadística. No se supone que el valor de umbral sea demasiado bajo. En las redes económicas, el umbral suele establecerse por encima de 0,7 [23], [25].

Las propiedades topológicas y métricas del PIWN dependen fuertemente del valor del coeficiente de correlación r. Para seleccionar un valor adecuado para r, iterativamente elegir diferentes valores de este coeficiente de correlación y calcular la suma de los pesos de todos los bordes en el PIWN resultante. Representamos esta cantidad como E (r).

Para r = 0,7, tenemos E (0,7) = 3734. Presentamos la fracción An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e007.jpg como una función de r. Además, realizamos un análisis similar para el tamaño del componente conectado más grande de la red, dependiendo del valor de r. Se indica el número total de vértices en la mayor componente conectada de la PIWN para un r dado con V (r). En la figura 1, mostramos la cantidad An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e008.jpg, donde r = 0,82 es el punto de ruptura. Por lo tanto, elegimos 0,82 como nuestro valor umbral para el tamaño de un gran componente conectado y no trivial topológica y métrica propiedades de la red resultante índice de precios [24]. Si el coeficiente de correlación entre dos índices de precios no es inferior a 0,82, entonces hay una ventaja entre ellos. El valor del coeficiente de correlación entre dos índices de precios se establece como el peso del borde. Así, construimos un modelo de estructura de red compleja y ponderada de fuertes correlaciones de índices de precios, como se muestra en la Figura 2.

Dos medidas de conectividad PIWN en función del parámetro r.
El valor r = 0,82 es la medida utilizada en este trabajo.

Red compleja de correlaciones fuertes de índices de precios.
Los 4 nodos azules son nodos aislados que no tienen una fuerte correlación con otros nodos.





Resultados

Las 4 preguntas sobre el PIWN mencionadas anteriormente son manejadas por el método de análisis paramétrico de red compleja, incluyendo el grado ponderado, k-core, k-plex, la jerarquía de los agujeros estructurales y el camino más corto.

Índices de precios clave

¿Qué índices de precios tienen un mayor impacto? Para responder a esta pregunta, debemos encontrar los índices clave de precios en el PIWN. Los índices clave de precios son los indicadores que tienen un impacto muy alto en el PIWN; Cuanto mayor sea el grado ponderado de un nodo, más amplio será su impacto. En los sistemas económicos, cuanto más amplio es el impacto de un índice, más importante es en la red. Por lo tanto, podemos encontrar índices clave de precios en el PIWN calculando el grado ponderado de los nodos. El grado ponderado de un nodo es la suma de todos los valores ponderados de sus bordes. Esta suma no sólo incluye el número de índices de precios relacionados con el nodo sino que también considera el grado de sus correlaciones. El grado ponderado WDi de un índice de precios (vértice) i se define como

equation image                       (5)

Donde r es el valor del coeficiente de correlación entre los vértices i y los vértices j. En la figura 2, cuanto mayor sea el valor, mayor será el nodo en la red.

Nuestro experimento incluye 191 nodos y 1.795 enlaces en el PIWN. Se calculó el grado ponderado de los 191 nodos, se reflejó a nivel macro, y se encontró que, en toda la estructura de la red de correlación de índices de precios, el grado de influencia del PPI es el más amplio. Así, a nivel macro, PPI es el índice de precios clave. El IPP se refiere al índice de precios al productor en China. En estudios sobre la relación de transmisión de precios en la cadena industrial, muchos estudiosos creen que el PPI puede usarse para representar el nivel de precios en la cadena de transmisión de la industria. En segundo lugar, el grado de influencia del IPC es del 24%, y este índice puede utilizarse en lugar del precio descendente en la cadena de transmisión de la industria. Los resultados muestran que el IBP tiene un mayor impacto en la tasa de inflación que el IPC. Los resultados de otros estudios también apoyan esta conclusión. Utilizando el análisis empírico, el mecanismo de transmisión del precio de producción al precio al consumidor es más importante que el mecanismo de transmisión del precio al consumidor al precio de producción [11]. En general, las fluctuaciones del nivel general de precios aparecen en primer lugar en la zona de producción y, a partir de ahí, se extienden por las cadenas industriales hasta las industrias posteriores y, finalmente, a los bienes de consumo [12]. Por lo tanto, para controlar la tasa de inflación en China, el primero de la cadena industrial se puede considerar en primer lugar. Los resultados también muestran que el grado de influencia de la API es hasta un 15%. China es un país agrícola; Por lo tanto, no debe subestimarse el impacto del nivel de precios de la producción agrícola y su impacto en otras industrias. Especialmente en los países en desarrollo, el aumento de los costos básicos de vida de las personas a menudo tiene una serie de consecuencias, como la reciente "inflación porcina" en China. Tres tipos de índices de precios, el IPP, el IPC y el API, cubren el 80% del grado de influencia. Las estadísticas de la correlación entre los índices de precios macro se muestran en la Tabla 2, y la proporción de cada índice se muestra en la Figura 3.

Proporciones de índices de precios macro con relaciones de correlación.





Tabla 2

Grado ponderado de los índice de precios macro.
Tipo de índide de preciosGrado ponderado
PPI1286.29
CPI787.21
API496.98
RPI463.55
RFPPI182.89
En la Tabla S1, proporcionamos todos los valores del grado ponderado del índice de precios. Hay sólo un pequeño número de índices de precios clave en el PIWN. Sólo 3 índices clave de precios tienen grados de ponderación superiores a 40. En el cuadro 3 se muestra el valor del grado ponderado del índice de precios (top 10). Este cuadro muestra que, en el sistema de índices de precios, sólo unos pocos índices de precios Tienen impactos mayores de 40. Los cambios en estos índices clave de precios darán lugar a fluctuaciones en los otros índices de precios y conducirán a algún fenómeno económico de todo el sistema. Por ejemplo, China es el país más poblado del mundo. El costo de vida del pueblo ocupa un lugar central en su desarrollo económico; Como resultado, las fluctuaciones en la vida cotidiana y la venta al por menor, los índices de precios al consumidor son a menudo la causa de la inflación [26].

Tabla 3

El valor del grado ponderado del índice de precios (top 10).
RangoTipo de índice de preciosGrado ponderado
1RPI(Rural Household)42.19
2PPI(Articles for Daily Use)41.70
3RPI40.59
4PPI(Manufacture of General Purpose Machinery)39.92
5RPI(Urban Household)39.64
6CPI(Rural Household)39.14
7PPI(Manufacture of Special Purpose Machinery)39.00
8PPI(Manufacture of Artwork and Other Manufacturing)38.63
9RPI(Building Materials and Hardware)38.58
10PPI(Consumer Goods)37.62
Encontramos que hay hasta 41 grados ponderados cuyo valor es inferior a 4,8. En la figura 2, los nodos en la parte escasa de la estructura de la red son pequeños, lo que significa que tienen menos impacto en comparación con otros índices de precios y permanecen en estados relativamente independientes. Al analizar los índices de precios con grados ponderados entre 4,8 y 44,8, encontramos que siguen una distribución normal, como se muestra en la Figura 4. Los papeles principales del sistema de índices de precios están ocupados por los índices medios, índices de precios con grados ponderados entre 8,8 y 32,8. Estos resultados pueden usarse como una referencia para decidir las direcciones claves para la regulación de la inflación en China. Sin embargo, en el PIWN general, hay algunos grupos de grupos relativamente independientes y un medio de transmisión entre los índices de precios que deben estudiarse más.


Figura 4
Distribución del índice de precios



Agrupamientos de grupos de precios

¿Cómo se afectan los índices de precios entre ellos? Para responder a esta pregunta, debemos estudiar los grupos de grupo en el PIWN. Los clusters de grupos son sub-redes en las que los índices de precios tienen fuertes correlaciones. En un sistema económico real, muchos índices de precios de los productos básicos interactúan entre sí. Los cambios en un índice de precios tienden a impulsar cambios en otro índice de precios; Existe una relación mutuamente fuerte entre estos índices de precios. Como se observa en la Figura 2, toda la red incluye algunos pequeños grupos de grupos de red, que están en un estado relativamente independiente. Descubrimos que los grupos de índices de precios pueden ayudarnos a comprender las características de la estructura de correlación de los índices de precios y proporcionar mejores referencias para el control de las políticas. El k-plex y el método k-core se basan en el descubrimiento de grados de vértice en subgrupos; Son útiles para identificar pequeños grupos de clusters en la estructura de red del índice de precios. Utilizando el método de descubrimiento de subgrupos, se aprovechan los clústeres de grupos en el índice de precios, lo que puede ayudar al intentar comprender qué otros índices cambian cuando cambia un índice de precios específico.

El método k-plex requiere que cada vértice de los g vértices que están incluidos en un subgrupo mantiene al menos g-k enlaces con otros vértices en el mismo subgrupo, donde k es un coeficiente de ajuste; Cuanto menor sea el valor de k, mayor será el valor de g. Además, cuanto más exigentes sean las condiciones, más estrecha será la relación entre los vértices. El método k-core se refiere a un subgrafo con las siguientes condiciones: los puntos en el subgrafo son al menos adyacentes a k otros puntos en el subgrafo. El método k-plex requiere que, además del punto k, los puntos estén conectados con al menos un punto fuera de los k puntos, mientras que el método k-core requiere que cada punto esté conectado a al menos k puntos.

Primero, use el método k-core para encontrar k-core en el PIWN. Los resultados experimentales muestran que hay 18 grupos de grupos (Figura 5 muestra diferentes colores que representan diferentes k-núcleos). Hay siete grupos con escalas de vértices de no menos de 10 (la escala de vértices representa el número de índices de precios en un grupo de grupos), como se muestra en la Figura 6. Los clusters de grupos más grandes contienen 42 índices de precios. Como se muestra en la Figura 5, hay 3 agrupaciones de grupos grandes en el PIWN, incluyendo el 43% de los índices de precios y el 54% de las correlaciones. Estos grupos de 3 grupos están en posiciones significativas; Cualquier índice de precios en los cambios del grupo de clusters despertará cambios en los otros y dará lugar a cambios en el conjunto. Así, el gobierno podría controlar la fluctuación en los índices de precios mediante una regulación dispersa para mantener la estabilidad de todo el sistema.

Figura 5
El k-núcleo en la estructura de redes de correlación del índice de precios.
La clase de agrupamiento de grupo es mostrado en la Tabla S2.


Figura 6
Un archivo externo que contiene una imagen, ilustración, etc.

La escala de vértices k-núcleo en la estructura de la red de correlación de índices de precios.

Posteriormente, el método k-plex se utiliza para buscar clusters de grupo en el PIWN bajo las condiciones más exigentes ajustando el valor de k y la escala de vértices. En el experimento, ponemos la escala de vértices a g = 17 y el coeficiente de ajuste a k = 2, y solo se encuentran 2 grupos de grupos. Los grupos de 2 grupos son colecciones de índices de precios que tienen las correlaciones más estrechas en toda la estructura de la red, como se muestra en la Figura 7. Los vértices rojos y los vértices azules representan dos grupos de racimos y los vértices negros son los índices comunes de precios para estos dos grupos de grupos . Como se observa en la Figura 7, los índices comunes de precios son todos los índices de precios macroeconómicos que se componen del IPC, el IPR y el API. De los elementos constitutivos de los 2 grupos de grupos, podemos encontrar que, en el PIWN, hay 2 grupos de grupos con estrechas correlaciones; Un grupo comprende los índices de precios de los alimentos y el otro grupo comprende los índices de precios de los bienes de consumo del PPI. Estos dos grupos de clusters tienen fuertes relaciones positivas con los índices de precios macro, lo que significa que es eficaz para China para regular y estabilizar los mercados de precios a través de los alimentos y los índices de precios aguas arriba en la red.

Figura 7
Agrupamientos de grupos de precios.

g = 17, k = 2.

Medio de transmisión

Cuando cambia uno de los índices de precios, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? Para responder a esta pregunta, debemos analizar el intermediario de cada índice de precios en el PIWN. En los sistemas económicos, la fluctuación de cualquier precio de las materias primas puede causar cambios en los precios de otras materias primas, y esta fluctuación es transitiva. Este efecto de transmisión se basa en las correlaciones entre los precios de los productos básicos. Al igual que controlar la propagación de un virus, no sólo debemos controlar la fuente del virus sino también detener la transmisión eliminando el medio de masa. En un sistema económico, el índice de precios en la estructura de la red actúa no sólo como fuente y receptor del proceso de transmisión sino también como medio. Diferentes índices de precios tienen diferentes niveles de efectos medios. Podríamos controlar la transmisión de fluctuaciones entre índices de precios mediante el control de los medios, para evitar la influencia de todo el sistema.

Para buscar el índice de precios que desempeña el papel de intermediario, debemos analizar la jerarquía de los agujeros estructurales para cada índice de precios en el PIWN. La presencia de agujeros estructurales hace que el índice de precios que ocupa la posición intermedia sea un enlace importante. Los agujeros estructurales controlan en gran medida la transferencia de fluctuaciones en el índice de precios. Al medir el nivel de los agujeros estructurales y calcular la jerarquía de los agujeros estructurales para cada índice de precios en la estructura de la red, una jerarquía más alta significa que el índice de precios es más importante en el proceso de transferencia. La formulación de índices de precios i en el cálculo de la jerarquía de estructuras de red es

equation image          (6)

Donde N es el número de vértices en la red individual de vértices (índice de precios) i,  C/N es el valor medio de la restricción en cada nodo y la restricción de nodos Cij es el grado en que los nodos de la red tienen la capacidad de uso de huecos estructurales. La ecuación relevante puede expresarse como

equation image         (7)
Donde  piq es la parte de las relaciones de los vértices j en comparación con todas las relaciones de los vértices i.

Mediante el cálculo de la jerarquía de los agujeros estructurales de cada índice de precios (véase el cuadro S3), la jerarquía de los agujeros estructurales de los índices de precios con un grado de influencia no inferior a 10 (grado ponderado> = 10) Los principales índices de precios son índices de tipo PPI, lo que significa que, en el PIWN, el PPI tiene fuertes efectos de transmisión; Sin embargo, los índices de precios de los alimentos y los medios impresos en el índice de precios al productor tienen efectos de transmisión más fuertes, con un grado de influencia de más de 25. Por lo tanto, para moderar la fluctuación de los índices de precios de los productos básicos es importante regular y controlar estos precios Con fuertes efectos de transmisión. Los resultados del experimento muestran que los índices de precios con una jerarquía de agujeros estructurales de más de 0,02 tienen un grado de influencia inferior a 8. Estos resultados muestran que, aunque algunos índices de precios en la estructura de la red tienen un pequeño grado de influencia, Desempeñan un papel importante en la transmisión de las fluctuaciones de los precios. Al mismo tiempo, encontramos que las fluctuaciones de precios entre grupos de clusters se llevan a cabo por sus índices de precios mutuos. Como se muestra en la Figura 6, los nodos negros son medios conductores de 2 grupos de grupos.

Tabla 4

Jerarquía de los hoyos estructurales de los indices de precios con un grado de influencia no menor a 10 (top 10 de los indices de precios).
RangoTipo de índice de preciosGrado ponderadoJerarquía
1CPI(Touring and Outing)13.050.01843
2PPI(Processing of Food from Agricultural Products)28.770.01412
3PPI(Food)32.700.01405
4PPI(Printing, Reproduction of Recording Media)27.840.01378
5RPI(Furniture)27.790.01312
6PPI(Food Industry)30.130.01269
7CPI(Intercity Traffic Fare)11.430.01253
8CPI(Transportation)11.380.01253
9API36.180.01242
10PPI(Raw Materials Industry)26.430.01236

Distancia de transmisión y trayectoria

Cuando uno de los índices de precios cambia, hasta dónde puede llegar el proceso de transmisión, y cuál es el camino de transmisión? Para responder a esta pregunta, debemos conocer la distancia de transmisión más corta entre los índices de precios. La distancia de transmisión más corta en el PIWN se puede determinar calculando el trayecto más corto. Esta distancia se puede definir como el número mínimo de bordes a través del cual pasan los dos índices de precios en la estructura de la red. Cuando un índice de precios cambia, podemos medir la distancia de impacto más larga calculando el trayecto más corto entre este índice de precios y otros. Además, podríamos conocer la distancia de impacto de todo el sistema de índices de precios al encontrar la trayectoria media más corta del PIWN. Por lo tanto, cuando un índice de precios cambia, podríamos saber qué índice de precios se verá afectado a continuación.

Como se muestra en la Figura 8, las distancias de transmisión de los índices de precios siguen una distribución normal. Una distancia de 1 significa que los dos índices de precios en el PIWN están conectados directamente. Los cambios en cualquiera de los índices de precios afectarán al otro. Se considera que la distancia de impacto es 1. Una distancia de 2 significa que los dos índices de precios están conectados por otro índice de precios (conectado indirectamente). Así, la distancia de impacto se expande a 2. Después de continuar de esta manera, la Figura 8 muestra que las distancias de transmisión de los índices de precios se concentran entre 2 y 4. Así, generalmente las distancias de transmisión de la mayoría de los índices de precios son 2-4 , Lo que significa que, cuando un índice de precios cambia, sólo 2-4 distancias son necesarias para afectar a la mayoría. La distancia de transmisión de fluctuación más larga es de 9 en el PIWN, lo que significa que, cuando cambia un determinado índice de precios, el sistema de índice de precios se verá afectado a una distancia de 9. La longitud de trayecto más corta promedio es 2,55. El índice de cohesión de la estructura de red basado en "distancia" es 0.953. Por lo tanto, la transmisión entre los índices de precios en la estructura de la red es relativamente rápida, tiene un efecto de pequeño mundo, y, en promedio, puede ser completado por un índice de precios. Los resultados también muestran que, en la inflación real, un vértice a menudo tiene un impacto en todos los precios de las materias primas antes de tomar medidas de control efectivas.

Figura 8
Distancia más corta y frecuencia entre los índices de precios.

Después de una distribución normal con un nivel de confianza de 0,78.

Analizamos los caminos en el PIWN y encontramos la trayectoria de transmisión basada en los pesos de los bordes. Tomando el IPR como ejemplo (el valor de su grado ponderado es el más grande), cuando el IPR cambia, el nodo más correlacionado es CPI, y el nodo más correlacionado con IPC es IPC (Hogar Urbano). Siguiendo este proceso, podríamos encontrar otros nodos. De acuerdo con el camino más corto que hemos obtenido anteriormente, la distancia de transmisión más larga es 9; Como resultado, cuando encontramos el 10mo nodo, el RPI (Casa Rural) ya había afectado a todo el sistema. La trayectoria de transmisión del RPI (Casa Rural) se muestra en la Figura 9, con las correlaciones entre los índices de precios (pesos de los bordes) por encima de 0.96. Por supuesto, sólo habíamos considerado el camino con las correlaciones más fuertes. En realidad, los nodos de la trayectoria de transmisión pasarán la fluctuación a otros nodos. Podríamos utilizar el mismo método para encontrar todos los caminos de transmisión y luego conocer más completamente el proceso de transmisión de los índices de precios.

Figura 9

Senderos de transmisión de RPI (Rural Household) con las correlaciones más fuertes.

Discusiones y conclusiones

Este artículo analiza las características de la estructura de correlación de los índices de precios por los métodos que implican redes complejas. Teóricamente, consideramos las relaciones entre muchos factores y realizamos la investigación con una visión estructurada, mientras que la econometría tradicional sólo puede analizar las relaciones entre algunos factores. En la práctica, este enfoque podría ayudarnos a conocer más sobre las interacciones de los índices de precios analizando las características de la estructura de correlación. Este análisis no sólo nos muestra los principios de las interacciones de los índices de precios en el sistema económico sino que también nos proporciona pruebas efectivas de las políticas de control macroeconómico para el gobierno. Encontrar los índices clave de precios podría hacernos conscientes de qué objeto de control es el objetivo clave; El análisis de los grupos de grupos podría mostrarnos las influencias entre los índices de precios, y luego, podríamos sugerir al gobierno cómo estabilizar el precio de mercado regulando escasamente. Analizar el medio de transmisión nos muestra el nivel medio de cada índice de precios, y el gobierno podría evitar la expansión de las fluctuaciones mediante el control de los medios. Medir la distancia de transmisión y descubrir el camino nos indica la escala de impacto y su trayectoria de transmisión cuando hay fluctuaciones en los índices de precios; Estas rutas de transmisión proporcionan referencias cuando se hacen políticas de advertencia.

Un tema que debe investigarse más es cómo estudiar las relaciones que involucran muchas variables si el número de factores que afectan en un sistema económico continúa aumentando; Hay cientos o incluso miles de factores que interactúan entre sí. Como se muestra en la revisión bibliográfica, la mayoría de los estudios sobre la relación entre variables usan teorías y métodos de econometría como regresiones lineales, pruebas de causalidad y pruebas de cointegración. Sin embargo, el propósito de estos modelos econométricos no es incluir todas las variables; En cambio, el propósito es incluir sólo los factores más significativos. Si se introducen demasiadas variables, entonces el modelo será demasiado complejo y la investigación perderá sentido. El número de objetos incluidos en los métodos econométricos tradicionales es dos; Incluso si hay múltiples variables, el análisis se realiza con sólo dos variables. Además, muchos de los objetos incluidos son macroscópicos. Por lo tanto, es fácil ignorar las variables de nivel micro. Estas variables tienen correlaciones e influencia, e interactúan entre sí para formar un complicado sistema de relaciones. Los cambios macroscópicos son causados ​​por cambios en la complejidad de estas variables. Las investigaciones existentes rara vez abordan estas cuestiones. La teoría de red compleja proporciona una buena base para abordar el problema de la complejidad. Las relaciones entre las variables se resumen en los vértices y los bordes de la red, aplicando la investigación sobre la relación entre las numerosas variables en la red. El complejo método de análisis de red proporciona una gama de parámetros y puede combinarse con teorías económicas y métodos analíticos para estudiar problemas complejos en el sistema de índices de precios y el sistema financiero e incluso en el sistema económico.

Al construir el modelo de estructura de la red de correlación de índices de precios, el método no sólo puede utilizarse para estudiar la estructura de correlación de los índices de precios, sino también para otros campos, como el análisis de la correlación entre diversos elementos de los mercados de productos básicos, De los vínculos de precios de las acciones en los mercados financieros, de la investigación sobre las relaciones insumo-producto en las cadenas industriales y de la investigación sobre las relaciones de correlación entre los diversos índices económicos nacionales. Estas cuestiones involucran más variables y relaciones más complejas. Otras investigaciones deberían tener como objetivo definir relaciones complejas entre más variables y combinar métodos de análisis cualitativos y cuantitativos.


Referencias

1. Lebow DE, Rudd JB (2006) Inflation measurement. Finance and economics discussion series divisions of research & statistics and monetary affairs. Federal Reserve Board, Washington, D.C. 1–17
2. Alchian AA, Klein B (1973) On a correct measure of inflation. Journal of Money, Credit and Banking 5: 173–191
3. Mankiw NG, Reis R (2003) What measure of infaltion should a central bank target?. Journal of the European Economic Association 1: 1058–1086
4. Silver JL, Wallace D (1980) The lag relationship between wholesale and consumer prices. Journal of Econometrics 12: 375–387
5. Mahdavi S, Zhou S (1997) Gold and commodity prices as leading indicators of inflation: tests of long-run relationship and predictive performance. Journal of Economics and Business 49: 475–489
6. Kyrtsou C, Labys W (2006) Evidence for chaotic dependence between US inflation and commodity prices. Journal of Macroeconomics 28: 256–266
7. Blomberg SB, Harris ES (1995) The commodity-consumer price connection: fact or fable?. Economic Policy Review 1: 21–38
8. Doroodian K, Boyd R (2003) The linkage between oil price shocks and economic growth with inflation in the presence of technological advances: a CGE model. Energy Policy 31: 989–1006
9. Johnson GD, Song G (1998) Inflation and the Real Price of Grain in China. Chinese Economies Research Center, Working Paper, University of Adelaide.
10. Kadeřábek P (2007) A simple model of interaction between CPI and PPI: Application to monthly data of EU countries. Politická ekonomie 55: 226–244
11. Cushing MJ (1990) Freedback between Whosale and Consumer Price Inflation: A reexamination of the evidence. Southern Economic Journal 56: 1059–1072
12. Clark TE (1995) Do producer prices lead consumer prices?. Economic Review QIII 25–39
13. Weinhagen J (2005) Price transmission within the PPI for intermediate goods. Monthly Labor Review 5: 41–49
14. Gujarati DN, Porter DC (2010) Essentials of Econometrics, 4th edition. McGraw Hill Higher Education.
15. Peazzo RPJ, Reich SL, Schvarzer J, Virasoro MA (1995) Inflation and relaxation to equilibrium in a complex economic-system. Chaos Solitions & Fractals 6: 455–470
16. Schweitzer F, Fagiolo G, Sornette D, Vega-Redondo F, Vespignani A, et al. (2009) Economic Networks: The New Challenges. Science 325: 422–425 [PubMed]
17. Elgazzar AS (2003) Applications of small-world networks to some socio-economic systems. Physica A: Statistical Mechanics and its Applications 324: 402–407
18. Watts DJ, Strogatz SH (1998) Collective dynamics of ‘small-world’ networks. Nature 393: 440–442 [PubMed]
19. Newman MEJ, Watts DJ (1999) Renormalization group analysis of the small-world network model. Physics Letters A 263: 341–346
20. Barabási AL, Albert R (1999) Emergence of Scaling in Random Networks. Science 286: 509–512 [PubMed]
21. Latora V, Marchiori M (2003) Economic small-world behavior in weighted networks. The European Physical Journal B 32: 249–263
22. Eagle N, Macy M, Claxton R (2010) Network Diversity and Economic Development. Science 328: 1029–1031 [PubMed]
23. Liu XF, Tse CK (2012) A complex network perspective of world stock markets : synchronization and volatility. International Journal of Bifurcation and Chaos 22: 1250142
24. Kenett DY, Tumminello M, Madi A, Gur-Gershgoren G, Mantegna RN, et al. (2010) Dominating clasp of the financial sector revealed by partial correlation analysis of the stock market. PLoS ONE 5: e15032. [PMC free article] [PubMed]
25. Tse CK, Liu J, Lau FC (2010) A network perspective of the stock market. Journal of Empirical Finance 17: 659–667
26. He LP, Liu QW (2011) Causes of Inflation in China: Inflation Expectations. China & World Economy 19: 18–32

sábado, 8 de abril de 2017

Redes de correlación en Biología

Super interesante uso de las redes para interpretación de correlaciones...
Análisis y visualización de datos biológicos de alta dimensión
Creative Data Solutions


Los datos biológicos de alta dimensión comparten muchas cualidades con otras formas de datos. Normalmente es amplia (variables << variables), complicada por el diseño experiencial y compuesta de relaciones complejas impulsadas por fuentes biológicas y analíticas de varianza. Por suerte, la potente combinación de R, Cytoscape (<v3) y el paquete R RCytoscape puede usarse para generar representaciones altamente dimensionales y altamente informativas de datos biológicos complejos (y realmente cualquier tipo de ellos). Se puede comprobst los siguientes ejemplos de mapeo de red en acción o vea una presentación más detallada de las técnicas utilizadas a continuación.


Red de correlación parcial que resalta los cambios en el tumor en comparación con el tejido de control del mismo paciente.

Red de tejidos de cáncer


Red de similitud bioquímica y estructural de los cambios en el tumor en comparación con el tejido de control del mismo paciente.

Red de tejido de cáncer


Clústeres jerárquicos (color) mapeados a una red de similitud bioquímica y estructural que muestra la diferencia antes y después de la administración del fármaco.

 Red de jarabe para la tos


Red de correlación parcial que muestra cambios en las relaciones de los metabolitos en respuesta al tratamiento farmacológico.

Red de respuesta al tratamiento



Red de correlación parcial que muestra los cambios en la enfermedad y la respuesta al tratamiento farmacológico.

viernes, 7 de abril de 2017

Enorme red visualizada en Gephi

Visualización de una enorme red en Gephi
Por Jindrich Karasek




El sitio web de la página web checa de Aukro.
En realidad, sólo el 42% de ella. Ya que es bastante dinámico, tuve que abortar la recolección de datos para no causar ningún daño al servidor.
Consiste en 400 mil nodos, representando el artículo en venta. Conectado por más de 3 millones de enlaces, representando enlaces entre los elementos y otras partes del frente del sitio web.
La forma de araña tomó aproximadamente 40 horas de renderización, la transformación de los datos tomó un par horas y hasta ahora el más grande que procesé en un archivo usando #Gephi


lunes, 3 de abril de 2017

Hashtag #istandwithceu

#istandwithceu

Center for Network Research


Red de opinión Twitter del hashtag #istandwithceu, creado por Milán Janosov y Balázs Vedres. Haga clic en la imagen para abrir PDF.



Recopilamos todos los tweets que contienen el hashtag #IstandwithCEU, usando la API oficial de Twitter, ya que la primera apariencia de la etiqueta hash de #IstandwithCEU. Basándonos en los primeros diez mil tweets con la etiqueta, creamos una red de los hashtags adicionales más populares, también usados ​​en estos tweets. En la visualización el tamaño de cada nodo (hashtag) es proporcional al número de tweets en los que apareció, y el ancho de los bordes representa la frecuencia de coinocceso. El color codifica el tiempo, con las etiquetas azules que se están utilizando las etiquetas más antiguas y las más grises.

Debido a la opinión de Twitter, ampliamente internacional y de apoyo, las acusaciones actuales son claramente no sólo contra CEU, sino que son considerados públicamente como ataques contra la libertad académica y la educación superior en Hungría en general. El tema es co-mencionado con otros temas polémicos, como Brexit y los acontecimientos actuales sobre la educación superior en Turquía y Rusia. A pesar de que ciertos medios no están haciendo ninguna distinción entre CEU como una institución, y George Soros como un individuo, que se menciona un poco en estos tweets. Sin embargo, el primer ministro de Hungría, el nombre de Viktor Orbán se asocia frecuentemente con los acontecimientos en curso en este medio.

domingo, 2 de abril de 2017

Visualizando Pagerank y modularidad en Gephi

Visualizaciones fáciles de PageRank y grupos de páginas con Gephi
Colaborador Patrick Stox nos guía a través de cómo usar una herramienta de análisis de conglomerados para visualizar sitios web e identificar oportunidades de mejora de su estructura de enlaces.
Patrick Stox | Search Engine Land




En abril del año pasado, colaborador Search Engine Land Paul Shapiro ha escrito una entrada brillante sobre el cálculo de PageRank interna. El puesto ha esbozado método para examinar los enlaces internos de un sitio web con el fin de determinar la importancia de las páginas web dans le.

Esto es asombroso de gran alcance, el objetivo Creo que el concepto de Pablo podría ser más fácil de usar. Utilizó R, qui es un lenguaje y entorno de computación estadística, y la salida es básicamente un montón de números.

Quiero que le muestre cómo hacer los Sami en Gephi con sólo pulsar unos pocos botones en lugar de un montón de código - y, con unos pocos clics más, puede visualizar los datos de una manera que se siente orgulloso de mostrar a sus clientes .

Te voy a mostrar cómo obtener este resultado como un ejemplo de cómo Gephi puede ser útil en sus esfuerzos de SEO. Podrás ble para ver qué páginas son las más fuertes es sus páginas web, páginas determinan cómo se pueden agrupar por temas e identificar algunas cuestiones de sitios web comunes, tales como errores de rastreo o pobres de enlaces internos. A continuación voy a describir algunas ideas para Tomando el concepto al siguiente nivel de geek.

¿Cuál es Gephi?

Gephi es un software de código abierto se utiliza para representar gráficamente que las redes y se utiliza comúnmente para representar las redes informáticas y redes de medios sociales.

Es un programa de escritorio simple, basada en Java que se ejecuta en Windows, Mac o Linux. Aunque la versión actual de Gephi es 0.9.1, le animo a descargar la versión anterior 0.9.0, o más tarde la versión 0.9.2, en su lugar. De esa manera usted será ble para seguir aquí, y evitará los errores y los dolores de cabeza de la versión actual. (Si no has-hecho recientemente, puede que tenga que instalar Java en su ordenador también.)



1. Para empezar, el rastreo de su sitio web y la recopilación de datos

Normalmente uso Screaming Frog para el rastreo. Dado que estamos interesados en las páginas aquí y no otros archivos, tendrá que excluir cosas de los datos de rastreo.

Para hacer eso, Aquellos de ustedes con la versión de pago de los deberes de software Implementar la configuración que voy a describir a continuación. (Si está utilizando los límites de versión libre que a qui la recogida de 500 URL y no le permiten ajustar la configuración muchos tienen, voy a explicar qué hacer después.)

Ir a “Configuration” > “Spider” y verá algo parecido a la siguiente captura de pantalla. Haga que el suyo que coincida con la mía para los mejores resultados. Normalmente aussi añadir * (PNG | jpg | jpeg | gif | bmp). $ A "Ajustes"> "Excluir" para deshacerse de las imágenes, qui Screaming Frog deja veces en el retraso de rastreo.



Para iniciar el rastreo, podría URL de su sitio en el espacio en la parte superior izquierda (foto de abajo). A continuación, haga clic en "Inicio" y esperar a que el rastreo hasta el final.



Cuando se termina el rastreo, vaya a "exportación en masa"> "Todos los enlaces entrantes." Usted querrá cambiar "Archivos de tipo" a ".csv" y guardar el archivo.

La limpieza de la hoja de cálculo

  • Eliminar la primera fila que contiene "All Inlinks"
  • Eliminar la primera columna, "Type".
  • Cambie el nombre del "destino" a la columna "Target".
  • Eliminar todas las demás columnas Además de "Source" y "Target".
  • Guardar el archivo editado (y puedes volver a hacer un uso seguro del tipo de archivo



Opcionalmente, puede dejar otras columnas como código de estado o de texto de enlace si desea que este tipo de datos es la gráfica. Los dos principales campos que voy a estar explicando cómo utilizar son "Fuente" y "destino".

Si está utilizando la versión gratuita de Screaming Frog, tendrá que hacer un montón de trabajo de limpieza para filtrar las imágenes, archivos CSS y JavaScript.

En Excel, si vas a "Insert" y haga clic en "Table", obtendrá una ventana emergente. Haga su caja fuerte de datos ha-ha definido correctamente, haga clic en "Mi tabla tiene encabezados", y haga bien. Ahora, seleccione la flecha en la parte superior derecha de la columna "Target", y un cuadro de búsqueda aparecerá. Lo utilizan para filtrar las filas de la tabla para identificar que contienen las extensiones para los diferentes tipos de archivos, como .js o .css.

Una vez que tenga una visión de todas las filas de la tabla que tienen uno infractor tipo de archivo, seleccionar y eliminar toda la información para aquellas filas. Haga esto para cada tipo de archivo de la antes mencionada y presentar cualquier tipo de imágenes como .jpg, .jpeg, .png, .gif, .bmp o cualquier otra cosa. Cuando haya terminado, es necesario guardar el archivo como .csv de nuevo.

2. Uso Gephi para visualizar los datos de rastreo




Importación de nuestros datos


  • En la pantalla emergente que aparece al abrir la aplicación, haga clic en "Nuevo proyecto".
  • A continuación, seleccione "Archivo"> ​​"Importar hoja de cálculo."
  • Elija su archivo .csv y hacer seguro el "separador" se establece como "coma" y "Como mesa" se establece como "tabla de bordes." Si usted tuviera que hacer un montón de limpieza de datos de Excel, haga amargo que ha eliminado cualquier filas en blanco dentro de sus datos antes de importarlo.
  • Haga clic en "Siguiente", y asegúrese de que "Crear nodos faltantes" se comprueba antes de pulsar "Finalizar".

Para nuestros propósitos - Visualización de enlaces internos - los "bordes" son los enlaces internos, y "nodos" son diferentes páginas de la web. (Nota: Si se tropieza con un error de memoria, puede aumentar la cantidad de memoria en Asignado por Gephi siguiendo esta guía).

Si realmente-tienen un amplio conjunto de datos o desea combinar varios conjuntos de datos, puede importar varios archivos en Gephi.

Una vez que todos los datos están en el "Laboratorio de Datos", se puede cambiar a "Información general". A continuación, verá un cuadro negro probable como la de abajo. No se preocupe, vamos a hacer que bonita en un minuto.



Calculando de PageRank y modularidad


En la pestaña "Estadísticas", ejecute "PageRank" y "modularidad". (Seleccionar "ventana" y "Estadísticas" si usted no ve la pestaña "Estadísticas").

Recomiendo el uso de la configuración predeterminada de PageRank, el objetivo de modularidad que lo haría un-tick "Use pesos." Esto añadirá los datos acerca de sus páginas en nuevas columnas que serán utilizados para la visualización.




Es posible que tenga que ejecutar modularidad un par de veces para hacer las cosas de la manera deseada 'em. racimos modularidad páginas que están más conectados con one modularidad otra en grupos o clases (cada par représentée un número). Usted tendrá que formar grupos de páginas que son lo suficientemente grande como para ser significativo, pero lo suficientemente pequeño como para obtener su cabeza alrededor.

Estás clustering, después de todo, por lo que la agrupación de todas sus páginas en dos o tres grupos, probablemente, trae un montón de cosas juntos diferencia. Propósito si al final con 200 racimos, eso no es del todo útil, tampoco. En caso de duda, el objetivo de un mayor número de grupos, ya que muchos de los grupos será probablemente muy pequeño y los deberes agrupaciones mano aún ser revelado.

No se preocupe, te voy a mostrar cómo comprobar y ajustar sus grupos en un minuto. (Nota :. Un menor modularidad le dará más grupos y A modularidad Superior le dará grupos Menos Tweak esto mediante fracciones en lugar de números enteros, como un pequeño cambio hace una gran diferencia).

Ajustando su configuración Modularidad

Vamos a ver lo que hemos hecho. Cambiar la pestaña de "Laboratorio de Datos" y mirar a la "Tabla de datos." Allí encontrará sus nuevas columnas para PageRank y Clase modularidad. Los deberes números de PageRank se alinean con los números de artículo mencionado de Paul Shapiro, el objetivo tesis que tienes que hacer sin tener ningún tipo de codificación. (Recuerde, los números de la tesis de PageRank son internos, no lo hemos Consulte lo general a "PageRank").

La modularidad Clase asigna un número a cada página, de modo altamente Eso páginas interconectadas recibe el número de Sami. Utilizar la funcionalidad de filtro en la parte superior derecha para aislar cada página de su grupo, y el globo ocular se examinan algunas de las direcciones URL para ver qué tan cerca están relacionados con la tesis de ser blanco. Si las páginas terminaron en el mal Clase modularidad, es necesario Puede Volver a ajustar la configuración, o podría indicar indicación de que usted no está haciendo un buen trabajo bajo el mecanismo de interconexión feliz.

Recuerde que su modularidad se basa es la vinculación interna, en realidad no el contenido de las páginas, por lo que está identificando aquellas que están normalmente unidos entre sí - Los que no deberías ser unidos entre sí.

En mi caso, he elegido un bufete de abogados y con la configuración predeterminada, que terminó con el desglose siguiente cuando me ordenadas según la modularidad, qui probablemente mejor hecho podría tener con algunos ajustes:

  • Clase 0 = lesión
  • Clase 1 = familia
  • Clase 2 = algunas páginas aleatorias
  • Clase 3 = penal
  • Clase = 4 tráfico
  • Clase 5 = DWI
  • Clase 6 = un par de páginas al azar

Puede volver a la pestaña "general" y continuará haciendo ajustes hasta que esté satisfecho con sus grupos de páginas. Incluso se ejecutan varias veces con modularidad números de la même pueden dar resultados diferentes ligeramente cada vez, por lo que puede llevar algún jugando para llegar a un punto de donde usted está satisfecho con los resultados.

Vamos a hacer una foto con diseño

Te prometí una visualización Más temprano, y es probable que te preguntas cuando llegamos a ese recurso compartido. Vamos a hacer que el cuadrado negro en una visualización real de que es más fácil de entender.

Ir a "Visión general"> "Diseño". En el cuadro desplegable lado izquierdo donde dice ": elija un diseño," seleccionar "ForceAtlas 2."



Ahora sólo tiene que jugar con los ajustes que para conseguir una visualización que se sienta cómodo. (Si alguna vez se pierde, haga clic en la imagen de la lupa poco en el lado izquierdo de la imagen, y que centrarán y el tamaño de la visualización así que todo es visible en la pantalla.) Para el patrón de la estrella por encima, he puesto "Escala" de 1000 y "gravedad" a 0,7, el resto objetivo son valores predeterminados. Los dos principales ajustes que jugar con escalamiento son probable y gravedad.

Escalamiento gobierna el tamaño de la visualización; El Superior se establece, la más escasa su gráfico será. La manera más fácil de entender la gravedad es pensar en los nodos como los planetas. Cuando aumenta la gravedad, esto atrae todo más cerca. Puede ajustar esta marcando la casilla "Más fuerte gravedad" y ajustando el número de gravedad.

Hay algunas otras opciones, y los efectos son de cada interfaz Explicado dans le. No dude en jugar con ellos (siempre se puede cambiar de nuevo) y ver si hay algo que ayuda a que la visualización más clara.

¿Qué queremos mostrar?

En el caso citado, queremos mostrar modularidad Ambos grupos de páginas () y PageRank interna. La mejor manera que he encontrado para hacer esto es para ajustar el tamaño de los nodos se basa PageRank y los colores se basan modularidad. En la ventana "Aspecto", seleccione "nodos", "Tamaño" (el segundo icono), y en la "pestaña" donde hay un desplegable de "Clasificación Elija un atributo," seleccionar "PageRank".

Elija Algunos tamaños y pulsa "Aceptar" hasta que los nodos más importantes son distinguibles de los otros. En la captura de pantalla a continuación, tengo el tamaño mínimo establecido como el 100 y el tamaño máximo en 1.000. Ajuste del tamaño del nodo se basa PageRank le ayuda a identificar fácilmente significativo es sus páginas web - más grandes son.



Para visualizar los grupos de páginas con modularidad, todavía nos queremos estar en la ventana de "Appearance", el objetivo de este tiempo queremos seleccionar "nodos" "color" (el primer icono), y "Partition". En el desplegable hacia abajo para "Choose an attribute," seleccionar "Modularity Class."

Algunos colores predeterminados están pobladas, meta si desea cambiar ellos, hay un pequeño botón verde de "paleta". En la Paleta, si hace clic en "Generate", puede especificar el número de colores para mostrar basándose se cuántos grupos La modularidad consiguió cuando se ejecuta.

En mi caso, las clases 2 y 6 no eran muy grandes, así que estoy haciendo clic en Cerrar en sus colores y cambiando a em negro. Si desea mostrar sólo un tema específico, cambiar el color de una sola clase modularidad, dejando los otros hicieron comentarios otro color.



Cambio de la visualización

Puede usted desear para etiquetar los nodos de modo que sabemos lo Representan la página. Para agregar una etiqueta con la dirección URL, tenemos que volver a la pestaña "Data Laboratory" y seleccione la tabla de datos. Hay una caja en la parte inferior para "Copy data to other column," y queremos copiar "ID" para "etiqueta" para obtener las direcciones URL para mostrar. El proceso es similar para los bordes. Si ha guardado el texto de anclaje del rastreo, puede etiquetar cada flanco con el texto del ancla.

De nuevo en la pestaña "Preview", tendrá que seleccionar cómo desea que su visualización que se vea. Normalmente selecciono "Default Curved" en virtud de los ajustes preestablecidos, el objetivo de una gran cantidad de personas como "Default Straight".

Cambiar el tamaño de fuente y el tamaño proporcional para las etiquetas ayudará a visualizar em de manera que se pueden leer en diferentes tamaños. Sólo jugar con la configuración de la ficha de vista previa para conseguir que se muestre la forma que desee.

Para la visualización de abajo, he apagado etiquetas de nodo y el borde de manera que no repartiera la identidad del sitio web de la empresa, salvo derecho particular que he utilizado. En su mayor parte, Han hecho un buen trabajo agrupando sus páginas y que une internamente. Si hubiera dejado columna de texto del ancla en la hoja de cálculo de Screaming Frog, podría haber tenido Cada enlace interno (línea) muestra las TIC con el ancla de texto como un sello de borde y cada página enlazada desde (círculos) como una etiqueta de nodo.


Gephi para los conjuntos de datos más grandes

Para los conjuntos de datos más grandes, todavía se puede utilizar Gephi, aunque su grafo es probable que se parecen más a un mapa estelar. Yo grafiqué los enlaces internos de Search Engine Land, meta que tuvo que ajustar el escalado a 5000 y gravedad a 0,2 en los ForceAtlas 2 ajuste.

Todavía se puede ejecutar cálculos de PageRank y Modularity, el propósito es probable que necesite cambiar el tamaño de los ganglios a algo grande para ver Cualquier dato que su gráfico. También puede que tenga que añadir más colores a la paleta, como se describió anteriormente, ya que hay muchas clases de modularidad probables más distintivas en un conjunto de datos de este tamaño. Esto es lo que el grafo de SEL se ve como antes de teñirlo.



¿Por qué es importante esto?

Gephi se puede utilizar para mostrar una variedad de problemas. En uno que posteé anteriormente en artículo Future of SEO, mostré una división entre HTTPS y HTTP.

Además, puede descubrir secciones que pueden ser consideradas importantes por un cliente que no están internamente vinculados muy bien. Por lo general, estos son más alejados en la visualización debido a la gravedad, y es posible que desee vincular a ellos más de las páginas relacionadas.

Una cosa es decirle a un cliente que necesita más enlaces internos, pero es mucho más fácil mostrarles que una página que consideran importante es realmente muy aislada. La imagen de abajo fue creada simplemente cambiando mi Modularidad hasta que tuviera sólo dos grupos. Esto se debía a que tenía enlaces http y https en mi rastreo, y reduje la modularidad hasta que sólo tenía dos grupos, los más relacionados de los cuales eran páginas HTTP> HTTP y páginas HTTPS> HTTPS.



Hay un montón de otras cosas que este tipo de visualización puede darnos cuenta. Busque nodos individuales por sí mismos. Puede encontrar toneladas de páginas dispersas o incluso errores de rastreo. Las trampas de araña pueden mostrar como una línea infinita de páginas, y las páginas que no están en los grupos correctos pueden significar que no están internamente vinculándolos de las páginas más relevantes.

Un sitio web bien internamente vinculado puede parecer más un círculo que una estrella, y yo no consideraría esto un problema, incluso si los colores no siempre se alinean en grupos. Tienes que recordar que cada sitio web es único y cada visualización es diferente.



Es difícil explicar todas las posibilidades, pero si intenta algunas de estas, comenzará a ver problemas comunes o tal vez incluso algo nuevo y diferente. Estas visualizaciones le permitirán ayudar a los clientes a entender los problemas de los que siempre está hablando. Le prometo que sus clientes les encantará.

Gephi tiene varias opciones de exportación para .png, .svg o .pdf si desea crear imágenes estáticas. Más divertido es exportar para usarlo en una página web para crear una experiencia interactiva. Para hacer eso, echa un vistazo a los complementos de Gephi - en particular, el exportador SigmaJS y Gexf-JS Web Viewer.

¿Qué más podemos hacer con Gephi?

Agregar información adicional sobre los vínculos

Si tiene un rastreador que puede identificar la ubicación de los vínculos, puede ajustar el peso de los bordes de forma diferente en función de la ubicación del enlace. Digamos, por ejemplo, que damos a cada enlace de contenido principal un valor más alto que, digamos, un enlace de navegación o pie de página. Esto nos permite cambiar el cálculo de PageRank interno basado en el peso de los enlaces según lo determinado por su ubicación. Eso probablemente mostrará una representación más precisa de cómo Google es probable valorar los enlaces basados ​​en su ubicación.

Esto nos permite cambiar el cálculo de PageRank interno basado en el peso de los enlaces según lo determinado por su ubicación. Eso probablemente mostrará una representación más precisa de cómo Google es probable valorar los enlaces basados ​​en su ubicación.

Obtención de métricas de terceros para obtener una vista más completa

La visualización que hemos estado trabajando hasta ahora se ha basado en cálculos internos de PageRank y asume que todas las páginas están ponderadas igualmente al principio. Sabemos, por supuesto, que esta no es la forma en que Google mira las cosas, ya que cada página tendría vínculos de diferente fuerza, tipo y relevancia que les va desde sitios externos.

Para que nuestra visualización sea más compleja y útil, podemos cambiarla para obtener métricas de fuerza de terceros en lugar de PageRank interno. Existen varias fuentes posibles para esta información, como Autoridad de página de Moz, Clasificación de URL de Ahrefs o Flujo de citas majestuoso o Flujo de confianza. Cualquiera de estos debe funcionar, así que elige tu favorito. El resultado debe ser una representación más exacta del sitio web como los motores de búsqueda lo ven, ya que ahora tener en cuenta la fuerza de las páginas.

Podemos comenzar con el mismo archivo que creamos anteriormente para mostrar el PageRank interno. En Gephi, vamos a ir a la pestaña "Laboratorio de datos" y asegurarnos de que estamos en la pestaña "Nodos". Hay una opción "Exportar tabla", y puede exportar sus columnas a un archivo .csv de su elección. Abra ese archivo exportado en Excel y cree una nueva columna con el nombre que desee. Llamé a esto "CF" ya que estoy usando Majestic Citation Flow en mi ejemplo.

Ahora, vamos a incorporar los datos de terceros. En la hoja de cálculo que he exportado desde Gephi, he copiado datos de Majestic que tiene las Páginas en una columna y Flujo de Citas en la segunda. Ahora tenemos que casar estos datos con el primero, y puede hacerlo usando una fórmula VLOOKUP.

Primero, seleccione los datos Majestic - ambas columnas - y haga que sea un rango con nombre. Para ello, vaya al menú desplegable Insertar y seleccione Nombre. Desde allí, elija la opción "definir" y nombre su rango de datos Majestic lo que quiera. Para nuestro ejemplo, lo llamaremos "majestuoso".

Vuelva a la columna "CF" del conjunto de datos original. Haga clic en la primera celda en blanco y escriba = VLOOKUP (A2, majestic, 2, FALSE), luego presione "Enter" en su teclado. Copiar esto a todas las otras entradas "CF" haciendo doble clic en el pequeño cuadrado en la parte inferior derecha del cuadro. Esta fórmula utiliza los datos de la columna A - la URL - como una clave, y luego coincide con la misma URL en los datos de Majestic. Luego va a la siguiente columna de datos de Majestic - los datos de PageRank externos que estamos buscando - y lo lleva a la columna CF.

A continuación, deseará hacer clic en la letra de la columna en la parte superior de la columna CF para seleccionar todo en la columna. Pulse "CTRL + C" para copiar, luego haga clic con el botón derecho del ratón y vaya a "Pegar especial" en el menú que aparece y seleccione "Valores". Esto reemplaza nuestra fórmula con los números reales. Ahora podemos eliminar el rango que tenía nuestros datos de terceros y guardar nuestro archivo de nuevo como .csv.



De vuelta en Gephi y en el "Data Laboratory", queremos hacer clic en "Import Spreadsheet" para insertar la tabla que acabamos de hacer. Elija el archivo .csv creado. Esta vez, a diferencia de los pasos anteriores, queremos cambiar "as table" a "Nodes table." Haga clic en "Next" y asegúrese de que "Force nodes to be created as new ones" esté desmarcado, luego pulse "Finish". Reemplace la tabla de datos de nodos con nuestra tabla modificada que incluye CF.

En la parte inferior de la pantalla de la aplicación, verás un botón para "Copiar datos a otra columna". Simplemente queremos seleccionar "CF" y en "Copiar a", queremos seleccionar "PageRank". De los datos de PageRank internos generados, estamos utilizando los datos externos de PageRank externos.

De vuelta en la pestaña "Descripción general", queremos buscar en "Apariencia" y pulsar "Aplicar" una vez más. Ahora nuestros Nodos deben ser dimensionados basados ​​en la fuerza relativa de nuestros datos de Majestic CF. En mi gráfica a continuación, puedes ver cuáles son las páginas más fuertes del sitio web, teniendo en cuenta las medidas externas de solidez de las páginas.



Usted puede decir mucho sólo de esta imagen. Al activar las etiquetas, puede ver qué páginas representa cada círculo. El color indica qué agrupación y el tamaño del círculo indica la fuerza relativa de la página.

Cuanto más lejos están estos puntos, menos vinculados internamente están las páginas. Puede saber por el número de nodos de cada color qué categorías ha creado el cliente más contenido y qué ha sido exitoso para ellos en la atracción de enlaces externos. Por ejemplo, se puede ver que hay un montón de puntos púrpura, lo que indica que esto es probablemente un área de práctica importante para la empresa y que están creando una gran cantidad de contenido a su alrededor.

El problema es que los puntos morados más grandes están más lejos del centro, indicando que no están bien conectados internamente. Sin dar demasiado lejos, puedo decirle que muchos de los puntos distantes son los postes del blog. Y mientras que hacen un buen trabajo que liga de blogs a otras páginas, hacen un trabajo pobre de promover sus publicaciones del blog en el Web site.

Conclusión

Espero que hayas disfrutado jugando junto con tus propios datos y que tengas un buen sentido de cómo Gephi puede ayudarte a visualizar datos importantes que puedes procesar para ti y para tus clientes.