viernes, 14 de abril de 2017

La importancia de los grafos de bases de datos en Big Data

Por qué los grafos de bases de datos son tan eficaces en el análisis de Big Data 
Cleverism

Vivimos en una era de datos. La información está en todas partes y se puede acceder de diferentes maneras. La información también se recoge en grandes cantidades. No se puede hacer mucho en el mundo moderno sin que se anote y se almacene en una base de datos.

El gran análisis de datos y las grafos de bases de datos son palabras de moda que más probablemente haya encontrado. Es probable que le hayan dicho que comience a usar grafos de bases de datos en su gran analítica de datos para aumentar su eficiencia organizativa.



Por qué los grafos de bases de datos son tan eficaces en Big Data Analytics
Wikimedia Commons I Hoshi Ludwig (CC BY-SA 4.0)

¿Pero por qué? Veamos los conceptos y las razones por las que los grafos de bases de datos son tan eficaces en grandes datos.

¿Qué son los grandes datos?

A menos que usted haya estado viviendo bajo una roca, usted debe haber oído el término "Big Data" arrojado alrededor. De hecho, es probable que haya escuchado que se menciona en tantos contextos diferentes, descritos de diferentes maneras en que podría ser difícil saber y entender lo que realmente significa el término y cuál es su significado.

Por lo tanto, voy a tratar de explicar el término de forma concisa y le dejo en las razones definitivas que importa.

La definición de grandes datos

Si busca la definición de grandes datos en Google, recibirá más de 10 millones de resultados. La definición del diccionario establece grandes datos como:

"Conjuntos de datos extremadamente grandes que pueden ser analizados computacionalmente para revelar patrones, tendencias y asociaciones, especialmente relacionadas con el comportamiento humano y las interacciones".

Muchas palabras de lujo, ¿verdad? La definición podría no abrir la idea y el propósito detrás del concepto. Podrías afirmar lo anterior de manera un poco más simplista y describir los grandes datos como una gran colección de datos, recopilados de fuentes tradicionales y digitales. Los datos pueden ser recogidos dentro de una organización específica y sus diferentes canales o fuera de la organización. Además, los datos grandes no sólo se recogen sino que se usan para descubrir cosas nuevas y para analizar patrones y procesos existentes.

El punto clave para entender con grandes datos es que los conjuntos de datos recogidos son enormes - no se trata de unos pocos números de teléfono aquí, sino grandes cantidades de diferentes tipos de datos. Además, los datos suelen estar en formato digital, aunque no se deben excluir los conjuntos de datos tradicionales. Los registros financieros, por ejemplo, también forman parte de grandes datos. Además, los grandes datos siempre mezclan datos multi-estructurados y no estructurados. Qué significa eso? Los datos grandes pueden utilizar:

  • Datos no estructurados, que son información que no puede ser fácilmente organizada o interpretada por bases de datos y modelos tradicionales.
  • Datos multi-estructurados, que son diferentes tipos y formatos de datos, derivados de las interacciones entre personas y máquinas.
    Entonces, ¿qué es lo que se ve en la realidad? Un ejemplo de grandes datos sería cómo Wal-Mart recogió datos de sus clientes y el clima. Al combinar estos diferentes conjuntos de datos y puntos de información, la empresa notó que a medida que las tormentas se dirigen hacia la ubicación, los clientes compran más linternas (comprensibles!) Y Pop-Tarts (interesante y algo sorprendente).

Para una rápida recapitulación de lo anterior y una visión del mundo de los grandes datos, debe ver el corto clip a continuación:



¿Por qué los datos importantes importan?

Pero, ¿qué significa lo anterior para una organización? ¿Por qué importa si recopilas y usas datos grandes? Bueno, el ejemplo de Wal-Mart muestra las dos razones principales para utilizar datos grandes:

Revela la información oculta - Usted no necesita saber los patrones del tiempo y el consumo del cliente de ciertas mercancías van de común acuerdo o tiene un acoplamiento. Los datos grandes ayudan a revelar esta información y por lo tanto, usted no necesita saber lo que usted está buscando para encontrar una conexión. Wal-Mart no sabía que está buscando para encontrar un alimento específico aumentar sus ventas antes de una tormenta, pero fue capaz de encontrar esta conexión interesante debido a la gran analítica de datos.
Extrae valor - La información que obtiene ayuda a comprender mejor las conexiones entre acciones y comportamientos. Esto a su vez, le ayudará a aumentar la extracción de valor, ya sea ayudándole a hacer o ahorrar más dinero, o mejorar la eficiencia. En el ejemplo de Wal-Mart, la compañía podría usar la información para promover Pop-Tarts cuando las tormentas se dirigen adentro o hacen las linternas más accesibles fácilmente.

¿Qué son los grafos de bases de datos?

Pero ¿qué pasa con el otro concepto que estamos conectando con el análisis de datos grandes? Con el fin de comprender los beneficios de utilizar grafos de bases de datos en relación con grandes datos, es necesario comprender el significado y la importancia de ellos.

La definición de un grafo de base de datos 

Las definiciones de un grafo de base de datos también vienen en complejidades diferentes. La definición informática del concepto dice que un grafo de base de datos es:

"Una base de datos que utiliza estructuras de grafos para consultas semánticas con nodos, aristas y propiedades para representar y almacenamiento de datos".

Si usted no es un experto en informática o se utiliza para la jerga de la tecnología, lo anterior probablemente fue muy por encima de su cabeza. No se preocupe, hay una manera más práctica de ver el concepto. Un grafo es una ilustración de la información y una base de datos es, naturalmente, un conjunto de información agrupada. Los grafos de bases de datos tienen dos elementos de definición:
  • Un nodo, que representa una entidad. Esto puede ser una persona, un lugar, una cosa y así sucesivamente.
  • Una relación, que es la conexión entre dos nodos separados.
Esencialmente, los grafos de bases de datos son conjuntos de datos que se centran en las conexiones entre diferentes partes de la información y representan estas conexiones de una manera simple y gráfica.

Se puede pensar en ello a través de un ejemplo, como Twitter, que es en sí mismo un enorme grafo de base de datos. Los usuarios serían los nodos y las conexiones o relaciones que los diferentes nodos tienen pueden ser variables y que se representan con 'sigue'. La conexión entre dos usuarios (nodos) podría ser la del nodo 1 después del nodo 2, con el nodo 2 no siguiendo el nodo 1. Tanto el nodo 1 como el 2 también podrían estar siguiendo uno al otro y así sucesivamente. Todos los diferentes usuarios (nodos) y las relaciones que tienen con otros nodos pueden representarse en un enorme grafo de base de datos.



¿Por qué son importantes los grafos de bases de datos?

Pero, ¿por qué un grafo de base de datos facilita el análisis y la comprensión de la información? ¿Cuál es el propósito de representar a los usuarios de Twitter y sus relaciones con un grafo de base de datos? Una organización puede beneficiarse del uso de grafos de bases de datos de tres maneras diferentes, con la base de datos ayudando a:
  • Aumentan el rendimiento - Cada organización tendrá datos y los conjuntos de datos siempre seguirán creciendo. El crecimiento de estos conjuntos de datos también conducirá al crecimiento en las conexiones que tienen los conjuntos de datos. Los grafos de bases de datos están específicamente diseñadas para entender las relaciones entre diferentes partes de datos, lo que significa que el crecimiento de las relaciones no dificultará el rendimiento.
  • Proporcionan flexibilidad: el uso de grafos de bases de datos también es flexible, ya que la base de datos puede cambiar a la misma velocidad que la de su organización. La estructura del modelo se adapta a todo tipo de necesidades y requerimientos.
  • Mejoran la agilidad - Los grafos de base de datos también admite agilidad, que es crucial en un entorno de desarrollo basado en pruebas. A medida que cambian los requisitos de su empresa, la base de datos puede cambiar con ella.

El mundo interconectado de hoy significa que diferentes piezas de información están conectadas entre sí en una serie de formas únicas. El uso de los grafos de bases de datos significa que no sólo entienden la importancia de la información y los datos, sino las relaciones entre ellos.

La comprensión adquirida de las relaciones puede impulsar a su organización en términos de eficiencia y creación de valor - tal como vimos con grandes datos. La información por excelencia conduce a un mejor servicio y un mayor valor, tanto para usted como para el cliente.

¿Por que los grafos de bases de datos funcionan en el análisis de Big Data?

Entonces, ¿qué obtienes cuando implementas grafos de bases de datos en análisis de datos grandes? Una herramienta eficaz y poderosa para crear conexiones y utilizar sus datos. Pero, ¿por qué?

Como se mencionó en la primera sección, los datos grandes generalmente se basan en el lenguaje de consulta estructurada (SQL) para comunicarse con una base de datos. Es el lenguaje de la gestión de bases de datos relacionales, que son bases de datos que se construyen alrededor de tablas y colecciones de filas de atributos.

La comunicación entre las diferentes tablas y filas puede ser lenta y difícil cuando se ponen en cuestión conjuntos de datos enormes e irregulares. Esencialmente, a medida que los datos continúan creciendo y evolucionando, el modelo tradicional de SQL puede llegar a ser insuficiente para comprender las relaciones entre estos diferentes conjuntos de datos.

¿Cómo se resuelven estos problemas? Bueno, los grafos de bases de datos son una parte de la solución. Pertenecen a un movimiento denominado No Only SQL o NoSQL. En lugar de estructurar los datos en el modelo tradicional de tablas y filas, NoSQL permite que el diseño de la base de datos se construya en torno a los requisitos a la mano. Esto puede significar que los datos están estructurados y definidos por:

  • Almacenes de valores clave
  • Documentos
  • Grafos de bases de datos 

El modelo de grafo de base de datos se centra en las relaciones de los diferentes nodos, o puntos de datos. Por lo tanto, en lugar de mirar el valor del punto de datos (que es lo que la base de datos SQL haría), el grafo de base de datos está organizando y analizando los puntos de datos desordenados de acuerdo a las relaciones. El grafo de base de datos agrega otra capa de estructuración y análisis de los datos, aumentando la eficacia de su gran análisis de datos. Simplemente abre más puertas para su organización.

Pero, ¿cuál es la importancia de la relación de nodos en los grandes datos? ¿Por qué es tan eficaz en la adición de la forma de analizar los datos. En pocas palabras, la respuesta es que puede aclarar los datos interconectados con mayor claridad. En lugar de simplemente entender cuál es el valor de los datos específicos, se entiende el valor de la relación entre los datos. Si piensa en el ejemplo de los hallazgos de Wal-Mart, el grafo de base de datos ayudaría a notar la relación entre la tormenta, las decisiones de compra y los clientes que compraron linternas y Pop-Tarts.

Una organización no sólo se basa en los datos cuando se trata de la toma de decisiones. Si desea aumentar las ventas en su librería, no sólo necesita datos sobre los libros que se están vendiendo con el fin de aumentar las ventas. Es necesario comprender cómo los clientes se conectan a los libros, por ejemplo, qué libros tienden a ser comprados por la misma persona y qué tienen en común los compradores de un libro específico. Si descubre estas relaciones, puede aumentar las ventas mucho más fácil. Tal vez encuentres una conexión donde la gente que lee J.K. Rowling también tiende a comprar libros de Terry Pratchett y puede utilizar la información en la comercialización o el posicionamiento de los libros. Por lo tanto, mejorar la forma de interpretar y utilizar los datos. No sólo se centran en el valor específico, pero el valor de la relación. Para cualquier organización, las relaciones entre los puntos de datos son importantes y seguirán creciendo en importancia.

Otro ejemplo de lo anterior podría ser entender por qué el transporte de libros desde el almacén lleva mucho tiempo. Con la ayuda de un grafo de base de datos, puede encontrar la relación entre el almacén, minorista, empresa de entrega y el cliente y encontrar qué conexiones tomar más tiempo o si podría obtener el producto más rápido mediante diferentes relaciones, es decir, los procesos de entrega. Puede solucionar los problemas de su empresa de diferentes maneras, ya que son capaces de ver los datos de una manera diferente al modelo tradicional y encontrar conexiones que no puede realizar con el modelo de SQL. Usted termina creando más valor para la organización y el cliente. Resuelve un problema que puede impedir que un cliente haga compras con usted de nuevo y cree un servicio más eficiente que podría aumentar el valor que puede obtener de los servicios que proporciona.

Además, el modelo de base de datos NoSQL puede ser mucho más eficiente en términos de encontrar estas conexiones de datos. Una base de datos SQL comenzaría su búsqueda comprobando puntos de datos individuales y comparándolos con otro uno por uno. Considere que tiene el punto de datos A y desea encontrar quién está conectado a él. Si utiliza sistemas de base de datos tradicionales, el A se verificará individualmente con B, C, D, E, etc. Por otro lado, con el grafo de base de datos, las conexiones entre A y los diferentes puntos de datos se crearían mucho más rápidamente. Las relaciones se capturan por sí solas y las propiedades de los puntos de datos se comprueban directamente. Esto reduce el tiempo de procesamiento y asegura que pueda acceder a la información más rápidamente. Todo esto asegura una mayor eficiencia. Ryan Boyd, director de relaciones con desarrolladores de Norteamérica para Neo4J, dio un ejemplo de la técnica y el modelo de procesamiento en una entrevista TechRepublic. Boyd dijo,

"Con un grafo de base de datos, encontrará un punto de partida lógico y se ramificará desde allí e identificará las relaciones. Por ejemplo, puede escribir una pregunta que le pregunte, 'Encuentra a todos los amigos de los amigos de John'. En lugar de tener que JOIN muchos índices diferentes, el grafo de base de datos utiliza aritmética de puntero que está en memoria o en caché y realiza la operación. "

Un ejemplo del uso efectivo de los grafos de base de datos en el análisis de grandes datos a la luz de lo anterior es eBay y cómo proporciona un servicio rápido y eficiente a sus clientes. La plataforma de compras utiliza grafos de base de datos para conectar a los compradores con los vendedores locales, creando conexiones localizadas de entrega puerta a puerta. La compañía ha observado cómo las consultas impulsadas por un grafo de base de datos toman 1 / 50th de un segundo para resolver, mientras que las consultas de base de datos tradicionales tomó alrededor de 15 minutos. El ejemplo destaca el poder de crear eficiencia en términos de ahorro de tiempo y recursos de la organización y proporcionar un mejor valor para los clientes.

Uso de grafos de bases de datos

Los grafos de base de datos ofrecen muchas oportunidades para las organizaciones. Los beneficios discutidos anteriormente ya han sido señalados por una serie de industrias, incluyendo:

  • Servicios financieros - Ejemplos de usos incluyen monitorear y prevenir el fraude interno y externo y sus riesgos.
  • Venta al por menor - se puede utilizar para entender las decisiones de compra y para proporcionar recomendaciones a los clientes sobre la base de cómo los diferentes productos se vinculan entre sí.
  • Logística - un ejemplo en la industria sería el uso del grafo de base de datos para la planificación de rutas.
  • Redes y TI - identificación y comprensión del análisis de la causa raíz.

Al comenzar a implementar los grafos de base de datos en su organización, debe tener en cuenta algunas cosas. En primer lugar, hay dos propiedades clave que utilizan las tecnologías de grafos de base de datos:

  • Almacenamiento de grafos: algunas opciones de almacenamiento están diseñadas específicamente para almacenar y administrar grafos, mientras que otras utilizan bases de datos relacionales u orientadas a objetos. Las últimas opciones tienden a ser más lentas.
  • Motor de procesamiento de grafos: el procesamiento nativo o grafo es la forma más eficiente de procesar datos dentro de un grafo. Los motores de procesamiento no nativos tienden a utilizar otros medios de procesamiento, como "crear", "leer" o "borrar".

Encontrar la tecnología adecuada para usar dependerá de sus necesidades y requerimientos específicos. Hay bastantes diferentes tecnologías de grafo de base de datos disponibles, siendo el grafo de base de datos más utilizada Neo4J. El sistema de código abierto es un grafo de base de datos nativa, tanto en términos de almacenamiento como de procesamiento. La base de datos comenzó en desarrollo en 2003, convirtiéndose en sistema disponible públicamente en 2007.

El grafo de base de datos es utilizada por varias organizaciones y empresas de todo el mundo, que representan un gran número de industrias. El sistema se utiliza en la investigación científica, gestión de proyectos y matchmaking. Sus usuarios incluyen organizaciones establecidas como Wal-Mart y Lufthansa, así como start-ups como FiftyThree y CrunchBase.

miércoles, 12 de abril de 2017

Siete razones por las que los lazos de amistad se pueden romper

Un psicólogo identifica 7 signos que señalan que es hora de dejar ir una amistad
Ellen Hendriksen | Business Insider




A pesar de lo que las Spice Girls nos quieren hacer creer, no es cierto que la amistad nunca termina.

La investigación realmente confirma lo que todos hemos experimentado: la mayoría de las amistades de la escuela media ni siquiera duran un año. Y mientras algunas amistades de adultos duran toda la vida, algunas nos hacen sentir como si hubiéramos sido sentenciados de por vida. Entonces, ¿cómo saber cuándo hacer una pausa para la libertad?

A veces es obvio: un amigo llamado roba su dinero o su pareja, o en el caso de Taylor Swift, sus bailarines de respaldo. Ahora tenemos mala sangre, de hecho.

Pero a veces no es obvio: ¿lo dura con un amigo luchando con la adicción? ¿Puede usted permanecer amigos con alguien cuyos valores experimentan un cambio radical? ¿Dejas atrás a un amigo aburrido o te recuerdas que la verdadera amistad no se trata de entretenimiento? Y, por supuesto, ¿qué hacer cuando una amistad comienza fuerte y sólo fizzles? No pasó nada, pero ya no hay nada allí. ¿Está bien dejar ir?

Fundamentalmente, usted no necesita una lista de verificación de razones legítimas y no legítimas para terminar una amistad. Vaya con su tripa y su corazón. Dicho esto, aquí hay siete preguntas que debes hacerte para que estas situaciones difusas sean un poco más claras:

1. ¿Se siente genuino, o como una transacción?

Algunas personas son amigos con usted debido a lo que puede hacer por ellos. Las banderas rojas incluyen a amigos que intentan repetidamente venderle algo, piden pedir prestado una y otra vez, o guardan tabulaciones en favores. ("Me debes casa porque cuidé de tu perro.") Estos amigos rutinariamente cruzan la línea entre la amistad y el negocio.

La transacción también podría ser más sutil - eres amigo de ellos porque te admiran con los corazones de dibujos animados en los ojos y, a cambio de obtener un tiro a su autoestima. Eres amigos porque te detienen sólo lo suficiente para que puedas culpar a ellos, en lugar de a ti mismo, por no cumplir tus sueños.

En suma, si deja cada interacción con un impulso de lavarse las manos, mire más de cerca y vea si podría usarlas o ser utilizado usted mismo. Al final, quieres amigos, no un séquito.

2. ¿Se están manteniendo mutuamente alejados de estar sanos?

En 2007, un estudio ahora famoso en el New England Journal of Medicine rastreó la propagación de la obesidad a través de una "red social profundamente interconectada" de más de 12.000 personas, subrayando que los vínculos sociales vinculan a la conducta de salud.

Resulta que los hábitos saludables (o insalubres) pueden circular dentro de un grupo de amigos más pequeños, también. Por ejemplo, hábitos psicológicos no saludables como una tendencia a ponerse unos a otros oa quejarse constantemente pueden propagarse de un amigo a otro. O la imagen corporal malsana o los hábitos alimenticios desordenados pueden ser una cultura en su círculo.

Más en serio, si usted está luchando contra un problema de abuso de sustancias normalizado por un grupo de amigos ("Si todos bebemos hasta que nos enmascaramos, ¿no lo hace normal?"), Es difícil pero crucial para dejar caer a los amigos. De hecho, aparecer en la misma barra con la misma gente llevará inevitablemente a la misma conducta.

Lo ideal es que los amigos trabajen juntos para comer mejor, se unan para hacer ejercicio o resistir los horrores de dejar de fumar juntos. Pero si tu amigo te tira, te presiona para que beba o fume después de que hayas aclarado que estás tratando de cambiar, o de otra forma ridiculiza tus intentos de cuidar de ti mismo, puede ser el momento de distanciarte.

3. ¿Estás siendo manipulado?

Manipulación, fundamentalmente, es la gestión de las emociones de los demás, y no de una buena manera. Es malhumorado conseguir que alguien se sienta mal, es especialmente agradable mantequilla alguien.

Es muy difícil ponerse el dedo sobre si está o no ocurriendo, porque ser objetivo de la manipulación es como ser la rana proverbial en el agua que hierve lentamente - es sólo después de que usted está fuera que te das cuenta de todo el alcance de lo que estaba sucediendo.

Pero hay pistas: su amistad puede parecer innecesariamente complicada. Usted está en una pérdida de palabras cuando otros le preguntan acerca de la amistad. "Es complicado", es lo mejor que puedes reunir.

Otra pista: sin darse cuenta de ello, has cambiado para peor como resultado de esta amistad (menos feliz, menos seguro, menos seguro), pero de alguna manera eres el que siempre está haciendo las disculpas. O puede sentir que algo siempre está apagado. Incluso le pregunta a su amigo "¿qué pasa?" Pero la respuesta (o el tratamiento silencioso resultante) sólo te hace más confuso.

Cualquiera de estas pistas puede ser signos de manipulación emocional. De hecho, un estudio de 2016 sorprendentemente encontró que la manipulación colgaba junto con niveles más bajos de características importantes de la amistad como ser capaz de expresar pensamientos y sentimientos personales, proporcionar comodidad cuando era necesario, simplemente ser divertido estar con, y estar siempre allí el uno para el otro (que, Por cierto, en la investigación-hablar se llama "alianza confiable").

4. ¿Son amigos simplemente porque son similares a usted?

A veces forzamos una amistad cuando tenemos un fondo similar y vidas similares. Similaridad de alguna manera nos hace pensar que deberíamos ser amigos. Pero no importa si usted fue a la misma escuela primaria o se parece a escupir imágenes de uno a.

¿Qué es realmente importante? Bueno, un estudio de 2012 evaluó a más de 1.400 personas; Algunos de ellos tenían amistades con personas de distinta raza, orientación sexual o género, y algunos no lo hicieron. Aquellos con amistades entre categorías menos valoraron tener vidas, valores y experiencias similares como sus amigos. ¿En qué se enfocaron? Los verdaderos bloques de la amistad: la confianza, la honestidad, el respeto, y estar allí el uno para el otro.

5. ¿Haces todo el trabajo en la relación?

¿Alguno de estos le suena familiar? Usted justifica un comportamiento egoísta y desconsiderado: "Estoy seguro de que él quería limpiar el lío que dejó cuando pidió prestado mi coche, probablemente estaba ocupado". Usted inicia todas las ideas, hace todos los planes, y es responsable de cambiarlas si no son convenientes para su amigo: "Oh, ¿decidiste reunirte con una cita de Tinder esta noche? Um, seguro, podemos reprogramar." Y por último, haces todo el trabajo emocional: hablar de ellos, apuntalándolos: "Por supuesto que eres increíble, claro, hablemos de todas las maneras en las que oscuras.

Si estás haciendo todo el trabajo en la relación, eres un empleado, no un amigo. Es hora de considerar ir a la huelga.

6. ¿Puedes contar el uno con el otro?

Esto puede sonar cliché, pero es importante. Los amigos no deben ser como los auriculares de tu iPod - nunca cuando lo necesitas, pero enredarse en las cosas cuando no lo estás.

La investigación sobre la amistad está llena de palabras como "recíproco", "mutuo" y "compartido", y si ninguno de ellos viene a la mente cuando se piensa en una amistad en particular, podría ser el momento de retroceder.

De hecho, todas esas canciones de la noche de graduación sobre "estaré de tu lado para siempre" y "seré tu amigo, te ayudaré a seguir adelante", mientras que cursi, son más que balanceándose con los brazos alrededor de los hombros . Las buenas amistades representan un equilibrio de apoyo mutuo. Incluso las disimilitudes entre buenos amigos logran equilibrarse mutuamente.

Por supuesto, con el tiempo el equilibrio se desplazará hacia adelante y hacia atrás - inevitablemente tendrá una gran crisis de vida al mismo tiempo que su amigo recibe una promoción, pero buenos amigos están ahí para compartir sus éxitos y sus luchas. No tienes que unir los brazos y cantar, pero debes estar seguro de que en tu amistad, invierno, primavera, verano o otoño, todo lo que tienes que hacer es llamar.

7. ¿Puedes ser tú mismo?

Terminemos con el grande. No eres el mismo dondequiera que vayas: te comportas de manera diferente en una entrevista de trabajo o visitando a una abuela que cuando sales con tus amigos, pero si te sientes atraído para cambiar o ocultar quién eres, o te sientes avergonzado después de salir con tu Amigo, puede ser hora de probar otras amistades.

Para concluir, décadas de investigación y milenios de sentido común nos dicen que conectarnos con verdaderos amigos es una de las mejores cosas que podemos hacer por nuestra salud y felicidad.

Romper con amigos menos que verdaderos es una decisión difícil. De hecho, debe haber habido un momento en que usted era buenos amigos el uno al otro, o usted no estaría luchando con la pregunta para comenzar.

Ahora, los amigos vendrán y se irán de su vida. Algunos dependen del contexto, como un amigo de trabajo o un amigo de la escuela. Todo está bien. No todos los amigos necesitan ser un amigo y un confidente de las Chicas de Oro. Pero los verdaderos amigos no deben lastimar, manipular, o usar, o presionar a ser alguien que no eres. Un verdadero amigo te inspira a ser mejor, más feliz, más saludable y más "tú mismo".

domingo, 9 de abril de 2017

Interpretando la evolución de precios a través de una red de correlaciones

Características de la estructura de correlación de los índices de precios
Xiangyun Gao, Haizhong An y Weiqiong Zhong


PLoS One. 2013; 8(4): e61091.
Published online 2013 Apr 8. doi: 10.1371/journal.pone.0061091

Resumen
¿Cuáles son las características de la estructura de correlación de los índices de precios? Para responder a esta pregunta, se seleccionaron como datos de muestra 5 tipos de índices de precios, incluyendo 195 índices de precios específicos de 2003 a 2011. Para construir una red ponderada de índices de precios cada índice de precios está representado por un vértice, y una correlación positiva entre dos índices de precios está representada por una arista. Estudiamos las características de la estructura de red ponderada aplicando la teoría económica al análisis de parámetros de red complejos. Se encontró que la frecuencia de los índices de precios sigue una distribución normal contando los grados ponderados de los nodos e identificamos los índices de precios que tienen un impacto importante en la estructura de la red. Encontramos grupos pequeños en la red ponderada por los métodos de k-core y k-plex. Descubrimos huecos de estructura en la red calculando la jerarquía de los nodos. Finalmente, encontramos que la red ponderada de índices de precios tiene un efecto de pequeño mundo calculando el camino más corto. Estos resultados proporcionan una base científica para las políticas de control macroeconómico.

Introducción

Los índices de precios son indicadores importantes para medir la inflación y el desarrollo económico. El gobierno influye en los precios de los productos básicos por una variedad de políticas reguladoras para mantener la estabilidad del mercado. Los índices de precios incluyen el índice de precios al consumidor (IPC) de los residentes, el índice de precios al productor (IPP), el índice de precios al por menor (RPI), el índice de precios de la producción agrícola y del material de producción agrícola y las materias primas, Índice de precios de compra (RFPPI) [1] - [9]. Estos 5 tipos de índices de precios se dividen en muchos índices de precios específicos. Por ejemplo, en China, el IPC se clasifica en ocho categorías: alimentos, tabaco y licor, ropa, equipo y servicios domésticos, productos de salud y personales, transporte y comunicaciones, entretenimiento y productos educativos y servicios y vivienda. Estos 5 tipos de índices de precios se obtienen calculando índices de precios específicos con pesos. Por lo tanto, en comparación con el IPC, PPI, RPI, API y RFPPI, los índices de precios específicos reflejan más directamente los cambios en los precios de los productos básicos. Por esta razón, estudiamos índices de precios específicos en lugar de estos 5 tipos de índices de precios.

Hay relaciones entre los índices de precios que se han encontrado en la investigación anterior. Modelos y métodos de econometría se aplican para probar que hay relaciones causales [4], relaciones de cointegración [5], relaciones interactivas [10] y relaciones de transmisión [11] - [13] entre los 5 índices de precios. Estas relaciones se basan en la correlación entre los índices de precios [14]. Sin embargo, hay muchos índices de precios específicos para cada tipo, entre los que las relaciones desconcertantes forman una red complicada [15] - [17]. En esta red de índices de precios, ¿cuáles índices de precios tienen un mayor impacto? ¿Cómo se afectan entre sí? Cuando uno de ellos cambia, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? ¿Hasta dónde puede llegar el proceso de transmisión y cuál es el camino de transmisión? Debido a que los modelos econométricos tradicionales no pueden incluir tantos índices de precios, si lo hacemos, el modelo será demasiado difícil de usar [14]. Para responder a las 4 preguntas anteriores, primero debemos averiguar las características de la estructura de relación entre los índices de precios. La teoría de la red compleja puede resolver eficazmente los problemas relativos a las características de la estructura de la relación. El concepto central de teoría de red compleja es ver la relación entre las variables en el sistema real como una red compleja, describir la relación entre las variables en el sistema complejo real en forma de red y obtener una mejor comprensión de Su naturaleza analizando la estructura del sistema [18] - [20]. Esta teoría proporciona un enfoque adecuado para analizar cuantitativamente el comportamiento de las redes complejas en el sistema económico, como el fenómeno del mundo pequeño [16], [21]. La diversidad de las relaciones de los individuos está fuertemente correlacionada con el desarrollo económico de las comunidades [22]. Los investigadores han analizado las relaciones de los individuos entre los índices bursátiles basados ​​en la red de correlación. Descubrieron las características de la volatilidad y las existencias dominantes en los índices bursátiles [23], [24], [25]. En el sistema económico, cientos de índices de precios interactúan y se afectan entre sí, y la estructura de correlación forma una red compleja. Así, podemos analizar la estructura de correlación por la teoría de la red compleja.

Materiales y métodos

Materiales

En el presente estudio se recopilaron datos sobre índices de precios específicos de 2003 a 2011 del país en desarrollo China (Anuario Estadístico de China, 2003-2011). Se utilizaron los datos de los cinco tipos de índices de precios siguientes: IPC, RPI, API, PPI y RFPPI. Cada índice de precios se divide en índices de precios específicos, con un total de 195 índices. Los principales elementos de los diversos tipos de índices de precios se muestran en el cuadro 1, por ejemplo, el índice de precios de los alimentos incluye un índice de precios de los alimentos, un índice de precios del petróleo, un índice de precios de carne y aves, Índices de precios.

Tabla 1

Principales elementos de los índices de precios.
Tipo de índice de preciosElementos principales
Índice de Precios al Consumidor (CPI)Alimentos, Tabaco, Licor y Artículos, Vestuario, Instalaciones Domésticas, Artículos y Servicios, Cuidado de la Salud y Artículos Personales, Transporte y Comunicación, Recreación, Educación y Cultura Artículos, Residencia, et al.
Índice de precios al por menor (RPI)Bebidas, Tabaco y Licor, Ropa, Calzado y Sombreros, Textiles, Electrodomésticos, Equipo de Música y Video, Instrumentos Musicales y de Oficina, Artículos de Uso Diario, Artículos de Deportes y Recreación, Plata y Joyería, Medicina Tradicional China y Occidental y Artículos de Salud, Libros, Periódicos, Revistas y Publicaciones Electrónicas, Combustibles, Materiales de Construcción y Ferretería, et al.
Índice de precios al productor de bienes manufacturados (PPI)Industria metalúrgica, industria del petróleo, electrodomésticos, equipo de música y video, industria de fabricación de máquinas, industria de materiales de construcción, industria maderera, industria alimentaria, industria textil, industria de la confección, industria del cuero, industria del papel, Artículos Educativos y Artesanales, et al.
Índice de Precios de Productos Agrícolas y Índice de Precios de Material Productivo Agrícola (API)Fertilizantes Químicos, Fertilizantes Químicos, Plaguicidas y sus Aparatos, Petróleo para Maquinaria Agrícola, Otros Productos de la Ganadería, Productos de la Pesca, Productos Farmacéuticos Medios de Producción Agrícola, Servicio de Producción Agrícola, et al.
Índice de precios de compra de materias primas, combustible y energía (RFPPI)Combustible y energía, Metales ferrosos, Metales no ferrosos, Materias primas químicas, Electrodomésticos, Equipo de música y video, Materiales de construcción, Productos agrícolas, Materiales textiles, et al.

Redes ponderadas de índices de precios

Para estudiar las características de la estructura de correlación de índices de precios específicos, primero debemos establecer la red ponderada por el índice de precios (PIWN) por la teoría de redes complejas. Una red es una colección de nodos y enlaces, N = (V, E). Representamos cada índice de precios como un vértice, y representamos la relación entre dos índices de precios como un borde en la red; Por lo tanto, volvimos el estudio de la estructura de correlación de los índices de precios en un estudio de una compleja red de correlaciones de precios.

El conjunto de vértices V en la red compleja de correlaciones de índices de precios se expresa como

equation image      (1)

Donde vi representa el i-ésimo índice de precios.

El conjunto de nodos E en la red compleja de correlaciones de índices de precios se expresa como

equation image       (2)

Donde e(i, j) representa la relación entre el i-ésimo índice de precios y el j-ésimo índice de precios.

En el curso de este estudio, se intentó definir y cuantificar la relevancia de la red. Cuantificamos el enla ce e(i, j)  y usamos el coeficiente de correlación rij para representar el grado de correlación entre el i-ésimo índice de precios y el j-ésimo índice de precios. El coeficiente de correlación, también conocido como el coeficiente de correlación de Pearson, es un indicador que mide el grado de correlación entre las tendencias cambiantes de las variables, con un rango de [-1,1]. Cuanto mayor sea el valor absoluto del coeficiente de correlación, mayor será el grado de correlación entre las variables.

equation image          (3)

Donde im es el valor de la serie temporal del i-ésimo índice de precios, un archivo externo que An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e004.jpg es el valor promedio de la serie temporal del i-ésimo índice de precios,  jes el valor de la serie temporal del índice de precios j-th, An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e005.jpg es el valor medio de la serie temporal del índice de precios j-ésimo, y s es el número de elementos de la serie de índices de precios.

Así, la matriz de coeficientes de correlación del índice de precios R se forma como

equation image           (4)

Si todos los coeficientes de correlación se reflejan en la red con pesos, entonces la red está completamente conectada y no está disponible para el análisis de topología. Además, para establecer con mayor exactitud la relación y la estructura entre los índices de precios, debemos eliminar las correlaciones débiles y las no correlaciones estableciendo un umbral. El PIWN es una red basada en umbrales, y como todas las redes basadas en umbral, es muy sensible al valor del umbral. Los bordes cuyo peso sea menor que el valor umbral pueden omitirse [23], [24]. A medida que el umbral aumenta, la red se vuelve más informativa sobre la estructura de correlación parcial del sistema, pero la selección de correlación parcial podría verse afectada por la incertidumbre estadística. No se supone que el valor de umbral sea demasiado bajo. En las redes económicas, el umbral suele establecerse por encima de 0,7 [23], [25].

Las propiedades topológicas y métricas del PIWN dependen fuertemente del valor del coeficiente de correlación r. Para seleccionar un valor adecuado para r, iterativamente elegir diferentes valores de este coeficiente de correlación y calcular la suma de los pesos de todos los bordes en el PIWN resultante. Representamos esta cantidad como E (r).

Para r = 0,7, tenemos E (0,7) = 3734. Presentamos la fracción An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e007.jpg como una función de r. Además, realizamos un análisis similar para el tamaño del componente conectado más grande de la red, dependiendo del valor de r. Se indica el número total de vértices en la mayor componente conectada de la PIWN para un r dado con V (r). En la figura 1, mostramos la cantidad An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e008.jpg, donde r = 0,82 es el punto de ruptura. Por lo tanto, elegimos 0,82 como nuestro valor umbral para el tamaño de un gran componente conectado y no trivial topológica y métrica propiedades de la red resultante índice de precios [24]. Si el coeficiente de correlación entre dos índices de precios no es inferior a 0,82, entonces hay una ventaja entre ellos. El valor del coeficiente de correlación entre dos índices de precios se establece como el peso del borde. Así, construimos un modelo de estructura de red compleja y ponderada de fuertes correlaciones de índices de precios, como se muestra en la Figura 2.

Dos medidas de conectividad PIWN en función del parámetro r.
El valor r = 0,82 es la medida utilizada en este trabajo.

Red compleja de correlaciones fuertes de índices de precios.
Los 4 nodos azules son nodos aislados que no tienen una fuerte correlación con otros nodos.





Resultados

Las 4 preguntas sobre el PIWN mencionadas anteriormente son manejadas por el método de análisis paramétrico de red compleja, incluyendo el grado ponderado, k-core, k-plex, la jerarquía de los agujeros estructurales y el camino más corto.

Índices de precios clave

¿Qué índices de precios tienen un mayor impacto? Para responder a esta pregunta, debemos encontrar los índices clave de precios en el PIWN. Los índices clave de precios son los indicadores que tienen un impacto muy alto en el PIWN; Cuanto mayor sea el grado ponderado de un nodo, más amplio será su impacto. En los sistemas económicos, cuanto más amplio es el impacto de un índice, más importante es en la red. Por lo tanto, podemos encontrar índices clave de precios en el PIWN calculando el grado ponderado de los nodos. El grado ponderado de un nodo es la suma de todos los valores ponderados de sus bordes. Esta suma no sólo incluye el número de índices de precios relacionados con el nodo sino que también considera el grado de sus correlaciones. El grado ponderado WDi de un índice de precios (vértice) i se define como

equation image                       (5)

Donde r es el valor del coeficiente de correlación entre los vértices i y los vértices j. En la figura 2, cuanto mayor sea el valor, mayor será el nodo en la red.

Nuestro experimento incluye 191 nodos y 1.795 enlaces en el PIWN. Se calculó el grado ponderado de los 191 nodos, se reflejó a nivel macro, y se encontró que, en toda la estructura de la red de correlación de índices de precios, el grado de influencia del PPI es el más amplio. Así, a nivel macro, PPI es el índice de precios clave. El IPP se refiere al índice de precios al productor en China. En estudios sobre la relación de transmisión de precios en la cadena industrial, muchos estudiosos creen que el PPI puede usarse para representar el nivel de precios en la cadena de transmisión de la industria. En segundo lugar, el grado de influencia del IPC es del 24%, y este índice puede utilizarse en lugar del precio descendente en la cadena de transmisión de la industria. Los resultados muestran que el IBP tiene un mayor impacto en la tasa de inflación que el IPC. Los resultados de otros estudios también apoyan esta conclusión. Utilizando el análisis empírico, el mecanismo de transmisión del precio de producción al precio al consumidor es más importante que el mecanismo de transmisión del precio al consumidor al precio de producción [11]. En general, las fluctuaciones del nivel general de precios aparecen en primer lugar en la zona de producción y, a partir de ahí, se extienden por las cadenas industriales hasta las industrias posteriores y, finalmente, a los bienes de consumo [12]. Por lo tanto, para controlar la tasa de inflación en China, el primero de la cadena industrial se puede considerar en primer lugar. Los resultados también muestran que el grado de influencia de la API es hasta un 15%. China es un país agrícola; Por lo tanto, no debe subestimarse el impacto del nivel de precios de la producción agrícola y su impacto en otras industrias. Especialmente en los países en desarrollo, el aumento de los costos básicos de vida de las personas a menudo tiene una serie de consecuencias, como la reciente "inflación porcina" en China. Tres tipos de índices de precios, el IPP, el IPC y el API, cubren el 80% del grado de influencia. Las estadísticas de la correlación entre los índices de precios macro se muestran en la Tabla 2, y la proporción de cada índice se muestra en la Figura 3.

Proporciones de índices de precios macro con relaciones de correlación.





Tabla 2

Grado ponderado de los índice de precios macro.
Tipo de índide de preciosGrado ponderado
PPI1286.29
CPI787.21
API496.98
RPI463.55
RFPPI182.89
En la Tabla S1, proporcionamos todos los valores del grado ponderado del índice de precios. Hay sólo un pequeño número de índices de precios clave en el PIWN. Sólo 3 índices clave de precios tienen grados de ponderación superiores a 40. En el cuadro 3 se muestra el valor del grado ponderado del índice de precios (top 10). Este cuadro muestra que, en el sistema de índices de precios, sólo unos pocos índices de precios Tienen impactos mayores de 40. Los cambios en estos índices clave de precios darán lugar a fluctuaciones en los otros índices de precios y conducirán a algún fenómeno económico de todo el sistema. Por ejemplo, China es el país más poblado del mundo. El costo de vida del pueblo ocupa un lugar central en su desarrollo económico; Como resultado, las fluctuaciones en la vida cotidiana y la venta al por menor, los índices de precios al consumidor son a menudo la causa de la inflación [26].

Tabla 3

El valor del grado ponderado del índice de precios (top 10).
RangoTipo de índice de preciosGrado ponderado
1RPI(Rural Household)42.19
2PPI(Articles for Daily Use)41.70
3RPI40.59
4PPI(Manufacture of General Purpose Machinery)39.92
5RPI(Urban Household)39.64
6CPI(Rural Household)39.14
7PPI(Manufacture of Special Purpose Machinery)39.00
8PPI(Manufacture of Artwork and Other Manufacturing)38.63
9RPI(Building Materials and Hardware)38.58
10PPI(Consumer Goods)37.62
Encontramos que hay hasta 41 grados ponderados cuyo valor es inferior a 4,8. En la figura 2, los nodos en la parte escasa de la estructura de la red son pequeños, lo que significa que tienen menos impacto en comparación con otros índices de precios y permanecen en estados relativamente independientes. Al analizar los índices de precios con grados ponderados entre 4,8 y 44,8, encontramos que siguen una distribución normal, como se muestra en la Figura 4. Los papeles principales del sistema de índices de precios están ocupados por los índices medios, índices de precios con grados ponderados entre 8,8 y 32,8. Estos resultados pueden usarse como una referencia para decidir las direcciones claves para la regulación de la inflación en China. Sin embargo, en el PIWN general, hay algunos grupos de grupos relativamente independientes y un medio de transmisión entre los índices de precios que deben estudiarse más.


Figura 4
Distribución del índice de precios



Agrupamientos de grupos de precios

¿Cómo se afectan los índices de precios entre ellos? Para responder a esta pregunta, debemos estudiar los grupos de grupo en el PIWN. Los clusters de grupos son sub-redes en las que los índices de precios tienen fuertes correlaciones. En un sistema económico real, muchos índices de precios de los productos básicos interactúan entre sí. Los cambios en un índice de precios tienden a impulsar cambios en otro índice de precios; Existe una relación mutuamente fuerte entre estos índices de precios. Como se observa en la Figura 2, toda la red incluye algunos pequeños grupos de grupos de red, que están en un estado relativamente independiente. Descubrimos que los grupos de índices de precios pueden ayudarnos a comprender las características de la estructura de correlación de los índices de precios y proporcionar mejores referencias para el control de las políticas. El k-plex y el método k-core se basan en el descubrimiento de grados de vértice en subgrupos; Son útiles para identificar pequeños grupos de clusters en la estructura de red del índice de precios. Utilizando el método de descubrimiento de subgrupos, se aprovechan los clústeres de grupos en el índice de precios, lo que puede ayudar al intentar comprender qué otros índices cambian cuando cambia un índice de precios específico.

El método k-plex requiere que cada vértice de los g vértices que están incluidos en un subgrupo mantiene al menos g-k enlaces con otros vértices en el mismo subgrupo, donde k es un coeficiente de ajuste; Cuanto menor sea el valor de k, mayor será el valor de g. Además, cuanto más exigentes sean las condiciones, más estrecha será la relación entre los vértices. El método k-core se refiere a un subgrafo con las siguientes condiciones: los puntos en el subgrafo son al menos adyacentes a k otros puntos en el subgrafo. El método k-plex requiere que, además del punto k, los puntos estén conectados con al menos un punto fuera de los k puntos, mientras que el método k-core requiere que cada punto esté conectado a al menos k puntos.

Primero, use el método k-core para encontrar k-core en el PIWN. Los resultados experimentales muestran que hay 18 grupos de grupos (Figura 5 muestra diferentes colores que representan diferentes k-núcleos). Hay siete grupos con escalas de vértices de no menos de 10 (la escala de vértices representa el número de índices de precios en un grupo de grupos), como se muestra en la Figura 6. Los clusters de grupos más grandes contienen 42 índices de precios. Como se muestra en la Figura 5, hay 3 agrupaciones de grupos grandes en el PIWN, incluyendo el 43% de los índices de precios y el 54% de las correlaciones. Estos grupos de 3 grupos están en posiciones significativas; Cualquier índice de precios en los cambios del grupo de clusters despertará cambios en los otros y dará lugar a cambios en el conjunto. Así, el gobierno podría controlar la fluctuación en los índices de precios mediante una regulación dispersa para mantener la estabilidad de todo el sistema.

Figura 5
El k-núcleo en la estructura de redes de correlación del índice de precios.
La clase de agrupamiento de grupo es mostrado en la Tabla S2.


Figura 6
Un archivo externo que contiene una imagen, ilustración, etc.

La escala de vértices k-núcleo en la estructura de la red de correlación de índices de precios.

Posteriormente, el método k-plex se utiliza para buscar clusters de grupo en el PIWN bajo las condiciones más exigentes ajustando el valor de k y la escala de vértices. En el experimento, ponemos la escala de vértices a g = 17 y el coeficiente de ajuste a k = 2, y solo se encuentran 2 grupos de grupos. Los grupos de 2 grupos son colecciones de índices de precios que tienen las correlaciones más estrechas en toda la estructura de la red, como se muestra en la Figura 7. Los vértices rojos y los vértices azules representan dos grupos de racimos y los vértices negros son los índices comunes de precios para estos dos grupos de grupos . Como se observa en la Figura 7, los índices comunes de precios son todos los índices de precios macroeconómicos que se componen del IPC, el IPR y el API. De los elementos constitutivos de los 2 grupos de grupos, podemos encontrar que, en el PIWN, hay 2 grupos de grupos con estrechas correlaciones; Un grupo comprende los índices de precios de los alimentos y el otro grupo comprende los índices de precios de los bienes de consumo del PPI. Estos dos grupos de clusters tienen fuertes relaciones positivas con los índices de precios macro, lo que significa que es eficaz para China para regular y estabilizar los mercados de precios a través de los alimentos y los índices de precios aguas arriba en la red.

Figura 7
Agrupamientos de grupos de precios.

g = 17, k = 2.

Medio de transmisión

Cuando cambia uno de los índices de precios, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? Para responder a esta pregunta, debemos analizar el intermediario de cada índice de precios en el PIWN. En los sistemas económicos, la fluctuación de cualquier precio de las materias primas puede causar cambios en los precios de otras materias primas, y esta fluctuación es transitiva. Este efecto de transmisión se basa en las correlaciones entre los precios de los productos básicos. Al igual que controlar la propagación de un virus, no sólo debemos controlar la fuente del virus sino también detener la transmisión eliminando el medio de masa. En un sistema económico, el índice de precios en la estructura de la red actúa no sólo como fuente y receptor del proceso de transmisión sino también como medio. Diferentes índices de precios tienen diferentes niveles de efectos medios. Podríamos controlar la transmisión de fluctuaciones entre índices de precios mediante el control de los medios, para evitar la influencia de todo el sistema.

Para buscar el índice de precios que desempeña el papel de intermediario, debemos analizar la jerarquía de los agujeros estructurales para cada índice de precios en el PIWN. La presencia de agujeros estructurales hace que el índice de precios que ocupa la posición intermedia sea un enlace importante. Los agujeros estructurales controlan en gran medida la transferencia de fluctuaciones en el índice de precios. Al medir el nivel de los agujeros estructurales y calcular la jerarquía de los agujeros estructurales para cada índice de precios en la estructura de la red, una jerarquía más alta significa que el índice de precios es más importante en el proceso de transferencia. La formulación de índices de precios i en el cálculo de la jerarquía de estructuras de red es

equation image          (6)

Donde N es el número de vértices en la red individual de vértices (índice de precios) i,  C/N es el valor medio de la restricción en cada nodo y la restricción de nodos Cij es el grado en que los nodos de la red tienen la capacidad de uso de huecos estructurales. La ecuación relevante puede expresarse como

equation image         (7)
Donde  piq es la parte de las relaciones de los vértices j en comparación con todas las relaciones de los vértices i.

Mediante el cálculo de la jerarquía de los agujeros estructurales de cada índice de precios (véase el cuadro S3), la jerarquía de los agujeros estructurales de los índices de precios con un grado de influencia no inferior a 10 (grado ponderado> = 10) Los principales índices de precios son índices de tipo PPI, lo que significa que, en el PIWN, el PPI tiene fuertes efectos de transmisión; Sin embargo, los índices de precios de los alimentos y los medios impresos en el índice de precios al productor tienen efectos de transmisión más fuertes, con un grado de influencia de más de 25. Por lo tanto, para moderar la fluctuación de los índices de precios de los productos básicos es importante regular y controlar estos precios Con fuertes efectos de transmisión. Los resultados del experimento muestran que los índices de precios con una jerarquía de agujeros estructurales de más de 0,02 tienen un grado de influencia inferior a 8. Estos resultados muestran que, aunque algunos índices de precios en la estructura de la red tienen un pequeño grado de influencia, Desempeñan un papel importante en la transmisión de las fluctuaciones de los precios. Al mismo tiempo, encontramos que las fluctuaciones de precios entre grupos de clusters se llevan a cabo por sus índices de precios mutuos. Como se muestra en la Figura 6, los nodos negros son medios conductores de 2 grupos de grupos.

Tabla 4

Jerarquía de los hoyos estructurales de los indices de precios con un grado de influencia no menor a 10 (top 10 de los indices de precios).
RangoTipo de índice de preciosGrado ponderadoJerarquía
1CPI(Touring and Outing)13.050.01843
2PPI(Processing of Food from Agricultural Products)28.770.01412
3PPI(Food)32.700.01405
4PPI(Printing, Reproduction of Recording Media)27.840.01378
5RPI(Furniture)27.790.01312
6PPI(Food Industry)30.130.01269
7CPI(Intercity Traffic Fare)11.430.01253
8CPI(Transportation)11.380.01253
9API36.180.01242
10PPI(Raw Materials Industry)26.430.01236

Distancia de transmisión y trayectoria

Cuando uno de los índices de precios cambia, hasta dónde puede llegar el proceso de transmisión, y cuál es el camino de transmisión? Para responder a esta pregunta, debemos conocer la distancia de transmisión más corta entre los índices de precios. La distancia de transmisión más corta en el PIWN se puede determinar calculando el trayecto más corto. Esta distancia se puede definir como el número mínimo de bordes a través del cual pasan los dos índices de precios en la estructura de la red. Cuando un índice de precios cambia, podemos medir la distancia de impacto más larga calculando el trayecto más corto entre este índice de precios y otros. Además, podríamos conocer la distancia de impacto de todo el sistema de índices de precios al encontrar la trayectoria media más corta del PIWN. Por lo tanto, cuando un índice de precios cambia, podríamos saber qué índice de precios se verá afectado a continuación.

Como se muestra en la Figura 8, las distancias de transmisión de los índices de precios siguen una distribución normal. Una distancia de 1 significa que los dos índices de precios en el PIWN están conectados directamente. Los cambios en cualquiera de los índices de precios afectarán al otro. Se considera que la distancia de impacto es 1. Una distancia de 2 significa que los dos índices de precios están conectados por otro índice de precios (conectado indirectamente). Así, la distancia de impacto se expande a 2. Después de continuar de esta manera, la Figura 8 muestra que las distancias de transmisión de los índices de precios se concentran entre 2 y 4. Así, generalmente las distancias de transmisión de la mayoría de los índices de precios son 2-4 , Lo que significa que, cuando un índice de precios cambia, sólo 2-4 distancias son necesarias para afectar a la mayoría. La distancia de transmisión de fluctuación más larga es de 9 en el PIWN, lo que significa que, cuando cambia un determinado índice de precios, el sistema de índice de precios se verá afectado a una distancia de 9. La longitud de trayecto más corta promedio es 2,55. El índice de cohesión de la estructura de red basado en "distancia" es 0.953. Por lo tanto, la transmisión entre los índices de precios en la estructura de la red es relativamente rápida, tiene un efecto de pequeño mundo, y, en promedio, puede ser completado por un índice de precios. Los resultados también muestran que, en la inflación real, un vértice a menudo tiene un impacto en todos los precios de las materias primas antes de tomar medidas de control efectivas.

Figura 8
Distancia más corta y frecuencia entre los índices de precios.

Después de una distribución normal con un nivel de confianza de 0,78.

Analizamos los caminos en el PIWN y encontramos la trayectoria de transmisión basada en los pesos de los bordes. Tomando el IPR como ejemplo (el valor de su grado ponderado es el más grande), cuando el IPR cambia, el nodo más correlacionado es CPI, y el nodo más correlacionado con IPC es IPC (Hogar Urbano). Siguiendo este proceso, podríamos encontrar otros nodos. De acuerdo con el camino más corto que hemos obtenido anteriormente, la distancia de transmisión más larga es 9; Como resultado, cuando encontramos el 10mo nodo, el RPI (Casa Rural) ya había afectado a todo el sistema. La trayectoria de transmisión del RPI (Casa Rural) se muestra en la Figura 9, con las correlaciones entre los índices de precios (pesos de los bordes) por encima de 0.96. Por supuesto, sólo habíamos considerado el camino con las correlaciones más fuertes. En realidad, los nodos de la trayectoria de transmisión pasarán la fluctuación a otros nodos. Podríamos utilizar el mismo método para encontrar todos los caminos de transmisión y luego conocer más completamente el proceso de transmisión de los índices de precios.

Figura 9

Senderos de transmisión de RPI (Rural Household) con las correlaciones más fuertes.

Discusiones y conclusiones

Este artículo analiza las características de la estructura de correlación de los índices de precios por los métodos que implican redes complejas. Teóricamente, consideramos las relaciones entre muchos factores y realizamos la investigación con una visión estructurada, mientras que la econometría tradicional sólo puede analizar las relaciones entre algunos factores. En la práctica, este enfoque podría ayudarnos a conocer más sobre las interacciones de los índices de precios analizando las características de la estructura de correlación. Este análisis no sólo nos muestra los principios de las interacciones de los índices de precios en el sistema económico sino que también nos proporciona pruebas efectivas de las políticas de control macroeconómico para el gobierno. Encontrar los índices clave de precios podría hacernos conscientes de qué objeto de control es el objetivo clave; El análisis de los grupos de grupos podría mostrarnos las influencias entre los índices de precios, y luego, podríamos sugerir al gobierno cómo estabilizar el precio de mercado regulando escasamente. Analizar el medio de transmisión nos muestra el nivel medio de cada índice de precios, y el gobierno podría evitar la expansión de las fluctuaciones mediante el control de los medios. Medir la distancia de transmisión y descubrir el camino nos indica la escala de impacto y su trayectoria de transmisión cuando hay fluctuaciones en los índices de precios; Estas rutas de transmisión proporcionan referencias cuando se hacen políticas de advertencia.

Un tema que debe investigarse más es cómo estudiar las relaciones que involucran muchas variables si el número de factores que afectan en un sistema económico continúa aumentando; Hay cientos o incluso miles de factores que interactúan entre sí. Como se muestra en la revisión bibliográfica, la mayoría de los estudios sobre la relación entre variables usan teorías y métodos de econometría como regresiones lineales, pruebas de causalidad y pruebas de cointegración. Sin embargo, el propósito de estos modelos econométricos no es incluir todas las variables; En cambio, el propósito es incluir sólo los factores más significativos. Si se introducen demasiadas variables, entonces el modelo será demasiado complejo y la investigación perderá sentido. El número de objetos incluidos en los métodos econométricos tradicionales es dos; Incluso si hay múltiples variables, el análisis se realiza con sólo dos variables. Además, muchos de los objetos incluidos son macroscópicos. Por lo tanto, es fácil ignorar las variables de nivel micro. Estas variables tienen correlaciones e influencia, e interactúan entre sí para formar un complicado sistema de relaciones. Los cambios macroscópicos son causados ​​por cambios en la complejidad de estas variables. Las investigaciones existentes rara vez abordan estas cuestiones. La teoría de red compleja proporciona una buena base para abordar el problema de la complejidad. Las relaciones entre las variables se resumen en los vértices y los bordes de la red, aplicando la investigación sobre la relación entre las numerosas variables en la red. El complejo método de análisis de red proporciona una gama de parámetros y puede combinarse con teorías económicas y métodos analíticos para estudiar problemas complejos en el sistema de índices de precios y el sistema financiero e incluso en el sistema económico.

Al construir el modelo de estructura de la red de correlación de índices de precios, el método no sólo puede utilizarse para estudiar la estructura de correlación de los índices de precios, sino también para otros campos, como el análisis de la correlación entre diversos elementos de los mercados de productos básicos, De los vínculos de precios de las acciones en los mercados financieros, de la investigación sobre las relaciones insumo-producto en las cadenas industriales y de la investigación sobre las relaciones de correlación entre los diversos índices económicos nacionales. Estas cuestiones involucran más variables y relaciones más complejas. Otras investigaciones deberían tener como objetivo definir relaciones complejas entre más variables y combinar métodos de análisis cualitativos y cuantitativos.


Referencias

1. Lebow DE, Rudd JB (2006) Inflation measurement. Finance and economics discussion series divisions of research & statistics and monetary affairs. Federal Reserve Board, Washington, D.C. 1–17
2. Alchian AA, Klein B (1973) On a correct measure of inflation. Journal of Money, Credit and Banking 5: 173–191
3. Mankiw NG, Reis R (2003) What measure of infaltion should a central bank target?. Journal of the European Economic Association 1: 1058–1086
4. Silver JL, Wallace D (1980) The lag relationship between wholesale and consumer prices. Journal of Econometrics 12: 375–387
5. Mahdavi S, Zhou S (1997) Gold and commodity prices as leading indicators of inflation: tests of long-run relationship and predictive performance. Journal of Economics and Business 49: 475–489
6. Kyrtsou C, Labys W (2006) Evidence for chaotic dependence between US inflation and commodity prices. Journal of Macroeconomics 28: 256–266
7. Blomberg SB, Harris ES (1995) The commodity-consumer price connection: fact or fable?. Economic Policy Review 1: 21–38
8. Doroodian K, Boyd R (2003) The linkage between oil price shocks and economic growth with inflation in the presence of technological advances: a CGE model. Energy Policy 31: 989–1006
9. Johnson GD, Song G (1998) Inflation and the Real Price of Grain in China. Chinese Economies Research Center, Working Paper, University of Adelaide.
10. Kadeřábek P (2007) A simple model of interaction between CPI and PPI: Application to monthly data of EU countries. Politická ekonomie 55: 226–244
11. Cushing MJ (1990) Freedback between Whosale and Consumer Price Inflation: A reexamination of the evidence. Southern Economic Journal 56: 1059–1072
12. Clark TE (1995) Do producer prices lead consumer prices?. Economic Review QIII 25–39
13. Weinhagen J (2005) Price transmission within the PPI for intermediate goods. Monthly Labor Review 5: 41–49
14. Gujarati DN, Porter DC (2010) Essentials of Econometrics, 4th edition. McGraw Hill Higher Education.
15. Peazzo RPJ, Reich SL, Schvarzer J, Virasoro MA (1995) Inflation and relaxation to equilibrium in a complex economic-system. Chaos Solitions & Fractals 6: 455–470
16. Schweitzer F, Fagiolo G, Sornette D, Vega-Redondo F, Vespignani A, et al. (2009) Economic Networks: The New Challenges. Science 325: 422–425 [PubMed]
17. Elgazzar AS (2003) Applications of small-world networks to some socio-economic systems. Physica A: Statistical Mechanics and its Applications 324: 402–407
18. Watts DJ, Strogatz SH (1998) Collective dynamics of ‘small-world’ networks. Nature 393: 440–442 [PubMed]
19. Newman MEJ, Watts DJ (1999) Renormalization group analysis of the small-world network model. Physics Letters A 263: 341–346
20. Barabási AL, Albert R (1999) Emergence of Scaling in Random Networks. Science 286: 509–512 [PubMed]
21. Latora V, Marchiori M (2003) Economic small-world behavior in weighted networks. The European Physical Journal B 32: 249–263
22. Eagle N, Macy M, Claxton R (2010) Network Diversity and Economic Development. Science 328: 1029–1031 [PubMed]
23. Liu XF, Tse CK (2012) A complex network perspective of world stock markets : synchronization and volatility. International Journal of Bifurcation and Chaos 22: 1250142
24. Kenett DY, Tumminello M, Madi A, Gur-Gershgoren G, Mantegna RN, et al. (2010) Dominating clasp of the financial sector revealed by partial correlation analysis of the stock market. PLoS ONE 5: e15032. [PMC free article] [PubMed]
25. Tse CK, Liu J, Lau FC (2010) A network perspective of the stock market. Journal of Empirical Finance 17: 659–667
26. He LP, Liu QW (2011) Causes of Inflation in China: Inflation Expectations. China & World Economy 19: 18–32

sábado, 8 de abril de 2017

Redes de correlación en Biología

Super interesante uso de las redes para interpretación de correlaciones...
Análisis y visualización de datos biológicos de alta dimensión
Creative Data Solutions


Los datos biológicos de alta dimensión comparten muchas cualidades con otras formas de datos. Normalmente es amplia (variables << variables), complicada por el diseño experiencial y compuesta de relaciones complejas impulsadas por fuentes biológicas y analíticas de varianza. Por suerte, la potente combinación de R, Cytoscape (<v3) y el paquete R RCytoscape puede usarse para generar representaciones altamente dimensionales y altamente informativas de datos biológicos complejos (y realmente cualquier tipo de ellos). Se puede comprobst los siguientes ejemplos de mapeo de red en acción o vea una presentación más detallada de las técnicas utilizadas a continuación.


Red de correlación parcial que resalta los cambios en el tumor en comparación con el tejido de control del mismo paciente.

Red de tejidos de cáncer


Red de similitud bioquímica y estructural de los cambios en el tumor en comparación con el tejido de control del mismo paciente.

Red de tejido de cáncer


Clústeres jerárquicos (color) mapeados a una red de similitud bioquímica y estructural que muestra la diferencia antes y después de la administración del fármaco.

 Red de jarabe para la tos


Red de correlación parcial que muestra cambios en las relaciones de los metabolitos en respuesta al tratamiento farmacológico.

Red de respuesta al tratamiento



Red de correlación parcial que muestra los cambios en la enfermedad y la respuesta al tratamiento farmacológico.

viernes, 7 de abril de 2017

Enorme red visualizada en Gephi

Visualización de una enorme red en Gephi
Por Jindrich Karasek




El sitio web de la página web checa de Aukro.
En realidad, sólo el 42% de ella. Ya que es bastante dinámico, tuve que abortar la recolección de datos para no causar ningún daño al servidor.
Consiste en 400 mil nodos, representando el artículo en venta. Conectado por más de 3 millones de enlaces, representando enlaces entre los elementos y otras partes del frente del sitio web.
La forma de araña tomó aproximadamente 40 horas de renderización, la transformación de los datos tomó un par horas y hasta ahora el más grande que procesé en un archivo usando #Gephi


lunes, 3 de abril de 2017

Hashtag #istandwithceu

#istandwithceu

Center for Network Research


Red de opinión Twitter del hashtag #istandwithceu, creado por Milán Janosov y Balázs Vedres. Haga clic en la imagen para abrir PDF.



Recopilamos todos los tweets que contienen el hashtag #IstandwithCEU, usando la API oficial de Twitter, ya que la primera apariencia de la etiqueta hash de #IstandwithCEU. Basándonos en los primeros diez mil tweets con la etiqueta, creamos una red de los hashtags adicionales más populares, también usados ​​en estos tweets. En la visualización el tamaño de cada nodo (hashtag) es proporcional al número de tweets en los que apareció, y el ancho de los bordes representa la frecuencia de coinocceso. El color codifica el tiempo, con las etiquetas azules que se están utilizando las etiquetas más antiguas y las más grises.

Debido a la opinión de Twitter, ampliamente internacional y de apoyo, las acusaciones actuales son claramente no sólo contra CEU, sino que son considerados públicamente como ataques contra la libertad académica y la educación superior en Hungría en general. El tema es co-mencionado con otros temas polémicos, como Brexit y los acontecimientos actuales sobre la educación superior en Turquía y Rusia. A pesar de que ciertos medios no están haciendo ninguna distinción entre CEU como una institución, y George Soros como un individuo, que se menciona un poco en estos tweets. Sin embargo, el primer ministro de Hungría, el nombre de Viktor Orbán se asocia frecuentemente con los acontecimientos en curso en este medio.