domingo, 1 de noviembre de 2015

Redes de acciones en el NASDAQ


Red de NASDAQ  - Parte I

por Andrey Gabdulin - Concepton


Sí, esto es lo que estoy haciendo a la 1 am cuando los cambios del mercado recuerdan que hay una belleza escondida dentro señales seudo caóticas que rigen nuestra vida. Luego vuelvo a la obra, que está tratando de sistematizar mercado de valores en una sola red y por medio de las propiedades estáticas y dinámicas de la red para entenderlo mejor. ¿Qué podemos encontrar allí? Un montón de cosas interesantes. Conexiones ocultas, clusters, conexiones internas y transversales del sector. ¿Qué podemos deducir de esto? Consideraciones de inversión, propiedades de robustez de los mercados, patologías y más ...
Voy a publicar los resultados en unos trozos pequeños - el camino hecho, estoy trabajando en esto :)
Entonces, ¿cómo vamos a empezar? Ciertamente, a partir de los datos en bruto. Necesitamos unos registros de comercio de instrumentos financieros para un cierto período de tiempo. Tengo 2 conjuntos de datos, basados ​​en rangos -

  • 1 semana de 3.5k NASDAQ acciones de la empresa y fondo cotizado (ETF) índices con 5 minutos granularidad
  • 10 años de datos de granularidad diaria para las acciones de NASDAQ

El siguiente paso es elegir el conjunto (o subconjunto, con base en el alcance requerido), reunir los datos y, probablemente, a la limpieza / organizar formatos. Una vez que los datos están listos, tenemos que ejecutar la correlación cruzada. Esto nos dador una matriz de NxN con coeficientes de correlación (R cuadrado) entre cada población. A partir de este punto y en que llamaremos a cada acción de Compañía de la ETF como un "nodo" y la conexión entre dos empresas como un "enlace". Esto es porque, como he dicho, vamos a construir una red y esos son los términos de componentes básicos.
Aplicación de umbral Rsq se va a reducir significativamente la cantidad de existencias que se correlacionan. ¿Cuánto? Bueno, de manera exponencial. Esto es importante, ya que se reduce la carga en nuestro sistema y hace que el análisis más rápido. Además nos da la atención necesaria de investigación:


Cantidad de enlaces (conexiones de valores - eje Y) en función del umbral aplicada sobre Rsq (eje X). Caída exponencial, por lo que aquí se presenta en escala logarítmica.

Prefiero trabajar con señales altamente correlacionados> 0,9 Rsq en 5 minutos de datos de granularidad y un poco más bajo para señales a escala anual. Se trata de datos suficientes para cavar en una sola persona durante la noche. Por ejemplo 0.9 Rsq limpieza está dando en mis datos de conjunto 364 nodos (empresas y fondos) y 5778 enlaces (conexiones entre ellos).
Para empezar a trabajar con facilidad, necesita un poco de la visualización de SW. Me gusta Gephi. Importamos la tabla de enlaces, cuando los valores RSQ se definen como "Pesos" dentro Entonces, ¿cómo se ve?

Correlación Cruzada red de 364 acciones y fondos de la compañía de NASDAQ en el 16 de abril 2014 con la correlación más alta que 0.9 basado en 5 minutos de muestreo granularidad. Los colores se basan en el sector del mercado, tamaño del nodo basado en el valor del capital.

Hermoso, ¿no?
RSQ> 0.95 da imagen mucho más centrada:

Correlación Cruzada red de 116 acciones y fondos de la compañía de NASDAQ en el 16 de abril de 2014 con la correlación más alta que 0.95 basado en 5 minutos de muestreo granularidad. Los colores se basan en el sector del mercado, tamaño del nodo basado en el valor del capital

Ahora podemos inspeccionar haciendo zoom, filtrando sobre la base de los sectores. Por ejemplo Health Care y Pharma:

Correlación Cruzada red de 26 NASDAQ acciones de la empresa en la atención sanitaria y el sector Pharma al 16 de abril 2014 con la correlación más alta que 0.95 basado en 5 minutos de muestreo granularidad. Tamaño del nodo se basa en el valor del capital. Ancho de la conexión basada en el valor Rsq

En esta etapa podemos preguntarnos varias preguntas. Por ejemplo, ¿cómo se ve (y por qué) dos poblaciones con alta correlación?
A veces esto tiene perfectamente sentido, por ejemplo, para FOXA (para las acciones Clase A) y FOX (para las acciones Clase B):

En otros casos, puede encontrarse con que la correlación intra-día no es representativo y ocasional (o causados ​​por raro evento común) y por lo tanto hay una necesidad de cambiar a escala anual.
Podemos construir una cartera de compañías farmacéuticas, debemos todos tomar? Si ahora en realidad no tiene sentido, entonces qué parte? Representante de cada grupo? Bueno, podemos ejecutar el algoritmo de clúster, el algoritmo Run Centralidad y probablemente elegir sobre la base de estas consideraciones.

Todas esas cosas y más en próximas partes ..

No hay comentarios:

Publicar un comentario en la entrada