Predecir indicadores del mercado de valores a través de Twitter "Espero que no sea tan malo como temo"
Hemos estado trabajando en tratar de predecir los indicadores del mercado durante bastante tiempo analizando Web Buzz, prediciendo quién ganará un Oscar, o qué tan bien las películas lo hacen en taquilla. Entre otras cosas, hemos correlacionado publicaciones sobre una acción en Yahoo Finance y Motley's Fool con el precio real de las acciones, prediciendo el precio de cierre de las acciones al día siguiente en base a lo que la gente dice hoy en Yahoo Finance, en la Web y Blogs sobre un título de acciones.
La creciente popularidad de Twitter nos brinda una nueva forma de capturar la mente colectiva hasta el último minuto. En nuestro proyecto actual, analizamos el estado de ánimo positivo y negativo de las masas en Twitter, y lo comparamos con índices bursátiles amplios como Dow Jones, S & P 500 y NASDAQ. Recopilamos los feeds de Twitter de una IP de la lista blanca durante seis meses desde el 30 de marzo de 2009 hasta el 4 de septiembre de 2009, que van desde 5680 a 42820 tweets por día. Según Twitter, esto corresponde a una submuestra aleatorizada de alrededor de un centésimo del volumen total de todos los tweets, ya que el volumen total en 2009 fue de aproximadamente 2,5 millones de tweets por día. Intentamos medir la esperanza colectiva y el miedo cada día aplicando la métrica simple de contar todos los tweets que contenían las palabras "esperanza": había 54 a 467 tweets por día y "miedo" o "preocupación": había de 9 a 100 tweets por día. Esto nos dice que las personas prefieren las palabras optimistas (esperanza) a las palabras pesimistas (miedo o preocupación).
Como punto de referencia externo del temor de los inversionistas utilizamos el Chicago Board Options Exchange Volatility Index VIX, que tiene una fuerte correlación negativa con Dow, S & P 500 y NASDAQ, lo que no es sorprendente, ya que el margen de opciones de acciones en un día determinado se usa para calcular VIX. Inicialmente, esperábamos la cantidad de tweets con la esperanza de que se correlacionen negativamente con VIX, y la cantidad de tweets con miedo o preocupación se correlacionen positivamente con VIX. Sorprendentemente, encontramos una correlación positiva débil pero insignificante para "esperanza" (0.135) y "miedo" o "preocupación" (0.172) con VIX, y una correlación negativa significativa con "miedo" y "preocupación" y "esperanza" con Dow NASDAQ y S & P500 (Esto significa que las personas comienzan a usar palabras más emocionales como esperanza, miedo, preocupación en tiempos de incertidumbre económica. Por lo tanto, creamos un índice simple de volatilidad de Twitter combinando menciones de esperanza, miedo y preocupación, normalizándolo con la cantidad total de tweets por día como referencia. Este índice muestra fuertes correlaciones negativas significativas con Dow, NASDAQ y S & P500, y una fuerte correlación positiva significativa con VIX (consulte la tabla a continuación).
La siguiente imagen muestra la correlación negativa entre Dow (azul) y "esperanza, miedo y preocupación" (verde) en el período del 30 de marzo de 2009 al 4 de septiembre de 2009.
Para poner esto en palabras simples, cuando las emociones en Twitter vuelan alto, es cuando las personas expresan mucha esperanza, miedo y preocupación, el Dow cae al día siguiente. Cuando las personas tienen menos esperanzas, temores y preocupaciones, sube el Dow. Por lo tanto, parece que el simple hecho de consultar en Twitter los estallidos emocionales de cualquier tipo da un pronosticador de cómo se comportará la bolsa de valores al día siguiente.
Para ser claros, lo que hemos presentado aquí son resultados preliminares muy tempranos, y se necesita mucho más trabajo para verificarlo científicamente.
Swarm Creativity