¿Podemos trazar un paralelo entre el aumento (bajo) del petróleo y el aumento (bajo) de la inflación ?
Cuando miramos el gráfico de inflación y el gráfico del petróleo, podemos inferir que existe una correlación directa.
Imagen: Gráfico de precios del barril de petróleo Fuente: Trading Economics
Imagen: Inflación en los Estados Unidos por Trading Economics.
Pero ¿podemos establecer alguna correlación matemática entre el precio futuro del barril de petróleo y la inflación?
Una cosa es inferir simplemente mirando gráficos y trazando posibles líneas de tendencia . Sin embargo, estadísticamente hablando, comprobemos si estas dos variables están correlacionadas.
Para comenzar este viaje, es necesario hacer muchas suposiciones y ajustes. La primera dificultad que hay que superar es la siguiente: los datos de inflación se presentan cada 30 días, mientras que los datos de precios futuros del barril de petróleo se negocian cada minuto. Entonces, la pregunta principal se plantea en la extracción y preprocesamiento de los datos sin procesar.
Para superar esta dificultad, decidí calcular el precio promedio de un barril de petróleo que se produjo dentro de un mes para simplificar nuestra investigación.
El segundo problema en la minería y el preprocesamiento de datos también es un desafío. ¿Podemos tratar los precios del petróleo como una variable rezagada ( L agVariable ) ? En otras palabras, los precios del petróleo de un mes sólo se sienten el mes siguiente y no se reflejan inmediatamente.
Como podemos ver, los problemas para generar nuestro posible modelo de correlación entre la variable independiente , en este caso la inflación , y la variable dependiente , aquí representada por el petróleo , son numerosos.
Imagen3: Tabla de resultados.
¿Cuáles fueron los resultados de las primeras pruebas?
Vemos que la correlación entre estas variables , tal como están organizadas, es inferior al 5%. Sin embargo, nuestro modelo predice que el 8% de la variación de la inflación estadounidense se explica por los precios futuros del petróleo . Sin embargo, nuestros P-Values nos muestran que estadísticamente tenemos que descartar la prueba, ya que no está dentro del rango del 95% de confiabilidad estadística , lo que probaría que efectivamente nuestra variable es significativa en la variable que estamos tratando de explicar.
Como resultado, en nuestro primer intento de establecer una correlación , en la búsqueda de La creación de un modelo de regresión con una sola variable fracasó estrepitosamente.
Un tema más técnico hoy, adentrándonos en lo que llamamos Ciencia de Datos y Análisis de Datos.
Sigue nuestros próximos posts en busca de un modelo matemático que correlacione estas dos variables.
¿Cómo aprovechar Business Analytics o Data Science en tu fondo de inversión?