Será que podemos traçar um paralelo entre a alta (baixa) no petróleo e a alta (baixa) na inflação?
Ao observarmos o gráfico de inflação e o gráfico do petróleo, podemos inferir que há uma correlação direta.
Imagem: Gráfico de preços de Barril de Petróleo Fonte: Trading Economics
Imagem: Inflação nos Estados Unidos por Trading Economics.
Mas será que podemos estabelecer alguma correlação matemática entre o preço futuro do barril do petróleo e a inflação?
Uma coisa é inferir apenas olhando gráficos e traçando possíveis linhas de tendência. No entanto, estatisticamente falando, vamos verificar se essas duas variáveis mantêm correlação.
Para começar essa jornada, muitas suposições e ajustes têm de ser feitas. A primeira dificuldade a ser vencida é esta: os dados de inflação são apresentados no intervalo de 30 em 30 dias, enquanto os dados de preço futuro do barril de petróleo são negociados de minuto em minuto. Então, a questão principal é colocada na mineração e pré-processamento dos dados crus.
Para superar essa dificuldade, eu resolvi então calcular pela média de preços do Barril do Petróleo ocorridos dentro de um mês para simplificar nossa investigação.
O segundo problema na mineração e pré-processamento dos dados também é desafiador. Será que podemos tratar os preços do petróleo como uma variável atrasada (Lag Variable)? Ou seja, os preços de petróleo de um mês são sentidos somente no outro mês, e não refletidos imediatamente.
Como vemos, os problemas para gerarmos nosso possível modelo de correlação entre a variável independente, neste caso, a inflação, e a variável dependente, aqui representada pelo petróleo, são inúmeros.
Imagem3: Tabela de resultados.
Quais foram os resultados dos primeiros testes?
Vemos que a correlação entre essas variáveis ,da forma que foi organizada, é menor que 5%. No entanto, nosso modelo prevê que 8% da variação na inflação americana é explicada pelos preços futuros do petróleo. No entanto, nossos P-Values nos mostram que estatisticamente temos que descartar o teste, uma vez que ele não está dentro do alcance de 95% de confiabilidade estatística, o que provaria que nossa variável é sim significante na variável que estamos tentando explicar.
Como resultado, em nossa primeira tentativa de traçar uma correlação, na busca de criação de um modelo de regressão com única variável falhamos copiosamente.
Um assunto mais técnico hoje, entrando dentro do que chamamos de Data Science e Data Analytics.
Acompanhem nossos próximos posts em busca de um modelo matemático para correlacionarmos estas duas variáveis.
Como obter vantagem de Business Analytics ou Data Science no seu fundo de investimento?