Aluno: Felipe Lopes Meira Alves
Orientador: Felipe Borges.
Trabalho apresentado ao curso BI MASTER como pré-requisito para conclusão de curso e obtenção de crédito na disciplina "Projetos de Sistemas Inteligentes de Apoio à Decisão".
Este trabalho tem como objetivo explorar modelos de machine learning e redes neurais com intuito de obter o melhor resultado na otimização da previsão de vendas da loja número 1 do Walmart.
This work aims to explore machine learning models and neural networks in order to obtain the best result in optimizing the sales forecast of Walmart's number 1 store.
O Walmart é uma multinacional de lojas de departamento. O projeto proposto faz uso da base de vendas de 45 lojas espalhadas pelos Estados Unidos no período de 2010 a 2012.
A base contém além da informação de vendas, outras variáveis importantes para o projeto como indicadores de feriados, temperatura, preço da gasolina, taxa de desemprego e CPI (índice de preços ao consumidor).
Com uma análise geral das 45 lojas, há alguns pontos que se destacam na base:
- O Walmart teve seu melhor desempenho em vendas em 2011 e o pior em 2012;
- As lojas que mais venderam obtiveram suas maiores vendas no mês de Dezembro e nos anos de 2010 e 2011;
- Em relação à correlação entre as variáveis, temos o efeito do aumento do desemprego, CPI (índice de preços ao consumidor) e temperatura impactando negativamente a variável Weekly_sales (vendas semanais);
- Após a análise exploratoria inicial da base, foi selecionada aleatoriamente a loja de número 1 do Walmart. Interessante ressaltar que essa loja não figura entre as maiores vendas da base.
O projeto proposto foi dividido em duas abordagens. Uma considera apenas as informações de vendas e a outra considera também as séries feriados, temperatura, preço da gasolina, taxa de desemprego e CPI.
Modelo 1: Apenas considerando os dados de vendas.
- Para a previsão de vendas do modelo foi determinada uma janela de 20 entradas.
- Separação da base entre treino e teste.
- Normalização das bases.
- Aplicação dos modelos Random forest, Decision Tree, Redes neural com multiplas camadas e LSTM.
- Avaliação dos modelos utilizando RMSE, MSE, R2 e RMSPE.
- Previsão das proximas 12 entradas de vendas.
Modelo 2: Considerando os dados de vendas e as séries exogenas.
- Para a previsão de vendas do modelo foi determinada uma janela de 20 entradas.
- Separação da base entre treino e teste.
- Normalização das bases.
- Aplicação dos modelos Random forest, Decision Tree, Redes neural com multiplas camadas e LSTM.
- Avaliação dos modelos utilizando RMSE, MSE, R2 e RMSPE.
- Previsão das proximas 12 entradas de vendas.
Avaliando-se os dois modelos os seguintes resultados foram obtidos:
RMSE e MSE são métricas que calculam a média da diferença entre o valor predito e o real. Quanto maior o valor encontrado, maior a significância que o modelo não obteve uma boa performance. Nesta análise, o modelo 2 LSTM apresentou os valores mais baixos sendo superior aos demais modelos nesses quesitos.
MAPE é uma métrica que mostra a porcentagem de erro em relação aos valores reais. No modelo 2 LSTM, o MAPE apresentou o percentual de 4.1%. Então se o resultado de MAPE for igual a 4.1%, significa que o modelo faz previsões em que a média da diferença entre o valor previsto e o real equivale a 4.1% do valor real, tanto para mais quanto para menos.
R2_score representa o percentual da variância dos dados que é explicado pelo modelo, os resultados variam entre 0 e 1 quanto maior é o valor de r2 mais explicativo é o modelo. O modelo de maior tamanho no quadro analisado foi do modelo 2 LSTM.
RMSPE mensura o erro percentual em relação a magnitude da variável. O menor valor encontrado foi também no modelo 2 LSTM.
Os melhores resultados foram encontrados pelo modelo 2 LSTM que considera as séries exogenas.
O objetivo do trabalho foi explorar modelos de machine learning e redes neurais com intuito de obter o melhor resultado na otimização da previsão de vendas da loja número 1 do Walmart. A rede que obteve destaque na avaliação foi a LSTM com o diferencial da sua capacidade padrão de lembrar de informações por longos períodos de tempo, o que a torna indicada para previsão de séries temporais em longos intervalos de tempo. Ao análisar o modelo 2 LSTM do real x previsto houve semelhança nos movimentos do gráfico.
O modelo 2 LSTM na previsão dos próximos 12 passos seguiu o mesmo padrão de comportamento da série, demonstrando sua capacidade de memória da informação e capacidade preditiva.
Portanto, durante a avaliação dos modelos, houve destaque para o modelo 2 LSTM com resultados superiores em todos os indicadores de avaliação abordados no capítulo de resultados. O modelo 2 LSTM, que tem como característica o uso das séries exógenas, ao ser combinado com otimizador Adam foi o que gerou os melhores resultados.
Matrícula: 202.100.120
Pontifícia Universidade Católica do Rio de Janeiro
Curso de Pós Graduação Business Intelligence Master