O projeto visa prever o consumo de cerveja em São Paulo, Brasil. Utilizando técnicas de regressão linear múltipla, são exploradas variáveis como temperatura, chuva e final de semana, e como estas impactam o consumo de cerveja. O projeto inclui análise exploratória de dados, visualizações gráficas e construção de modelos de machine learning.
O conjunto de dados contém informações sobre o consumo de cerveja em São Paulo, com variáveis como temperatura média, temperatura mínima, temperatura máxima, precipitação, final de semana e consumo de cerveja em litros. O dataset está disponível no Kaggle.
- Conhecendo o Dataset: Importação dos dados e familiarização com o conjunto de dados.
- Análises Preliminares: Estatísticas descritivas e matriz de correlação para compreender a distribuição e relações entre as variáveis.
- Visualização de Dados: Utilização de gráficos e visualizações para explorar o comportamento das variáveis e sua relação com o consumo de cerveja.
- Construção de Modelos de Regressão Linear: Implementação de modelos de regressão linear para prever o consumo de cerveja com base nas variáveis explicativas.
- Avaliação e Comparação de Modelos: Avaliação do desempenho dos modelos criados e comparação entre diferentes abordagens.
- Métricas de Desempenho: Utilização de métricas como Erro Quadrático Médio (EQM), Raíz do Erro Quadrático Médio (REQM) e Coeficiente de Determinação (R²) para avaliar a precisão dos modelos.