O principal objetivo desta disciplina é apresentar ao aluno uma visão geral das tarefas envolvidas no pipeline de ciência de dados, como processamento e análise de dados, e predição. O material da disciplina é focado no uso das técnicas em aplicações reais.
- Introdução à ciência dos dados
- Manipulação de dados colunares (Pandas)
- Visualização de dados em Python
- Estatísticas descritivas
- Testes de hipótese
- Pré-processamento
- Limpeza (detecção de outliers)
- Normalização e imputação etc
- Processamento de dados em larga escala
- Processamento de séries temporais
- Modelos preditivos
- Classificação
- Regressão
- Agrupamento