Este é o projeto final do curso de Python para DataScience, o qual foi proporcionado pela SEED-PR em parceria com a Alura. O objetivo é realizar uma análise dos Número de Vagas Oferecidas, Ingressos, Matrículas, Concluintes, Inscritos e Cursos de Graduação Presenciais no Brasil entre os anos de 2009 e 2017.
Informações importantes:
A análise e manipulação dos dados foi feita a partir das seguintes determinações:
- Tratamento de Dados
- Tratamento de casos de células Not a Number (NaN);
- Renomeação de colunas (removendo acentos e espaços).
- Análise de Dados
- Taxas de crescimento ou decaimento ano a ano para todas as regiões do Brasil;
- Número de vagas oferecidas por região ano a ano;
- Relação entre vagas e o número de ingressos;
- Crescimento no número de matrículas por região e possíveis casos expressivos (positivos ou negativos);
- Número de concluintes em cada região;
- Comparação: número de inscritos com o número de matrículas;
- Número de cursos ofertados na região e seus impactos no aumento de inscritos e/ou número de matrículas.
- Obtenção, tratamento e análise de informações presentes em um arquivo
.csv
; - Tipos de visuais para apresentação de dados estatísticos;
- Funções em Python.
O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:
- Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
- Python: Linguagem de programação.
- Pandas: Biblioteca para manipulação e análise de dados;
- Matplotlib: Biblioteca para criação de visualizações gráficas;
- Seaborn: Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.
Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE
para obter mais informações sobre os termos de licenciamento.
✨ Feito com carinho por Andrieli Gonçalves.