Máximo e Mínimo - Chamada REGULAR
/> Esse repositório foi de grande valia para os seguintes aspectos:
-
Responder algumas questões que podem surgir em torno do arquivo contendo as notas da primeira edição do SISU UFMG;
-
Melhorar meu desempenho na prática de analises de dados, me fazendo aprender a manipular arquivos não convencionais, como foi o caso desse PDF;
-
Me fez aprender mais acerca de Regex (Regular Expression)
/> Questões analisadas nesse repositório:
-
Maior nota por modalidade selecionada para o SISU UFMG 2021;
-
Cursos com as maiores notas POR MODALIDADE (Cotas e A.C.);
-
Cursos com as menores notas POR MODALIDADE (Cotas e A.C.);
-
Menor nota por modalidade selecionada para o SISU UFMG 2021.
</> O arquivo Excel Dashboard Sisu.xlsx, contém, dinamicamente, o resultado de toda a análise realizada. Segue abaixo uma pequena amostra desse dashboard:
</> No arquivo DFbruto.ipynb, está contido todo o processo de construção do dataframe bruto a partir do PDF. Nele, utilizei três bibliotecas do Python:
. PyPDF2 = Utilizada para transformar o conteúdo de um PDF em uma string;
. Regex = Trata-se das expressões regulares, que facilitam expressivamente o trabalho de buscas por cadeias de caractéres específicos em uma string;
. Pandas = Ferramenta essencial para manipulação, filtração e análise de dados.
</> Já no arquivo DFespecífico.ipynb há o procedimento de criação do dataframe específico para ser usado no Excel. Em tal arquivo, fiz uso das librarys:
. Numpy = Biblioteca do Python usada para criação de arrays multidimensionais (Utilizei-a como testes em alguns casos)
. Pandas
- Para a efetivação de todo o trabalho de análise, elaborei tudo conjuntamente ao parceiro Gilmar:
🔗 Github: https://github.com/Gilnior