deteccao_fraude

Nesse curso nós acompanhamos, desde o início, uma pipeline de machine learning, fizemos toda a coleta de dados, pegamos esses dados no kaggle e entendemos o que eles continham. Passamos para a análise exploratória com Pandas e Pandas Profiling, aplicamos um encoding nos dados e fizemos parte do balanceamento de dados neles.

Os dados precisavam ser balanceados para que conseguíssemos fazer o modelo de machine learning que alcançasse uma boa previsão, com mais dados de uma classe e menos de outra, não conseguiríamos um resultado tão bom.

Após termos feito toda a parte das análises e manipulações do banco de dados, conseguimos aplicar os três modelos de machine learning e compará-los. Então, fizemos a Regressão logística, a Árvore de decisão e a Floresta aleatória. Além disso, comparamos as três com várias métricas.

Durante o curso, aprendemos a utilizar as métricas e modelos e, ao final, também aprendemos a melhorar o modelo Random Forest.