Este projeto se concentra na detecção de fraudes em transações de cartões de crédito usando Redes Neurais Profundas (DNN) em combinação com técnicas de oversampling para lidar com dados desbalanceados. O objetivo é identificar transações fraudulentas com alta precisão utilizando métodos avançados de aprendizado de máquina.
O conjunto de dados contém transações de cartões de crédito rotuladas como fraudulentas ou não. Devido à baixa proporção de fraudes, técnicas de balanceamento são necessárias para um treinamento eficaz do modelo.
A metodologia empregada inclui várias etapas de pré-processamento de dados, como normalização e oversampling com SMOTE para gerar um conjunto de dados balanceado. Diferentes modelos de aprendizado de máquina são então treinados e avaliados.
- Pré-processamento: Limpeza e normalização dos dados.
- Oversampling: Aplicação do SMOTE para aumentar a representatividade das transações fraudulentas.
- Treinamento do Modelo: Uso de uma DNN para aprendizado e classificação.
- Avaliação: Métricas como precisão, F1 score, recall, AUC e matriz de confusão são utilizadas para avaliar o desempenho do modelo.
Além da Rede Neural Profunda (DNN), foram testados outros modelos para fins de comparação:
- Naive Bayes: Um modelo probabilístico simples para classificação binária.
- Regressão Logística: Modelo linear amplamente utilizado para classificação binária.
- Floresta Aleatória: Conjunto de árvores de decisão que melhora a precisão e reduz o overfitting.
Os resultados mostram que a combinação de DNN com oversampling melhora significativamente a detecção de fraudes em comparação com métodos tradicionais. As métricas de desempenho indicam uma alta taxa de precisão e recall, destacando a eficácia do modelo.
O projeto demonstra a viabilidade e eficácia do uso de técnicas avançadas de aprendizado de máquina para detecção de fraudes em cartões de crédito. Embora promissor, este projeto é destinado a fins educacionais e de pesquisa e não deve ser implementado em sistemas de produção.
Para mais detalhes, consulte o notebook do projeto.