Data Science
Projeto : Desenvolver um modelo que preveja se uma conta ficará inadimplente no próximo mês, de acordo com dados demográficos e históricos.
Descrição do Problema a ser resolvido(fictício):
Uma empresa de cartão de crédito nos enviaram Dataset que inclui dados demográficos e dados financeiros recentes(últimos seis meses) de uma amostra de 30.000 titulares de contas.
As linhas são rotuladas de acordo se no mês seguinte ao período de dados, o proprietário da conta ficou inadimplente, ou seja, não fez o pagamento mínimo.
Etapas da Exploração e limpeza de dados:
1- Saber quantas colunas os dados contêm. Podem ser de características de cada cliente, resposta ou metadados.
2- Quantas linhas(amostras) o Dataset possui.
3- Que tipos de características existem. Quais são as categóricas e quais são numéricas?
4- Quais são as aparências dos dados segundo essas características?
5- Verificar se há dados faltantes, nulos ou duplicados.