/Projeto_Ciencia_de-_dados

Data Science

Primary LanguageJupyter Notebook

Projeto_Ciencia_de_dados

Data Science

Projeto : Desenvolver um modelo que preveja se uma conta ficará inadimplente no próximo mês, de acordo com dados demográficos e históricos.

Descrição do Problema a ser resolvido(fictício):

Uma empresa de cartão de crédito nos enviaram Dataset que inclui dados demográficos e dados financeiros recentes(últimos seis meses) de uma amostra de 30.000 titulares de contas.

As linhas são rotuladas de acordo se no mês seguinte ao período de dados, o proprietário da conta ficou inadimplente, ou seja, não fez o pagamento mínimo.

Etapas da Exploração e limpeza de dados:

1- Saber quantas colunas os dados contêm. Podem ser de características de cada cliente, resposta ou metadados.

2- Quantas linhas(amostras) o Dataset possui.

3- Que tipos de características existem. Quais são as categóricas e quais são numéricas?

4- Quais são as aparências dos dados segundo essas características?

5- Verificar se há dados faltantes, nulos ou duplicados.