Conhecendo melhor nossa base de consumidores: qual estado possui os clientes com melhores pontuações de crédito?
Queremos conhecer melhor nossos clientes por estado. Para isso, iniciamos uma análise na pontuação de crédito. Para realizar a verificação inicial, precisamos de alguns valores. Os valores são a média, a mediana, a moda e o desvio padrão da pontuação de crédito.
Neste desafio você aprenderá:
- Média;
- Mediana;
- Moda;
- Desvio padrão.
Você precisará de python 3.6 (ou superior).
O recomendado é você utilizar um ambiente virtual. Para isto, execute os comandos como no exemplo abaixo:
pip3 install virtualenv
virtualenv venv -p python3
source venv/bin/activate
Ao terminar o desafio, você pode sair do ambiente criado com o comando deactivate
A resposta deve conter os valores da média, mediana, moda e desvio padrão da pontuação de crédito para cada estado do dataset. O arquivo para submissão deve estar em formato json, conforme o arquivo exemplo "submission.json".
OBSERVAÇÃO: É recomendado utilizar Python e pandas para esse desafio, mas também é possível utilizar outras ferramentas e linguagens de programação.
Descrição dos dados: 'id': Identificador do cliente 'sobrenome': Sobrenome do cliente 'pontuacao_credito': Pontuação de crédito do cliente (quanto maior, melhor o cliente geralmente) 'estado_residencia': Estado de residência do cliente 'genero': Gênero do cliente 'nivel_estabilidade': Nível de estabilidade do cliente 'saldo_conta': Saldo disponível na conta do cliente 'numero_produtos': Número de produtos que o cliente consome 'possui_cartao_de_credito': Possui um cartão de crédito cadastrado 'membro_ativo': Membro acessa e consome frequentemente
Obs: Os dados são fictícios, mas tentam representar a realidade de uma base de clientes de um produto SaaS.