Reduzindo a fuga de clientes com Machine Learning

A fuga de clientes é um problema que tem a capacidade de arruinar uma empresa e pode ser ocasionado por diversos fatores, como, por exemplo, preços mais interessantes em outras empresas, pouco engajamento, baixa qualidade dos produtos ofertados, entre outros. Por isso, é muito importante estar antenado à evasão de clientes e sempre buscar formas de combatê-la.

Esse artigo trouxe a elaboração de um classificador que prevê a probabilidade de um cliente entrar em Churn ou não. Passou por uma análise exploratória dos dados, engenharia de atributos, construção e otimização de modelos unitários, até a combinação desses modelos, gerando o classificador final. Esse modelo final possui 82% de acurácia, com bom desempenho na previsão das classes minoritárias, estando pronto para ser colocado em produção, entregando a probabilidade de fuga para base de dados não vistas pelo modelo (predict.py), e com espaço para ser ainda mais otimizado.

O modelo obtido pode atuar facilmente como um instrumento de predição de fuga de clientes, auxiliando gestores a detectar a probabilidade de um cliente romper seu contrato com a empresa, permitindo a ele elaborar estratégias de incentivo à permanência e combate à fuga de clientes, consequentemente reduzindo a queda de faturamento decorrente desse problema.

Clique aqui para acessar o notebook com todas as explicações, visualizações e resultados do projeto. Caso tenha dificuldades, também pode acessá-lo aqui.

Estrutura do Projeto

Este projeto está estruturado da seguinte forma:

input: pasta que contém os dados de treino e de teste e a base de dados crua (churn_raw.csv)
models: pasta que contém os modelos treinados e seus metadados no formato pickle .pkl
notebooks: pasta que contém o notebook com as visualizações produzidas e detalhamento do projeto
output: pasta que contém a base de dados escoradas com a probabilidade de fuga do cliente
src: pasta que contém todos os scripts python de pré-processamento, modelagem, treinamento e avaliação dos modelos

Etapas do Projeto

Os scripts python do projeto foram executados nesta ordem:

Divisão do conjunto de teste e de treino: split_data.py
Tratamento de outlier do conjunto de treino: outlier_handling.py
Pré-processamento e treinamento dos modelos preliminares: train.py
Aplicação da técnica SMOTE, pré-processamento e treinamento dos modelos: train_oversampling.py
Otimização dos hiperparâmetros dos melhores modelos obtidos na etapa anterior: hyperparameter_tuning.py
Combinação dos melhores classificadores obtidos nas etapas anteriores: train_ensembled_classifier.py
Treinamento do modelo combinado com base de dados de atributos reduzidos para fins de produção: train_reduced_model.py
Algoritmo que entrega a probabilidade de o cliente entrar em "Fuga", dado suas características: predict.py

raffaelluna/churn-project

Reduzindo a fuga de clientes com Machine Learning

Estrutura do Projeto

Etapas do Projeto