O objetivo desse trabalho foi realizar o tratamento da base de dados referente a informações de profissionais da área de ciência de dados, tendo o objetivo de identificar quais tipos de profissionais podem deixar seus empregos atuais. Pensando nisso, foi realizado diversas tratativas na base de dados sendo elas, imputação de valores, tratamento de outliers, encoding de variáveis, tratamento de valores ausentes, entre outros. Além disso, para testar a qualidade do processo de tratamento dos dados, como resultado final do trabalho, foi realizado a predição da variável target utilizando três tipos de classificadores diferentes, obtendo os seguintes resultados:
Classificador Gaussiano: Aproximadamente 73% de Acurácia
Classifiador KNN: Aproximadamente 74.7% de Acurácia
Classificador Árvore de Decisão: Aproximadamente 70% de Acurácia
Fonte dos Dados: https://www.kaggle.com/datasets/arashnic/hr-analytics-job-change-of-data-scientists