Esse é uma análise feita a título de estudo pessoal, com base no famoso dataset do Titanic: https://www.kaggle.com/c/titanic.
A ideia foi desenvolver uma solução completa, desde a análise dos dados, feature engineering, treinamento de diversos modelos, validação, tunning e submissão da solução final. Com o modelo desenvolvido neste projeto, consegui alcançar a posição 885 no leaderboard do desafio, com uma accuracy de 0.79 (https://www.kaggle.com/c/titanic/leaderboard).
Na primeira etapa desse notebook consiste em uma análise exploratória dos dados, para determinação das features mais relevantes na sobrevivência dos passageiros, e também para tratamento dos dados categóricos e missing values.
Posteriormente foi realizado o ajuste de diversos modelos, a seleção e tunning do melhor e submissão da previsão de sobrevivência no Titanic.
Críticas e sugestões são muito bem vindas: https://www.linkedin.com/in/josewalterlima/