TITANIC_SURVIVAL_MODEL (Logistic Regression)

Model kurmadan önce Veri Ön İşleme ve Değişken Mühendisliği işlemleri yaparız. Dağınık veriyi düzenlemeliyiz ki kurduğumuz model performanslı çalışsın. Verilerimizin algoritmaların istediği matematiksel forma dönüştürmeliyiz ve modelden daha doğru sonuçlar alabilmek için değişkenler üretmemiz gerekir.
- İş Problemi:Özellikleri verildiğinde insanların hayatta kalmasını tahmin edebilir misiniz?
Veri setinin değişkenlerine bakalım.
"Survived" değişkeni bağımlı değişken (target) olacak. 1:Kişinin hayatta kalmasını, 0 ise hayatını kaybetmesini temsil etmektedir.
Pclass: Bilet sınıfı. (1.sınıf yolcu,2.sınıf yolcu gibi)
Sex: Yolcunun cinsiyeti.
Age: Yolcunun yaşı.
Sibsp: Titanict'teki kardeş/eş sayısı.
Parch: Titanict'teki ebeveyn/çocuk sayısı.
Embarked: Yolcunun gemiye biniş yaptığı liman.
Fare: Bilet ücreti.
Cabin: Kabin numarası.
KAYNAK: Data Science and Machine Learning Boot Camp, 2021, Veri Bilimi Okulu (https://www.veribilimiokulu.com/)