EnerjiSA&Patika Data Science and Analytics Bootcamp

Homework 2

İstenenler :

  • One hot encoding modelin görmediği veriye nasıl uygulanır?
  • Labelencoding'de ilgili kolon için ölçeklendirme nasıl yapılır? (Verinin doğru etkisiyle sayısal olarak dönüştürülmesi)
  • Imbalance datasette train test split yaparken neleri göz önünde bulundurmalıyız?
  • Validation dataseti (modelin görmediği) nasıl oluşturulur ve nasıl predict etmeye hazır hale getirilir?
  • predict_proba metoduyla oran nasıl hesaplanır ve treshold nasıl değiştirilir?
  • Fraud case'i üzerinde train&test&validation split, encoding, scaling,modelleme çalışmaları Python'da yapılarak, modelin görmediği dataset üzerinde başarılı sonuç alacak bir model örneği yapılmalı.