/ML-DS-Ogretici-Notebooklar

Machine Learning ve Veri Biliminde yapılan hataların notebooklar ile gösterildiği repodur.

Primary LanguageJupyter NotebookMIT LicenseMIT

Machine Learning ve Veri-Biliminde Yaygın Hatalar

Bu repoda veri bilimi ve makine öğrenmesinde yapılan hataları gösteren notebooklar paylaşılmaktadır.

İçindekiler

Data Leakage

  • Data Leakage, eğitim veri seti dışındaki bilginin modelin oluşturulması sırasında kullanılması durumunda ortaya çıkar. Bu, modele ek bir bilgi sağlayabilir ve aslında bu ek bilginin model tarafından bilinmemesi gerekir. Neticede model öğrenmemesi gerektiği bir özellik öğrendiğinde bu modelin performansını çok kolay bir şekilde geçersiz kılabilir."

  • Yani yapılan bu hata (Data Leakage), aşırı iyimser veya gerçek hayatta bir işe yaramayacak modeller oluşturmanıza neden olabilir.

Correlation ve Multicollinearity

  • Overfit ile ilişkisi

    • Var mı yok mu diye deneylerin yapılması
  • Modeli yorumlamak

    • Farklı senaryolarda farklı modeller nasıl sonuçlar gösterir, yorumlama yeteneği nasıl etkilenir?