Bu proje, Iris
veri setini kullanarak çiçek türlerinin çeşitli özelliklerini analiz etmeyi amaçlamaktadır. Projede, veri temizleme, keşifsel veri analizi (EDA), temel istatistiksel analizler, veri görselleştirme ve özellik mühendisliği adımları uygulanmıştır.
- Kaynak: UCI Machine Learning Repository - Iris Data Set
- Özellikler:
- sepal length (cm): Çanak yaprağı uzunluğu
- sepal width (cm): Çanak yaprağı genişliği
- petal length (cm): Taç yaprağı uzunluğu
- petal width (cm): Taç yaprağı genişliği
- target: Çiçek türü (0: Setosa, 1: Versicolor, 2: Virginica)
- Veri Seti Seçimi
- Google Colab Dosyası Oluşturma
- Keşifsel Veri Analizi (EDA)
- Veri Temizleme ve Ön İşleme
- Temel İstatistiksel Analizler
- Görselleştirme
- Değişkenler Arası İlişkilerin Analizi
- Özellik Mühendisliği (Feature Engineering)
- Bu depoyu kendi bilgisayarınıza klonlayın veya indirin.
- Google Colab sitesine gidin ve
VeriAnaliziProjesi.ipynb
dosyasını yükleyin. - Colab dosyasındaki kodları çalıştırarak analizleri gerçekleştirin. Colab dosyası veri setini otomatik olarak indirecektir.
- Çanak yaprağı uzunluğu ve genişliği ile taç yaprağı uzunluğu ve genişliği arasında yüksek bir korelasyon bulunmuştur.
- Çiçek türleri arasındaki farklar, sepal ve petal ölçümleri ile belirlenebilir.