Görüntü sınıflandırma işlemi için K-Nearest Neighbors (KNN) algoritması kullanımı.
Proje İçeriği • Kullanılan Kütüphaneler • Veri Seti • KNN Modeli ve Hiperparametre Optimizasyonu • Sonuçlar • Kurulum ve Çalıştırma • Katkıda Bulunanlar • Lisans
- Veri Seti Seçimi: CIFAR-10 veri seti kullanılmıştır.
- Veri Ön İşleme:
- Veriler
X_train
,y_train
,X_test
vey_test
olarak bölünmüştür. - Verilerin boyutları yazdırılmıştır.
- Görüntüler görselleştirilmiştir.
- Veriler normalize edilmiştir.
- Veriler
- Model Oluşturma ve Eğitme:
- PCA kullanarak boyut azaltma yapılmıştır.
- GridSearchCV kullanılarak KNN modelinin hiperparametre optimizasyonu yapılmıştır.
- Model eğitilmiş ve test verileri üzerinde tahminler yapılmıştır.
- Sonuçların Değerlendirilmesi:
- Doğruluk, sınıflandırma raporu ve karışıklık matrisi kullanılarak model değerlendirilmiştir.
- Tahmin sonuçları görselleştirilmiştir.
- numpy
- matplotlib
- tensorflow.keras
- sklearn (scikit-learn)
CIFAR-10 veri seti, 10 farklı sınıfa ait 60,000 renkli görüntüden oluşur. Her sınıfta 6,000 görüntü bulunur. Veri seti, eğitim ve test olmak üzere ikiye ayrılmıştır: 50,000 eğitim ve 10,000 test görüntüsü.
Proje kapsamında, KNN algoritması kullanılmış ve GridSearchCV ile en uygun k
değeri optimize edilmiştir. Ayrıca, PCA kullanılarak boyut azaltma işlemi yapılmıştır.
Modelin doğruluğu ve diğer değerlendirme metrikleri aşağıda verilmiştir:
- Accuracy: %30 - %40 arasında
- Classification Report: Precision, Recall ve F1-Score değerleri
- Confusion Matrix: Modelin hangi sınıfları doğru veya yanlış sınıflandırdığı gösterilmiştir.
-
Gerekli kütüphaneleri yükleyin:
pip install numpy matplotlib tensorflow scikit-learn
-
Jupyter Notebook veya Google Colab kullanarak
cifar10_knn_pca.ipynb
dosyasını açın ve hücreleri sırasıyla çalıştırın.
Bu proje MIT Lisansı altında lisanslanmıştır.