Model Acıklaması

Webtoonlar için sayfalardaki konuşma balonlarını tespit edebilen bir haar cascade modeli.
Şuanda cok az örnek resimle, 100 pos 100 neg veriyle oluşturuldu o yüzden karmaşık balonlarda iyi sonuc vermiyor ama idare eder şimdilik.

Haar Cascade modeli yapım aşamaları vs

Öncelikle projemide "negative" ve "positif" klasörleri oluşturup içine negatif ve pozitif olmak üzere örnek resimlerimizi yüklüyoruz
Proje içinde kücük bir python kodu çalıştırıp "negative" dosyasındaki resimlerin adlarını uzantılarıyla beraber neg.txt adlı bir dosyaya yazdırıyoruz. Örnek kod:

import os

def generate_negatife_description_file():

    with open('neg.txt','w') as f:
        for filename in os.listdir('negative'):
            f.write('negative/' + filename + '\n')

generate_negatife_description_file()

Opencv nin 3.x.x versiyonunu indiriyoruz cünkü yeni versiyonlarında bizim için lazım olan 1-2 dosya yok.İndirdikten sonra dosyanın içindeki "opencv_annotation.exe" dosyasını bulup python projesinin terminaline yazıyoruz. Bu bize "pos.txt" dosyasını ve resimlerdeki kordinatları vericek. Cıkan resimlerde objeleri tek tek tespit ediyoruz hepsi bitene kadar. Örnek kod:

path/opencv_annotation.exe --annotations=pos.txt --images=positive/ --maxWindowHeight=800

Positive klasöründeki "\" ters slash işaretlerini "/" düzüyle değiştiricez cünkü sorun cıkartıyor :d bunu CTRL+R tuşuyla yapabilirsiniz.
Yine opencv nin 3.x.x versiyonunda "opencv_createsamples.exe" dosyasının yolunu bulup "pos.vec" dosyasını oluşturmamız gerekiyor.Onu da yine projenin terminalinden yapıyoruz. Örnek kod:

path/opencv_createsamples.exe -info pos.txt -w 24 -h 24 -num 1000 -vec pos.vec

Yine opencv nin 3.x.x versiyonunda "opencv_traincascade.exe" dosyasının yolunu bulup train işlemine başlıyoruz.Projede modeli kaydediceğiniz bir klasör acın. Örnek kodda klasörün yolunu -data kısmına yazıyoruz. Örnek kod:

path/opencv_traincascade.exe -data casecade/ -vec pos.vec -bg neg.txt -w 24 -h 24 -numPos 101 -numNeg 202 -numStages 12 -maxFalseAlarmRate 0.3 -minHitRate 0.999

DİPNOT:

Negatif örnek sayısının positif örnek ssayısından fazla olmasına dikkat et.
Negatif sayısını orjinal negatif sayısından fazla yazabilirsin çünkü kendisi negatif resimleri kullanıp yeni negatif resim üretebiliyor.
Genelde pozitif resmin iki katı negatif resim yazılıyor.
Minimum 100 pos 100 neg resim kullan ne kadar fazlaysa o kadar iyi verim alırsın.
Farklı positive resim örnekleri koy yoksa vec oluştururken hata alırsın gereksiz benzer fazla resim varsa.
-w ve -h degerlerini min 24 gir bu tespit edilicek min resim pixel sayısını ifade ediyor
pos.vec oluştururken num sayısına dikkat et bunu positivee resim sayısından falza yap bu örnek vector sayısını temsil ediyor.
positive resimlerin boyutlarını aşırı fazla secme yoksa opencv_annotation.exe uygulaması resimleri tam boyutunda acmaz sıkıntı yaşarsın. Eğer sorun yaşarsan başka bir python koduyla resized işlemi uygula

Parametrelere ve detaylara şuradan bakabilirsiniz: https://docs.opencv.org/4.2.0/dc/d88/tutorial_traincascade.html

Lawhoer/Speech-bubble-detect-for-webtoons-haar-cascade-opencv

Model Acıklaması

Haar Cascade modeli yapım aşamaları vs

DİPNOT:

README.md'yi yazarken pek ugraşmadım bunlar kendime aldıgım notlar sonra ugraşırsam diye.