ml_modules
altında BaseClassifier'ı extend eden yeni sınıf yarat.- Eğer gerekliyse
requirements.txt
'yi güncelle. tests/ml/classifiers/test_models.py
dosyasında yeni classifier'ı importlayıpsetupClass
'ı güncelle.make test-docker
komutu ile testlerin geçtiğinden emin ol.- Yeni branch'ı pushla ve PR aç.
Proje amaci: Twitter’dan toplanan deprem alakali verilerin labellanmasi ve analizi. Su ana kadar kelime tabanli ve zero-shot classification modeli kullanilarak intent classification yapildi. Onumuzdeki amacimiz veri takimlarinin yardimiyla verisetleri olusturup tweetleri ilgili yardim birimlerine ulastirmak amacli kumelemek. Ornegin: yemek ihtiyaci oldugunu belirten bir tweetin enkaz icin degil de gida transferi saglayacak ekiplerle paylasilmasi icin duzenlenmesi.
#depremadres data Trello'da mevcut: 130k tweet data
Yapilmasi gerekenler
-
Depremle ilgili elimizde olan verilerin analiz edilmesi.
- #depremadres hashtaginden 2232 tweet var elimizde.
- deprem alakali 130k tweet var elimizde.
- yapilabilecek preprocessing gelistirmeleri.
- veriyi en iyi represent edecek label listesinin olusturulmasi.
- data exploration
-
yeni toplanabilecek verilerin planlanmasi.
-
veri takimiyla iletisime gecilip toplanmis verilerin annotation isleminin yapilmasi.
-
supervised classification probleminin tasarlanmasi.
- elimizdeki tweet yardim isteyen tweet vs ornegin siyasi tweet mi.
- yardim tweetlerinin hangi contextte yardim istedigi: enkaz yardim, gida yardim, ilac yardim, gibi.
- daha fazla model mumkun, veri analizleri dogrultusunda neler gelistirilebilirse deneyebilirsiniz.
-
problemin etrafinda gelistirilebilecek modellerin belirlenmesi.
-
modellerin training ve testing gelistirmelerinin yapilmasi.
-
sonuclarin analizinin yapilmasi.
-
pm ekibiyle iletisime gecilip modellerin ne yonde ise yarayabileceginin ve entegrasyonunun planlanmasi.