Proje amaci: Twitter’dan toplanan deprem alakali verilerin labellanmasi ve analizi. Su ana kadar kelime tabanli ve zero-shot classification modeli kullanilarak intent classification yapildi. Onumuzdeki amacimiz veri takimlarinin yardimiyla verisetleri olusturup tweetleri ilgili yardim birimlerine ulastirmak amacli kumelemek. Ornegin: yemek ihtiyaci oldugunu belirten bir tweetin enkaz icin degil de gida transferi saglayacak ekiplerle paylasilmasi icin duzenlenmesi.
Verisetleri icin
#depremadres data repoda mevcut: sample_data.csv
Yapilmasi gerekenler
-
Depremle ilgili elimizde olan verilerin analiz edilmesi.
- #depremadres hashtaginden 2232 tweet var elimizde.
- deprem alakali 130k tweet var elimizde.
- yapilabilecek preprocessing gelistirmeleri.
- veriyi en iyi represent edecek label listesinin olusturulmasi.
- data exploration
-
yeni toplanabilecek verilerin planlanmasi.
-
veri takimiyla iletisime gecilip toplanmis verilerin annotation isleminin yapilmasi.
-
supervised classification probleminin tasarlanmasi.
- elimizdeki tweet yardim isteyen tweet vs ornegin siyasi tweet mi.
- yardim tweetlerinin hangi contextte yardim istedigi: enkaz yardim, gida yardim, ilac yardim, gibi.
- daha fazla model mumkun, veri analizleri dogrultusunda neler gelistirilebilirse deneyebilirsiniz.
-
problemin etrafinda gelistirilebilecek modellerin belirlenmesi.
-
modellerin training ve testing gelistirmelerinin yapilmasi.
-
sonuclarin analizinin yapilmasi.
-
pm ekibiyle iletisime gecilip modellerin ne yonde ise yarayabileceginin ve entegrasyonunun planlanmasi.