Prepoznavanje teksta sa slike i njegovo citanje
Opened this issue · 2 comments
@ivan7792
Becejac Milana, SW10/2014 (grupa 2)
Opis problema:
Data je slika na kojoj se nalazi tekst u vise redova. Potrebno je razdvojiti redove, a zatim svaki red razdvojiti na slova. Slova se, potom, grupisu u reci(stringove) koje se izgovaraju.
Algoritmi koji ce se koristiti:
- Za prepoznavanje slova sa slike:
- Neural Network - Za izdvajanje slova sa slike:
- Rucno napravljen algoritam - Za razdvajanje reci:
- K means
Metrike za poredjenje performansi algoritma:
- procenat tacnosti pogadjanja slova sa slike na osnovu rucno napravljenih testnih podataka
- procenat tacno izgovorenih reci. Procenat se odredjuje tako sto postoji testni skup sa pravilno napisanim recima iz teksta koji se poredi sa skupom reci koje su detektovane iz teksta.
Ovo ujedno predstvalja nacin validacije resenja.
Dataset-ovi za treniranje i testiranje ce biti rucno napravljeni. Dataset-ovi ce imati slike velikih slova enegleske abecede.
GitHub repozitorijum:
https://github.com/becejacM/ORIProject
Tema može biti dosta obimna, ali je istu rešavao veliki broj studenata prethodnih godina, dok rešenja postoje i na javnim repozitorijumima drugih predmeta (recimo https://github.com/ftn-ai-lab/sc-2015/blob/master/v4/v4-reseno.ipynb).
Zbog toga je predlog da odradite samo prepoznavanje slova na slici, tako što ćete ručno napisati samu proceduru pretrage regiona, a ne da koristite openCV (obična pretraga matrice). Kada izdvojite slovo sa slike, možete ga poslati na neurosnku mrežu (može i ona sa vežbi) i prepoznati koje je slovo u pitanju. Pretpostavljam da ćete se na ovakvoj temi mnogo bolje snaći i da će biti manje komplikovano. Ulazna slika može odmah biti crno-bela tako da ne morate da vršite obradu slike.
Ali ako ipak želite da odradite ono što ste specificirali, može i to, ali vodite računa da ne kopirate sav kod sa drugih repozitorijuma da ne bi rizikovali da isti bude detektovan kao plagiran.
Razmislite šta ćete raditi i odgovorite mi u naredna 24h.
Radicu onda rucno prepoznavanje regiona. Samo, da li to znaci da redove razdvajam rucno, pa njih na slova ili ste mislili da imam samo 1 red pa njega razdvajam na slova?