pbcquoc/vietocr

lỗi data huấn luyện

nhathoang0110 opened this issue · 2 comments

Em chào a ạ. Em có sử dụng finetune trên dữ liệu của mình, Em có dùng visualize dữ liệu thì thấy có một vài kí tự nó decocde thành * như sau thì có vấn đề gì không ạ ? Em check trên dữ liệu của mình thì nằm trong vocab cả rồi.
image

bình thường e nhé, đó là data enhancement thôi.