pbcquoc/vietocr

Thắc mắc về đầu vào Image, Acc per char

KaiKenju opened this issue · 1 comments

Chào a, cảm ơn a vì đã đóng góp sản phẩm này cho cộng đồng,
Hiện tại e đang có thắc mắc là:

  • có có thử pretrained lại model của a(run lại ) trong vietocr_gettingstart và ở phần trainer, thì e có chạy 20000iter trong 2h trên colab và acc per char của e khá thấp chỉ đạt 0.63 thì e nên cải thiện điều gì ?

image

  • ngoài ra e vẫn chưa hiểu về cái input: có phải ảnh đầu image đc token hóa thành các vector đặc trưng (word embedding) hay là image đc phân đoạn ra rồi làm phẳng ...
    image
    (e vẫn chưa hiểu cốt lõi nó lắm)
    A có thể giải đáp giúp e với, E cảm ơn. Hi vọng đc a phản hồi sớm.

https://pbcquoc.github.io/vietnamese-ocr/
Em tham khảo tài liệu này nhé.