Hỏi cách huấn luyện trên tập dữ liệu tùy chỉnh
Opened this issue · 0 comments
leviethung2103 commented
Cho mình hỏi là: Mình có 1 tập dữ liệu viết tay tầm 1300 hình. Mỗi hình là 1 chữ viết tay tiếng Nhật Kanji.
Mình muốn train model OCR cho tập dữ liệu này thì mình nên chỉnh sửa như thế nào ?
Hiện tại thì mình có làm như sau:
- Chuẩn bị dataset để train, valid
- Sửa đổi config->vocab: thay bằng từ tiếng Nhật có tập dataset
Không rõ mình có cần phải sửa đổi model không nhỉ ? Hiện tại default mình thấy đang dùng VGG19 làm backbone.
Hiện tại mình đang theo hướng fine tune từ pre-tranined model. Đây là config của mình