- ๋ํ ๊ธฐ๊ฐ : 2022.04.14 ~ 2022.04.21
- ๋ชฉ์ : ์ด๋ฏธ์ง ๋ด ๊ธ์ ์์ญ ๊ฒ์ถ(Text Detection)
์นด๋ฉ๋ผ๋ก ์นด๋ ๋ด ์นด๋ ๋ฒํธ ์๋ ์ธ์, ์ฐจ๋ ๋ฒํธ ์๋ ์ธ์ ๋ฑ OCR (Optimal Character Recognition) ๊ธฐ์ ์ ์ฌ๋์ด ์ง์ ์ฐ๊ฑฐ๋ ์ด๋ฏธ์ง ์์ ์๋ ๋ฌธ์๋ฅผ ์ป์ ๋ค์ ์ด๋ฅผ ์ปดํจํฐ๊ฐ ์ธ์ํ ์ ์๋๋ก ํ๋ ๊ธฐ์ ๋ก, ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ํ์ฌ ๋๋ฆฌ ์ฐ์ด๋ ๋ํ์ ์ธ ๊ธฐ์ ์ค ํ๋์ด๋ค. ๋ณธ ๋ํ์์๋ OCR task ์ค ๊ธ์ ๊ฒ์ถ
๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ณ ๋ํํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
- ๊ธฐ๋ณธ ๋ฐ์ดํฐ์ : ICDAR17_Korean (ICDAR17-MLT ์๋ธ์ )
- ์ ์ฒด ์ด๋ฏธ์ง ๊ฐ์
- Train: 536
- Test: 300
๊น์์ด | ์ด์นํ | ์์ํ | ์ ์ฑํด | ํ์์ฉ |
---|---|---|---|---|
Github | Github | Github | Github | Github |
๊น์์ด
: EDA, Annotation data converting(Polygon to Rectangle)์ด์นํ
: EDA, ์ ์์กฐ์ฌ ํ๊ฒฝ ์ธํ , Fine-tuning ์ ์ฉ์์ํ
: EDA, AiHub ์คํ ๋ฐ์ดํฐ์ ์ ์ฉ์ ์ฑํด
: EDA, Augmentation ์คํํ์์ฉ
: EDA, Validate ๊ธฐ๋ฅ ๊ฐ๋ฐ
1. ๋ฐ์ดํฐ ์ ์ ์กฐ์ฌ
- ๋ํ์์ ์ ๊ณตํ Train data 536๊ฐ ์ด๋ฏธ์ง์ annotation tool์ ํ์ฉํ์ฌ ์ง์ labelingํ 1288๊ฐ์ ์ด๋ฏธ์ง์์ ์๋ชป ๋ ์ด๋ธ๋ง๋ ์ผ์ด์ค๊ฐ ๋ฐ๊ฒฌ๋์ด ์ ์ ์กฐ์ฌ๋ฅผ ์งํ
- ์ ์ ์กฐ์ฌ ๊ฒฐ๊ณผ ์๋ชป ๋ ์ด๋ธ๋ง๋ ๊ฒฝ์ฐ, ํ์ต์์ ์ ์ธํ์๋ค.
- ๋ํ ๋ฐ์ดํฐ 536๊ฐ ์ค 16๊ฐ, ์ถ๊ฐ๋ก ์ ๊ณต๋ฐ์ 1288๊ฐ ๋ฐ์ดํฐ ์ค 127๊ฐ์ ์ด๋ฏธ์ง์์ mis-labeling ๋ฐ๊ฒฌํ์๊ณ , ์ต์ข ์ ์ผ๋ก 143๊ฐ์ ์ด๋ฏธ์ง๋ฅผ ์ ๊ฑฐํ์๋ค.
2. Text Detection Open Dataset ์กฐ์ฌ
- 300๊ฐ์ ํ๊ฐ ๋ฐ์ดํฐ์ ๋นํด ํ์ต ๋ฐ์ดํฐ๊ฐ ์ ์ด ์ถ๊ฐ ๋ฐ์ดํฐ ํ๋ณด๊ฐ ํ์์ ์ด๋ผ๊ณ ํ๋จํ์๊ณ , ์ด๋ฅผ ์ํด OCR ๊ด๋ จ ์คํ ๋ฐ์ดํฐ์ ์กฐ์ฌ ์งํ
- AiHub์ ICDAR19 ๋ฐ์ดํฐ์ ์ ์ ํ ๋ํ ๋ฐ์ดํฐ์ ๊ณผ ๋น์ทํ๊ฒ annotation ๋ ์ด ์๋์ง ๋ถ์ํ์๊ณ , ์ ๋ณ๋ ์ด๋ฏธ์ง๋ฅผ ํ์ต์ ์ฌ์ฉํ๊ธฐ๋ก ๊ฒฐ์
- AiHub ๋ฐ์ดํฐ์ ์ ๋ฐ์ดํฐ ์๊ฐ ๋ง์์ง๋ง ๋ํ ๋ชฉ์ ์ ๋ถํฉํ๋ ๊ณ ํ์ง ๋ฐ์ดํฐ๊ฐ ์ ์ด์ ํ์ต ์ ๊ฒฐ๊ณผ๊ฐ ์ข์ง ์์ ์ต์ข ์ ์ผ๋ก ์ ์ธ
3. Validate
- Test ๋ฐ์ดํฐ์ ๋ถํฌ์ ๋น์ทํ๊ฒ Validation ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํ์ฌ ๋ณธ ๋ํ์ ํ๊ฐ์งํ์ธ DetEval score๊ฐ valid-test ๊ฐ ์ ์๊ฐ alignํ๋๋ก ์ธํ
- ์ํญ๋ง๋ค Validation์ ์ Mean loss, Classification loss, Angle loss, IoU loss๋ฅผ ํ์ธํ์ฌ ์ต์ ์ ๋ชจ๋ธ์ ์ฐพ์ ์ ์๋๋ก ์คํ ํ๊ฒฝ์ ๊ตฌ์ฑ
4. Fine-Tuning ์ ๋ต
- ์ ๊ณต๋ฐ์ ํ์ต ๋ฐ์ดํฐ๋ ํ๊ธ ๋ฐ ์์ด ๊ธ์ ์์ญ์ ํฌํจํ๋ 536๊ฐ์ ์ด๋ฏธ์ง์ด๋ค.
- ์ด 10,000๊ฐ์ ๋ฐ์ดํฐ(ํ๊ธ, ์์ด ์ธ ์ฌ๋ฌ ์ธ์ด ํฌํจ)๊ฐ ์กด์ฌํ๋ ICDAR19๋ฅผ ํ์ฉํ์ฌ ๋จผ์ ๋ชจ๋ธ์ ํ์ตํ ํ, target dataset์ธ 536๊ฐ์ ํ์ต ๋ฐ์ดํฐ์ ๋ํด fine-tuning ์งํ
- 10,000์ฌ๊ฐ์ ๋ฐ์ดํฐ๋ก ํ์ต๋ ๋ชจ๋ธ๋ก target dataset์ ๋ํด fine-tuning์ ์ทจํ๋ ์ ๋ต์ ๋ชจ๋ธ์ ๊ฒฌ๊ณ ์ฑ์ ๋ํด์ฃผ์๊ณ , ๋ชจ๋ธ ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์๋์๋ค.
5. Hyperparameter Tuning
- Fine-tuning๊ณผ augmentation์ผ๋ก ํ์ต๋ ๋ชจ๋ธ์ ์ต์ ํํ๊ธฐ ์ํ์ฌ learning rate์ ๋์ฑ ๋ฎ์ถฐ ํ์ตํ๋ ๋ฑ hyperparameter tuning ์งํ
- ์ต์ข ๋ฆฌ๋๋ณด๋ 0.6752 ์ ์ ๊ธฐ๋ก(8์/19)