- Level 2 CV Team 03 - λΉλ¨μ½μΈ
- ν ꡬμ±μ : κΉλκ·Ό, λ°μ ν, κ°λ©΄κ΅¬, μ μ¬μ±, ννμ§
μ€λ§νΈν° μΉ΄λ κ²°μ , μΉ΄λ©λΌλ‘ μΉ΄λ μΈμ, μ£Όμ°¨μ₯ λ΄ μ°¨λ λ²νΈ μΈμκΈ° λ± μ¬λμ΄ μ°κ±°λ μ΄λ―Έμ§ μμ μλ λ¬Έμλ₯Ό μ»΄ν¨ν°κ° μΈμν μ μλλ‘ νλ κΈ°μ μ OCR(Optical Character Recognition)μ΄λΌ λΆλ₯΄λ©° μν μ λ€μν νΈμ κΈ°λ₯ μ 곡μ νμμ μΈ κΈ°μ μ λλ€.
ν΄λΉ νλ‘μ νΈμμλ ν¬κ² κΈμ κ²μΆ(text detection), κΈμ μΈμ(text recognition), μ λ ¬(Serialization)μ 3κ°μ§ λ¨κ³λ‘ ꡬμ±λ OCR taskμμ κΈμ κ²μΆ task λ§μ μ§μ€μ μΌλ‘ ν₯μ μν€λ κ²μ λͺ©νλ‘ ν©λλ€.
κ°λ° μΈμ΄ : PYTHON (IDE: VSCODE, JUPYTER NOTEBOOK)
μλ²: AI STAGES (GPU: NVIDIA TESLA V100)
νμ
Tool : git, notion, wandb, google spreadsheet, slack
νλ‘μ νΈ νλ‘μ° μ°¨νΈ
μκΈ°ν νλ‘μ νΈλ λ κ°μ λ°μ΄ν°λ₯Ό μ 곡νμΌλ©° μΆκ°μ μΈ λ°μ΄ν° μ¬μ©μ μ νμ΄ μμμ
-
κΈ°λ³Έ μ 곡 λ°μ΄ν°
- ICDAR17 λ°μ΄ν° μ€ νκΈ λ°μ΄ν° (ICDAR17_Korean)
- Boostcamp 3κΈ° camper λ€μ΄ upstageμ annotation toolμ μ΄μ©ν΄ μ§μ μμ±ν λ°μ΄ν° (Annotated)
-
μΆκ° μ¬μ© λ°μ΄ν°
ICDAR17 μ 체 λ°μ΄ν° β μ 체 λ°μ΄ν° μ€ νλ‘μ νΈ λͺ©νμ λ§μΆ° νκΈμ μμ΄λ§ μ¬μ© (ICDAR17_MLT)
-
UFO : upstageμμ μ 곡ν OCR λ°μ΄ν° νμ€ format
dataset
βββ ICDAR17_Korean β¬β images
| ββ ufo βββ¬β train.json
| ββ train_v1.json
| ββ valid_v1.json
| ββ train_v2.json
| ββ valid_v2.json
|
βββ Annotated ββββββ¬β images
| ββ ufo βββ¬β annotation.json
| ββ train_v3.json
|
βββ ICDAR17_MLT βββββ raw βββ¬β ch8_training_gt
ββ ch8_training_images
ββ ch8_validation_gt
ββ ch8_validation_images
β‘ Precisionκ³Ό Recallμ μ‘°ν νκ· μΈ F1-score
λ¨, νλμ κΈμ μμμ λΆλ¦¬λ λ€μμ μμμΌλ‘ μμΈ‘νλ κ²μ μ§μνκ³ μ one-to-many matchμ κ²½μ° score 0.8λ‘ penaltyλ₯Ό μ€ νν
β‘ BBoxμ Ground truthμ Predictionμ ννμ λ°λΌ μλ μΈ κ°μ§ κ²½μ°λ₯Ό μκ°ν΄λ³Ό μ μμ
- One-to-one match : νλμ κΈμ μμμ΄ νλμ μμΈ‘ μμκ³Ό μΌμΉνλ κ²½μ°
- Many-to-one match : μ¬λ¬κ°μ κΈμ μμμ΄ νλμ μμΈ‘ μμκ³Ό μΌμΉνλ κ²½μ°
- One-to-many match : νλμ κΈμ μμμ΄ μ¬λ¬κ°μ μμΈ‘ μμμ ν©κ³Ό μΌμΉνλ κ²½μ°