์ต๊ทผ 3๋ ๊ฐ ๋์์ ๊ฑฐ๋ฆฌ์ ์๊ธด ๊ฐ์ฅ ํฐ ๋ณํ๋ ๊ณต์ ํฅ๋ณด๋๋ฅผ ํ๋๋ก ํ ๋ค์ํ ์ด๋์๋จ์ ๋ฑ์ฅ์ ๋๋ค.
์ค์ ๋ก ๊ณต์ ํฅ๋ณด๋ ์๋น์ค๊ฐ ๋์ ๋ ๋ค, ์๋น์ค ์ด์ฉ ๊ฑด์๊ฐ 2020๋ ์๋ฐ๊ธฐ ๋๋น ํ๋ฐ๊ธฐ์ 60%๊ฐ ์ฆ๊ฐ ํ ์ ๋๋ก PM ( Personal Molbility ) ์์ฅ์ ๊ธ๊ฒฉ๋๋ก ํ์ฐํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ด์ ๋ฐ๋ฅธ ์ฌ๋ฌ ๋ฌธ์ ๋ค๋ ๊ฐ์ด ๋ฐ์ํ๊ณ ์์ต๋๋ค. ์ด์ฉ๊ฐ์ด ์ฆ๊ฐํ ๋งํผ ๊ทธ์ ๋ฐ๋ฅธ ์ฌ๊ณ ๋ค๋ ๋ง์ด ๋ฐ์ํ๊ณ ์์ผ๋ฉฐ, "ํฅ๋ผ๋( ํฅ๋ณด๋ + ๊ณ ๋ผ๋ )" ๋ผ๋ ์ ์กฐ์ด ๊น์ง ๋ฑ์ฅํ ์ ๋๋ก ์ด์ ์ ํน์ ๋ณดํ์์๊ฒ ์ํ์ด ๋๊ณ ์์ต๋๋ค.
๊ทธ๋์ ์ ๋ถ๋ ์ด์ ๊ด๋ จ๋ ๋ฒ๊ณผ ์ ๋๋ค์ ๋ง๋ค๊ณ ์ํํ๊ณ ์์ง๋ง ์ ์ง์ผ์ง์ง ์์ ์์ง๋ ๋ง์ ์ฌ๊ณ ๋ค์ด ์๋ฐ๋ฅด๊ณ ์์ต๋๋ค. ๊ทธ๋์ ์ ํฌ ํ์ ํฅ๋ณด๋ ์๋ฒํ์ ( ํฌ๋ฉง ๋ฏธ์ฐฉ์ฉ, ๋์น ) ํ์ง๋ฅผ ์๋ํ ํ์ฌ ์ฌ์ฉ์๋ค์ ์์ ํ ์ ๋ ํฅ๋ณด๋ ์ฌ์ฉ์ ๋๋ชจํ๋ ค๊ณ ํฉ๋๋ค.
์ด๋ฏธ์ง, ๋์์, ์ค์๊ฐ ์์์์ Object Detection์ ์ด์ฉํ์ฌ ์ฌ์ฉ์์ ํฅ๋ณด๋ ์ฌ์ฉ ์๋ฒํ์ ( ํฌ๋ฉง ๋ฏธ์ฐฉ์ฉ, ๋์น )๋ฅผ ํ์งํ๊ณ ์ด์ฉ์์ ์์ ํ ์ฃผํ์ ์ ๋ํ๋ค.
- GPUํ๊ฒฝ : V100 ์๋ฒ, Google Cloud Platform(GCP) ์๋ฒ
- ํ ํ๋ ฅ Tools : Notion, Weights&Biases, Github, Google Drive
- ๊ฐ๋ฐ Tools : VScode, Jupyter Lab
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ฐ ํ๋ ์์ํฌ : PyTorch, Streamlit, FastAPI
- Annotation Tools : Supervisely
Version | ๋ฐ์ดํฐ ์ | Train ๋ฐ์ดํฐ ์ | Val ๋ฐ์ดํฐ ์ | Test ๋ฐ์ดํฐ ์ | ์ธ๋ถ์ฌํญ |
---|---|---|---|---|---|
1.0 | 1128 | 790 | 225 | 113 | ์ด๊ธฐ ๋ฐ์ดํฐ์ |
2.0 | 1321 | 960 | 240 | 121 | Class ๋ถ๊ท ํ ํด์๋ฅผ ์ํ ์ด๋ฏธ์ง ์ถ๊ฐ |
2.1 | 1364 | 1003 | 240 | 121 | Edge case ํด๊ฒฐ์ ์ํด ํฉ์ฑ ์ด๋ฏธ์ง ์ถ๊ฐ |
2.2 | 1364 | 995 | 245 | 124 | ๋ฐ์ดํฐ์ (Train, Val, Test) ์ฌ์กฐ์ |
3.0 | 1447 | 1078 | 245 | 124 | Box ์๋ ๋ฐฐ๊ฒฝ ์ด๋ฏธ์ง ์ถ๊ฐ |
- PM์ผ๋ก ์ฃผํ์ค์ธ ์ฌ๋์ด ๋ด๊ธด ์ด๋ฏธ์ง or ์์ ๋ฐ์ดํฐ
- ํฌ๋กค๋ง, ์ง์ ์ดฌ์์ผ๋ก ๋ชจ์ ๋ฐ์ดํฐ
- ์ด๋ฏธ์ง์ ๋ค์์ฑ, ์ ์๊ถ, ์ด์๊ถ ๊ณ ๋ ค
- Supervisely ํด์ ์ด์ฉํ์ฌ ์ง์ Annotation
- ๋ผ๋ฒจ : 0๋ฒ(ํฌ๋ฉงO, ํผ์O), 1๋ฒ(ํฌ๋ฉงX, ํผ์O), 2๋ฒ(ํฌ๋ฉงO,ํผ์X), 3๋ฒ(ํฌ๋ฉงX,ํผ์X)
- ํ๊ทธ : Orientation, Blur, Out of Focus, Low quality
- ํ์ : JSON, YOLO
- ์ด์ฉ์์ ํฌ๋ฉง ์ฐฉ์ฉ์ฌ๋ถ์ ๋์น์ฌ๋ถ ๋ถ๋ฅ
- PM๊ณผ ์ด์ฉ์๋ฅผ ํจ๊ป detectionํ๊ณ ๋ถ๋ฅ
- ํด๋ํฐ ์ฌ์ฉ์ฌ๋ถ, ์ฐ๋ น๊น์ง ํ์ฅ ๊ฐ๋ฅ
- 1 Stage Detection ๋ชจ๋ธ
- ๋น ๋ฅธ ์๋, ๋ณด์ฅ๋ ์ฑ๋ฅ
- ๋์์ inference
- ํต์ฌ ํค์๋ : Implicit Knowledge
- DarkNet53์ CSP ์ ์ฉ
- Feature๋ฅผ ๋๋ก ๋๋์ด ํ๋์ Part๋ง ์ฐ์ฐํ๊ณ Concat
- Feature map์ด ๋์ ๋์ด ๊ณ์ฐ๋๋ DenseNet์ ๋ฌธ์ ์ ๊ทน๋ณต
- Spatial Pyramid Pooling ์ ์ฉ
- Multi Level Feature ์ฌ์ฉ
- Semanticํ ์ ๋ณด์ Fine-grained ์ ๋ณด๋ฅผ ํฌํจ
- Implicit Knowledge ์ ์ฉ
- Addition, Multiplication ๋ฐฉ์
- Good representation์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ ๊ตฌ๋ถํ ์ ์๋ Hyper plain์ ์ฐพ์์ ์ฑ๋ฅ ํฅ์
Precision | Recall | mAP50 | mAP0.5~0.95 | |
---|---|---|---|---|
All | 0.907 | 0.803 | 0.881 | 0.642 |
Alone Helmet | 0.865 | 0.804 | 0.864 | 0.597 |
Alone no Helmet | 0.797 | 0.87 | 0.898 | 0.674 |
Sharing Helmet | 1 | 0.667 | 0.833 | 0.567 |
Sharing no Helmet | 0.964 | 0.871 | 0.927 | 0.729 |