연령, 성별 마스크 착용 여부를 분류하는 모델을 개발한다.
이미지를 데이터로 사용해 Gender(Male, Female), Age(<30, ≥30 and <60, ≥60), Mask(Wear, Incorrect, Corret)를 기준으로 총 18개의 클래스(ex Male, 20, Wear → Class0)로 분류하는 모델을 개발한다.
EDA 통해 훈련에 사용할 image와 라벨을 분석하여 데이터 불균형, 잘못된 라벨링을 탐색하고 이를 기준으로 데이터 Augmentation, 잘못된 라벨링의 수정을 통해 해결하고자 하였다. 또한 모델 선정에서는 이미지 분류에서 뛰어난 성적의 모델을 기준으로 다양한 실험을 통해 선정하였다. 그 외에도 Loss function, ensemble, learning rate, optimizer, 평가방법을 교육에서 배웠던 이론을 기반한 다양한 실험을 통해 선정했다.
대회 진행에서 주어진 기본 베이스라인 코드를 개선해가며 저희만의 베이스라인 코드로 완성시켰습니다.
추가된 기능과 개선사항은 BaseLineCodeV2의 README.md 를 참조 하시면 됩니다:)
베이스라인 코드
- 김백준: 데이터 augmentation, 데이터 불균형 문제 해결법 고민
- 박기정: mlflow tracking server 구축, 모델 설계 및 실험, 베이스라인 코드 개선, 프로덕트 서빙
- 심유정: 데이터 탐색, 실험 아이디어 공유, 데이터 preprocessing 전략 수집 및 실행, AutoML 적용
- 임경태: 팀 목표 및 방향성 설정, 협업 리드, 모델 설계・실험・튜닝, 베이스라인 코드 개선, 프로덕트 서빙
- 전인혁: 데이터 preprocessing 전략 수집 및 실행, 모델 설계 및 실험