Project of MLinAD CLASS
-
- 데이터 수집
-
- 학습모델 훈련
-
- 평가
-
- 적용
환경 : 파이썬, 파이토치, ???, 욜로를 대체할 모델
모델 조사 : ???(상표 탐지, 얼굴탐지)
데이터 수집 : 인터넷 크롤링, 일상 주변 물건
방식 : 모자이크( 아예 블러처리?, 색 비슷하게?, 정적(이미지)일 때 동적(동영상)일 떄? )
직면한 문제점 : PIL 이미지와 텐서이미지 입력(해결, Resize후 Crop했더니 ) cv2의 채널 출력방식 BGR RGB(해결, cv2에서 GBR2RGB함수 제공) deeplabv3는 마스크 이미지가 추가로 필요함. torch.max()문제 (미해결, 모델에 관한 문제며, 마스크이미지가 필요한 문제)
주제변경 : 카메라로 인식후 gtts이용해 물체 표현 다만 물체의 위치를 시계방향으로 번역할 것(정면방향)