2021/11/08 ~ 2021/11/15
- 첫 번째 영상에 포함되어있는 부분입니다
- 오징어 게임이 유행할때 초등학생들이 오징어게임 츄리닝을 입은 것을 보고 어떻게 오징어게임을 알까 하는 생각이 들었다
- 오징어게임을 볼 수 있는 넷플릭스에서 일반 프로필의 보안도 pin 번호 잠금 뿐이다. 또 키즈프로필을 사용 할 수 있지만 정말 어린 애들만 볼 수준이라 학생들만 해도 여기에 만족하지 못할 것 같습니다 ( 6살 짜리 제 조카는 백반기행을 봅니다 )
- 플랫폼에서 제공하는 것도 물론 좋지만 화면을 인식해서 유해매체를 차단 할 수 있다면 좋을 것 같아 프로젝트를 시작했다
-
유해매체란 무엇일까?
-
청소년 에게 미칠 수 있는 영향
-
청소년들이 많은 시간을 할애하는 인터넷은 안전한 곳일까?
- 음란물, 폭력, 약물, 도박등 인터넷은 정보의 바다인만큼 유해한 정보도 엄청나게 많습니다 어떻게 사용하냐의 차이죠 아무리 잘 사용해도 팝업이나 광고 등 생각지도 못한데서 튀어 나오는 경우도 있습니다
- 채팅, 글, 댓글등 에서도 비속어와 폭력등이 있습니다 자의든 타의든 미성년자들이 인터넷에서 유해매체를 접하기 아주 쉽습니다
-
- 웹에서 이미지들을 스크래핑해서 가져온후
- 모델에 넣습니다
- 무해 하다면 제자리로 돌려보냅니다
3-1.유해성을 감지한다면 사진을 폐기하고 대체합니다
- 객체인식으로 유해성을 분류후 대체 이미지로 커버
-
- 예기치 않은 검출로 아동 애니메이션 짱구는 못 말려가/ 성인만화 크레용 신짱이 되는걸 우려해서입니다
-
- 셀레니움을 사용해 데이터를 수집했고 이중 분류를 위해 음란물 사진(유해매체)과 인스타그램의 사진(비 유해매체)들을 크롤링 했습니다 , 또 중복되는 사진들은 전부 제거해 줬습니다
-
- 트레인, 발리데이션, 테스트 세개의 세트로 나누어 진행 하였고 전처리로는 증강없이 정규화만 진행했습니다.
- 모델은 레스넷50v2에 인풋과 전처리용 층과 2중 분류를 사용하기위한 출력층을 추가했습니다
- 데이터가 적어 Trainable on 시켰습니다
- Optimizer는 아담 손실함수는 Binary Crossentropy를사용 했습니다
- 추가로 call back함수로 checkpoint와 ealry stopping reduce LR를 사용했습니다
- 데이터 수집의 중요성, 데이터 양의 중요성을 배웠다
- 크롤링 하는 방법을 배웠다
- 사전학습 모델을 가져와 사용 하는 법을 배웠다