RyanKor/kaggle-project

이번 인공지능 한글 문학 생성 대회 1등 프로젝트의 프로젝트 진행에 대한 글

Opened this issue · 0 comments

데이터 수집부터 가공, 모델링까지 전반적인 프로세스에 대해 다룬 글이다.

인상적인 부분은 모델링보다도 데이터를 수집하기 위해 어떤 프로세스를 떠올렸는지, 그리고 이 데이터를 어떻게 전처리를 하는 과정에 대해 내가 잘 몰랐던 부분들을 많이 언급하고 있다.

여태까진 책이나 강의에서 데이터 전처리가 거의 다 완료된 것들을 제공했기 때문에 직접적으로 전처리를 해 볼 기회가 많이 없었는데, 이걸보면서 다른 사람들이 프로젝트를 어떻게 수행하는지 감이 온다.

https://l-yohai.github.io/AI-Bookathon-%EB%8C%80%EC%83%81-%ED%9B%84%EA%B8%B0/?fbclid=IwAR0jKbR78c9MiGCcNSozxte0m47ZDl4r23mjF7T9n44V58yJkZrF3moONtM

그리고 데이터 탐색 관련해서는 엘라스틱 서치를 사용했는데, 이런 부분도 눈여겨 볼 만 하다.