제 4회 AI x Bookathon 대회에 사용된 코드 입니다. 자세한 후기와 저희 팀이 접근 하였던 방법은 이 곳에서 찾아 보실 수 있습니다.
-
collecting_text.ipynb
모델의 전체적인 fine-tuning을 위해서 수집한 브런치 데이터의 크롤링에 사용된 코드입니다. -
collecting_text_for_epsiode.ipynb
에피소드 별 키워드를 브런치에서 검색한 후 나타나는 데이터를 크롤링하는 코드입니다.
모델 훈련은 다음과 같이 진행 하였습니다.
python train.py \
--data_name 'collected_data.txt' \
--model_name 'model1' \
--batchsize 8 \
--epoch 5 \
--save_steps 500 \
--overwrite_ouput_dir True
모델을 통한 다음 문장 생성은 다음과 같이 진행 하였습니다.
python infer.py \
--sequence '담대한' \
--model_name 'model1' \
--maxlen 300 \
--sample True
저희가 생성한 작품의 제목은 '과거에서 찾은 나'로, 주인공이 모네의 작품과 타인을 만나며 자신의 삶을 담대하게 맞서 나가는 스토리 입니다.