/AIxBookathon

Primary LanguageJupyter Notebook

제4회 AI x Bookathon

제 4회 AI x Bookathon 대회에 사용된 코드 입니다. 자세한 후기와 저희 팀이 접근 하였던 방법은 이 곳에서 찾아 보실 수 있습니다.

Data Crawling

  • collecting_text.ipynb
      모델의 전체적인 fine-tuning을 위해서 수집한 브런치 데이터의 크롤링에 사용된 코드입니다.

  • collecting_text_for_epsiode.ipynb
      에피소드 별 키워드를 브런치에서 검색한 후 나타나는 데이터를 크롤링하는 코드입니다.

Training

  모델 훈련은 다음과 같이 진행 하였습니다.

python train.py \
  --data_name 'collected_data.txt' \
  --model_name 'model1' \
  --batchsize 8 \
  --epoch 5 \
  --save_steps 500 \
  --overwrite_ouput_dir True 

Inferring

  모델을 통한 다음 문장 생성은 다음과 같이 진행 하였습니다.

python infer.py \
  --sequence '담대한' \
  --model_name 'model1' \
  --maxlen 300 \
  --sample True

최종 결과물

 저희가 생성한 작품의 제목은 '과거에서 찾은 나'로, 주인공이 모네의 작품과 타인을 만나며 자신의 삶을 담대하게 맞서 나가는 스토리 입니다.