install

pip install -r requirements.txt

データ収集

cd collect_twitter_data
python collect_data.py

chmod +x download.sh
./download.sh

https://github.com/STAIR-Lab-CIT/STAIR-captions.git からgit cloneして、tar.gzファイルを解凍 stair_captions_v1.2_train.jsonをdata以下にmv

に従ってローカル環境にインストール

{local}/lib/mecab/dic/ipadic

をmecab_dict_pathの引数で与える

python dataset.py

python3 build_vocab.py --use_twitter

python3 resize.py

python3 train.py

python3 train.py --mode twitter --save_step 20 --batch_size 16 --do_further_train

事前に、画像の重複をチェックする！！

cd collect_twitter_data
python check_duplicated_images.py

sample.pyの中でモデル、データセットを指定してから、

python3 sample.py