pip install -r requirements.txt
- collect_twitter_data/data_info.pyに、収集したいアカウントを追加する
- 以下を実行
cd collect_twitter_data
python collect_data.py
chmod +x download.sh
./download.sh
https://github.com/STAIR-Lab-CIT/STAIR-captions.git
からgit cloneして、tar.gzファイルを解凍
stair_captions_v1.2_train.json
をdata以下にmv
https://qiita.com/ragzboned/items/834c0bc3caaa494fc906
に従ってローカル環境にインストール
{local}/lib/mecab/dic/ipadic
をmecab_dict_pathの引数で与える
python dataset.py
python3 build_vocab.py --use_twitter
python3 resize.py
python3 train.py
python3 train.py --mode twitter --save_step 20 --batch_size 16 --do_further_train
事前に、画像の重複をチェックする!!
cd collect_twitter_data
python check_duplicated_images.py
sample.pyの中でモデル、データセットを指定してから、
python3 sample.py