1.运行环境:Pytorch 1.3.1, CUDA 10.0, CuDNN 7.6.5, Python 3.6.12
2.依赖库安装:pip install -r requirements.txt
1.下载数据集:下载VisDial数据集以及默认参数文件test_btmup_f.hdf5,并将其置于PROJECT_ROOT/data/
文件夹下。
2.下载预训练Faster R-CNN,将其置于PROJECT_ROOT/data/
文件夹下:
3.下载预训练GloVe词向量,将glove.6B.300d.txt
置于PROJECT_ROOT/data/
文件夹下。
1.数据预处理
cd PROJECT_ROOT/script/
python prepro.py
2.词向量初始化
cd PROJECT_ROOT/script/
python create_glove.py
python main_v1.0.py
or python main_v0.9.py
模型保存在saved_models
文件夹内
python eval_v1.0.py
or python eval_v0.9.py