视觉对话

1.运行环境：Pytorch 1.3.1, CUDA 10.0, CuDNN 7.6.5, Python 3.6.12

2.依赖库安装：pip install -r requirements.txt

1.下载数据集：下载VisDial数据集以及默认参数文件test_btmup_f.hdf5，并将其置于PROJECT_ROOT/data/文件夹下。

2.下载预训练Faster R-CNN，将其置于PROJECT_ROOT/data/文件夹下：

3.下载预训练GloVe词向量，将glove.6B.300d.txt置于PROJECT_ROOT/data/文件夹下。

1.数据预处理

cd PROJECT_ROOT/script/
python prepro.py

2.词向量初始化

cd PROJECT_ROOT/script/
python create_glove.py

python main_v1.0.py or python main_v0.9.py

模型保存在saved_models文件夹内

python eval_v1.0.py or python eval_v0.9.py

jfzhouyoo/VisualDialog