BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 在Pytorch当中的实现
2024-01
:创建仓库,支持简单预测与NP实现的简单Attention。
torch==1.7.1以上
训练所需的pth可以在百度网盘下载。
链接: https://pan.baidu.com/s/1Wx6COhH-iZY1TLKObwCV-g?pwd=u6ed
提取码: u6ed
- 下载完库后解压,在百度网盘下载权值,放入model_data
- 运行predict_generate.py。
- 运行predict_itm.py.
- predict_features.py