Divine-w/PLFM

Python

基于多模态大语言模型的关系抽取研究

安装依赖项

pip install -r requirements.txt
pip install -e .

下载数据集和预训练模型

MNRE Dataset link
METER-CLIP16-RoBERTa (resolution: 224^2) pre-trained on GCC+SBU+COCO+VG link

关系抽取流程

参考METER将MNRE数据集和人工标记样本分别处理成.arrow格式放在data文件夹下
运行run_mmfeat_extract.py提取样本多模态特征

python run_mmfeat_extract.py meter_clip16_roberta_pretrain

运行compute_similarities.py为MNRE数据集中每个样本匹配前三个最相似的人工标记样本

python compute_similarities.py

利用多模态提示模板和多模态大语言模型生成高质量辅助知识
运行run.py利用原始文本和辅助知识训练文本模型并进行评估

python run.py with task_finetune_mnre_bert full_train

鸣谢

本代码基于METER授权于Apache 2.0。