1、论文复现《A Unified MRC Framework for Named Entity Recognition》。使用机器阅读理解的**来进行命名实体识别。
2、训练数据来自于MSRA命名实体识别训练语料,已经做相应的修改转换。
pytorch >=1.6.0
transformers>=3.4.0
1、去huggingface官网下载BERT预训练权重,然后并放在./pretrained_model/
文件夹下
2、在./utils/arguments_parse.py
中修改BERT预训练模型的路径
3、运行train.py
进行训练
4、运行predict.py
进行预测
│ eval_func.py
│ LICENSE
│ predict.py #预测脚本
│ README.md
│ train.py #训练脚本
│
├─checkpoints
├─data #数据
│ test.json
│ train.json
│
├─data_preprocessing
│ data_prepro.py
│ tools.py
│
├─log
├─model
│ │ model.py #模型结构
│ │
│ ├─loss_function #损失函数
│ │ binary_cross_entropy.py
│ │ cross_entropy_loss.py
│ │ focal_loss.py
│ │ multilabel_cross_entropy.py
│ │ span_loss.py
│ │
│ └─metrics #测评函数
│ metrics.py
│
├─output #输出文件,预测得到的结果放在这里
│ result.json
│
├─pretrained_model #改文件夹用来存放预训练模型
│ └─chinese_roberta_wwm_ext
└─utils
arguments_parse.py #设置模型训练相关的参数
logger.py #存放日志等脚本