「致谢」参考代码:
https://github.com/WindChimeRan/pytorch_multi_head_selection_re
Environment: python3.7 + pytorch1.1.0
执行前先设置工作路径
export PYTHONPATH=`pwd`
# 注意,数据中如果存在空格,则该条数据会被丢掉!todo...
# 预处理后同时生成train:dev:test==8:1:1
python script/preprocess.py -i raw_data/data.json -o raw_data/sample.json
# 生成vocab,所在目录为配置中data_root
python main.py --exp_name medical --mode prep
python main.py --exp_name medical --mode train
# 结果写入文件,配置文件中字段eval_result_file和predict_result_file指定
python main.py --exp_name medical --mode eval
python main.py --exp_name medical --mode predict
[
{
"urid":"1000";
"text":"**是世界上历史最悠久的国家之一,有着光辉灿烂的文化和光荣的革命传统",
"annotation": [
{
"start": 0,
"end": 2,
"value":"**"
}
]
}
]
- 增加多类型实体同时抽取能力