该项目用双向长短时记忆神经网络和条件随机场(Bi-LSTM-CRF)的命名实体识别
data:已标注的医疗数据,O非实体部分,TREATMENT治疗方式, BODY身体部位, SIGN疾病症状, CHECK医学检查, DISEASE疾病实体.
data_origin:项目提供的医疗数据,需要转化为目标序列标记集合
transfer_data:目标序列化脚本
model:训练模型需要的字向量
训练集1 | 测试集 | 训练集准确率 | 测试集准确率 |
---|---|---|---|
6268 | 1571 | 0.965 | 0.845 |