medical_record_ner

albert for relation eletrac for NER

通过train_spo下面跑病例发现，在MRC结合start,end方式标注样本，训练样本，在处理较长文本的NER效果不佳。比如一个长度300左右的病例（尽管训练的时候设置max length=512）,在病例前面的NER识别没问题，后面的NER就会识别错所以初步推断，CRF的泛化能力比start，end的MRC方式要更强

Chriszhangmw/medical_record_ner