1.任务介绍
-
了解实体关系抽取任务,主要了解封闭域句子级别的关系抽取任务
-
通过DuIE数据集的标准规范和数据格式来举例说明任务
2.了解命名实体识别和关系分类任务
两者均为分类任务,一个是token级别,一个是句子级别。
搭建分类任务的基于pytorch实现的基本框架
1.预处理
词典,标签词典的生成
输入数据的生成
2.模型
公式推导
模型的搭建
3.训练和预测
训练代码:数据载入,反向传播,参数更新
评价代码:准确率,召回率,F1值的计算
两个子项目:
-
lstm+crf做ner
学习rnn及变体
学习ner任务的基本流程和做法
-
lstm+实体特征+softmax做关系分类
学习常见的降维方法以及torch的api
3.精读Multi-head论文
-
论文的行文逻辑
-
了解联合抽取
-
公式的推导
4.实现Multi-head模型
结合上述两个项目加上表填充即可实现该模型