您好,怎么标注自己的数据呢,训练集上的标注每个英文字母代表什么意思呢?
youyanjiangcuca opened this issue · 3 comments
youyanjiangcuca commented
您好,怎么标注自己的数据呢,训练集上的标注每个英文字母代表什么意思呢?
yuanxiaosc commented
数据详细说明查看官网,简单来说字母表示词性,可以不用标注(本模型没有使用到)
ad56917783 commented
首先要定义新的label和schema,然后自己找大量的预料文本,用LAC等工具根据PKU标准进行分词和词性标注,利用规则等手段根据schema和以下json模板{“predicate”:","subject_type":"","object_type":"","subject":"","object":""}进行自动标注。后面的训练和预测和原文一样。
ad56917783 commented
规则可以是在命名实体设别的基础上根据句法依存树进行三元组提取