z814081807/DeepNER

损失函数的问题

Fino2020 opened this issue · 7 comments

您好,我直接使用您的模型进行训练,但是模型的损失函数只增不减,最后达到nan,请问这是什么原因呢?torch==1.11.0,

您好,我直接使用您的模型进行训练,但是模型的损失函数只增不减,最后达到nan,请问这是什么原因呢?torch==1.11.0,

大概率transformers版本问题,参考readme里面的版本

transformers的版本应该没问题,初试代码使用的是crf,我用mrc之后好像就好了

另外我想请问,如果我想跑英文的NER任务,使用中文的NER模型需要替换什么呢?跪求

transformers的版本应该没问题,初试代码使用的是crf,我用mrc之后好像就好了

可以看一下closed issues 有类似问题,调整学习率应该会有改善。

另外我想请问,如果我想跑英文的NER任务,使用中文的NER模型需要替换什么呢?跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样),英文的话比较简单,直接用原始提供的就可以了,可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题,以及预训练模型使用英文版的(英文语料训练的)。

另外我想请问,如果我想跑英文的NER任务,使用中文的NER模型需要替换什么呢?跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样),英文的话比较简单,直接用原始提供的就可以了,可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题,以及预训练模型使用英文版的(英文语料训练的)。

作者您好,能不能推荐一下英文NER的预训练模型,我在github上找到的全都是中文的,跪求,感谢!

另外我想请问,如果我想跑英文的NER任务,使用中文的NER模型需要替换什么呢?跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样),英文的话比较简单,直接用原始提供的就可以了,可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题,以及预训练模型使用英文版的(英文语料训练的)。

作者您好,能不能推荐一下英文NER的预训练模型,我在github上找到的全都是中文的,跪求,感谢!

https://github.com/huggingface/transformers/blob/main/README_zh-hans.md 可以仔细学习下,里面有英文NER例子