损失函数的问题

Question

损失函数的问题

Fino2020 opened this issue 2 years ago · 7 comments

Fino2020 commented 2 years ago

您好，我直接使用您的模型进行训练，但是模型的损失函数只增不减，最后达到nan，请问这是什么原因呢？torch==1.11.0，

Answer 1 · 2022-04-22T02:10:18.000Z

您好，我直接使用您的模型进行训练，但是模型的损失函数只增不减，最后达到nan，请问这是什么原因呢？torch==1.11.0，

大概率transformers版本问题，参考readme里面的版本

Answer 2 · 2022-04-22T02:27:33.000Z

transformers的版本应该没问题，初试代码使用的是crf，我用mrc之后好像就好了

Answer 3 · 2022-04-22T02:28:26.000Z

另外我想请问，如果我想跑英文的NER任务，使用中文的NER模型需要替换什么呢？跪求

Answer 4 · 2022-04-24T09:14:16.000Z

transformers的版本应该没问题，初试代码使用的是crf，我用mrc之后好像就好了

可以看一下closed issues 有类似问题，调整学习率应该会有改善。

Answer 5 · 2022-04-24T09:18:05.000Z

另外我想请问，如果我想跑英文的NER任务，使用中文的NER模型需要替换什么呢？跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样)，英文的话比较简单，直接用原始提供的就可以了，可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题，以及预训练模型使用英文版的(英文语料训练的)。

Answer 6 · 2022-04-25T07:41:50.000Z

另外我想请问，如果我想跑英文的NER任务，使用中文的NER模型需要替换什么呢？跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样)，英文的话比较简单，直接用原始提供的就可以了，可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题，以及预训练模型使用英文版的(英文语料训练的)。

作者您好，能不能推荐一下英文NER的预训练模型，我在github上找到的全都是中文的，跪求，感谢！

Answer 7 · 2022-04-25T07:48:52.000Z

另外我想请问，如果我想跑英文的NER任务，使用中文的NER模型需要替换什么呢？跪求

中文的NER中tokenizer 需要特殊处理(分词原理不一样)，英文的话比较简单，直接用原始提供的就可以了，可以去transformers提供的案例找一下。他们两者的区别就在于tokenizer处的细节问题，以及预训练模型使用英文版的(英文语料训练的)。

作者您好，能不能推荐一下英文NER的预训练模型，我在github上找到的全都是中文的，跪求，感谢！

https://github.com/huggingface/transformers/blob/main/README_zh-hans.md 可以仔细学习下，里面有英文NER例子