train

Question

train

Closed this issue 3 years ago · 7 comments

train.sh模型找不到

Answer 1 · 2021-04-05T03:56:07.000Z

运行时显示OSError: Model name './bert/torch_roberta_wwm' was not found in tokenizers model name list (bert-base-uncased, bert-large-uncased, bert-base-cased, bert-large-cased,...
是我模型没有下载对吗

Answer 2 · 2021-04-13T03:54:40.000Z

这个文件夹里面你下的什么样子

Answer 3 · 2021-04-13T06:30:28.000Z

非常感谢您的回复！
因为环境问题，我是使用google colab运行的 researchHub是项目的根目录，模型放在“/researchHub/BERT”文件夹下，在脚本中也改了相应BERT_dir。
并且在readme的“并将 vocab.txt 中的两个 unused 改成 [INV] 和 [BLANK]（详见 processor 代码中的 fine_grade_tokenize）”这个部分，我发现vocab.txt里的内容是从[unused1]-[unused99],对此处如何改变存在一些疑问，如图：

Answer 4 · 2021-04-14T14:35:24.000Z

或者是出现此问题，是模型解析有误吗？

Answer 5 · 2021-04-20T03:40:59.000Z

把bert_config.json 改成config.json

Answer 6 · 2021-04-20T05:36:13.000Z

感谢你的回复问题已解决 config.json文件名已改，除此之外，对tokenizer = BertTokenizer.from_pretrained(model_name)和bert_model = BertModel.from_pretrained(MODEL_PATH)这两个函数的参数也进行了修改。

Answer 7 · 2021-04-20T05:37:37.000Z

谢谢作者！！