LowinLi/Text-Summarizer-Pytorch-Chinese

您好,请问load_model无论是eval还是从某个模型重新训练的时候会提示Id not found in vocab: 40001

DarsonKing opened this issue · 14 comments

就是找不到40001 40002 400xx 这种的vocab,怎么解决呢,是自己生成一个新的词表就行是吗

请问是用的链接分享的词表么

请问是用的链接分享的词表么

是的

萌新想问一下,这个是对数据预处理的时候,按词频分配的id,然后写入词表是吧。我服务器断一次之后,无论我load以往的哪一个模型,都提示vocab找不到40001-40010之间的id

同样出现这个问题,超参vocab_size设置50000,同样也会出现50001、50002等等id找不到

我仔细看了下ooV的代码,这是遇到未登录词时的正常提示,如果没有报outputids2words中的error就是没有报错