pad_token_id不一致
JohnHerry opened this issue · 2 comments
JohnHerry commented
试用了一下roberta_chinese_3L312_clue_tiny, 发现加载起来以后,Tokenizer的pad_token_id是0, 而model.config.pad_token_id是1, 这种情况下我想做长度对齐填充,是填零呢还是一?
YueCongPKU commented
您好!
您的邮件我已收到,我会尽快查看的。谢谢哈!
JohnHerry commented
感谢回复。看样子大概率是0,因为vocab表里[pad]在第一行呢。