CLUEbenchmark/CLUE

pad_token_id不一致

JohnHerry opened this issue · 2 comments

试用了一下roberta_chinese_3L312_clue_tiny, 发现加载起来以后,Tokenizer的pad_token_id是0, 而model.config.pad_token_id是1, 这种情况下我想做长度对齐填充,是填零呢还是一?

感谢回复。看样子大概率是0,因为vocab表里[pad]在第一行呢。