ymcui/Chinese-BERT-wwm

您好,我想请教一个代码上的细节

4vicii opened this issue · 0 comments

我调用DataCollatorForWholeWordMask,发现返回的结果里只有input_ids和label,缺少了attention_mask和 token_type_ids这两个信息,torch_call方法返回的也只有input_ids和label两个键值对,我发现您的示例代码里,在trainer里传递了一个tokenizer,这是否说明在训练前您还使用了一次tokenizer切词?