关于valid_ids的疑问
luozhouyang opened this issue · 3 comments
luozhouyang commented
请问valid_ids
代表什么呢?我看代码只是起到一个masking的作用。但是看数据处理的逻辑,valid_ids
基本上都是1
,那么这种情况下它的作用是什么呢?
yangheng95 commented
luozhouyang commented
看数据处理的逻辑,因该是在wordpiece分词把单词分成多个piece的情况下,首个piece会设置valid_id
为1
,后续的piece的valid_id
为0
。目的是为了只选择第一个piece?
luozhouyang commented
好的,了解了。多谢~