OpenMOSS/CoLLiE

[BUG] Evaluation 时使用并行可能不会完整地遍历一遍数据

Opened this issue · 1 comments

KYLN24 commented

猜测是并行 size 或 batch size 设置不当(无法整除数据量),可能会有数据被重复计算。

KYLN24 commented

发现问题了,在这里记一下,是torch的DistributedSampler在drop_last=False的时候会将最后一个batch pad 到 batch_size,因此 CollieBatchSampler 后面做的处理没有生效

不对,不是这个问题