Opened this issue a year ago · 1 comments
猜测是并行 size 或 batch size 设置不当(无法整除数据量),可能会有数据被重复计算。
发现问题了,在这里记一下,是torch的DistributedSampler在drop_last=False的时候会将最后一个batch pad 到 batch_size,因此 CollieBatchSampler 后面做的处理没有生效
不对,不是这个问题