hiyoung123/SoftMaskedBert

为什么要加一个转置?

li-aolong opened this issue · 0 comments

train.py文件的第93行

loss_c = self.criterion_c(out.transpose(1, 2), data["output_ids"])

这里为什么要将第二维和第三维进行转置?是因为数据的第二维才是对应id么?