li-aolong opened this issue 4 years ago · 0 comments
train.py文件的第93行
train.py
loss_c = self.criterion_c(out.transpose(1, 2), data["output_ids"])
这里为什么要将第二维和第三维进行转置?是因为数据的第二维才是对应id么?