shawroad opened this issue 2 years ago · 2 comments
您好,在gpt2这种生成模型中,输入的真实label不应该是和输入的input_ids错位吗?然后进行损失计算。 我看您代码中是没有错位的,因为什么原因呢? 谢谢了~
他复用了GPT2LMHeadModel这个类里的loss,这里面计算loss的时候已经错位了,你可以看源码
OK 我一般是自己实现这个loss,所以没细看