hiyoung123/SoftMaskedBert

为什么在backward的时候要把retain_graph设为true呢,不会显存爆炸么

pmouren opened this issue · 0 comments

为什么在backward的时候要把retain_graph设为true呢,不会显存爆炸么