yangjianxin1/CPM

微调OOM问题

TheHonestBob opened this issue · 0 comments

我使用双卡3090-24G加载了官方large模型进行微调,但是我看代码里面会对OOM进行捕获,看显存占用也的确是有规律的某个瞬间显存吃满,1. 请问是什么原因导致这种显存现象的,2. 有OOM是正常现象吗,不会影响模型训练吗