l294265421/alpaca-rlhf

训练问题

wanghao-007 opened this issue · 0 comments

请问模型加载时,做模型并行化操作吗?我发现我直接在deepspeed-chat中跑7B的模型都会爆显存,显卡是A100 80G。