wanghao-007 opened this issue a year ago · 0 comments
请问模型加载时,做模型并行化操作吗?我发现我直接在deepspeed-chat中跑7B的模型都会爆显存,显卡是A100 80G。