Closed this issue 5 months ago · 2 comments
windows下无法双卡训练,显示nccl不支持。 修改masr/trainer.py,修改backen为gloo后可以支持多卡训练,但是跑完1个eopch后,loss出现异常,显示loss=nan。 求修改。
你是在群里提问的那位同学吧。你还是用Ubuntu系统训练吧,