yeyupiaoling/MASR

windows系统多卡训练失败

Closed this issue · 2 comments

windows下无法双卡训练,显示nccl不支持。
修改masr/trainer.py,修改backen为gloo后可以支持多卡训练,但是跑完1个eopch后,loss出现异常,显示loss=nan。
求修改。
Uploading 8888F03CE5C9C5A87CCA97F2F8507B7D.png…

你是在群里提问的那位同学吧。你还是用Ubuntu系统训练吧,