Closed this issue 7 months ago · 1 comments
目前没有这个计划,因为sophia是基于二阶梯度的,这与Adam,SGD,Lion等一阶梯度算法具有较大差异,并无直接比较意义!