模型训练相关

Question

模型训练相关

Closed this issue a year ago · 4 comments

你好大神，1：我训练你模型时源代码里使用MultiStepLR修改了学习率，但是train的时候学习率依然没变，这个bug你修复了吗？如果修复了请问您是如何修复的呢？
2: 还有一个现问题就是在compressai 框架下您是如何加载预训练模型呢？
期待并感谢您的回复！！！

Answer 1 · 2023-06-08T05:13:12.000Z

1.目前的代码里确实有学习率的bug，加载模型继续训练的时候，手动调整学习率会失效，会被加载的优化器参数覆盖。我目前还没修复这个bug。解决方法很简单，最粗暴的就是把train.py里的323-325行直接删掉，并不会影响性能。但你用MultiStepLR替换掉optim.lr_scheduler.ReduceLROnPlateau的话，不需要其他的修改，它应该就会按你给的策略正常改变学习率吧？
2.这个问题我没太理解，可以再详细一点说明吗？

Answer 2 · 2023-06-11T00:59:02.000Z

谢谢大神！！第二个问题我举个例子：比如实验室突然停电了，训练的模型留下的有bestcheckpoint ，为了不浪费时间重新训练，我该怎么加载这个bestckpt,在他的基础上进行训练呢，这个问题也许有点简单，对于我这个小白来说挺难的5555，类似于怎么在mse训练出来的ckpt上进行ms-ssim微调。期待您的回复感激不尽！！

Answer 3 · 2023-06-12T07:35:54.000Z

加载模型的时候，给这个参数赋值ckpt的路径就行了。

Answer 4 · 2023-06-15T02:44:21.000Z

谢谢谢谢大哥！！