zhengchen1999/DAT

训练问题咨询

Nanahasan opened this issue · 8 comments

作者您好,我想请问一下两个问题
1、训练时是只训练整张图片中64x64的某一块吗?
2、训练时是训练三通道的RGB图片,评估时转换为ycbcr空间吗? 我发现有些文章在训练时也转换为ycbcr空间,两者有什么影响吗?

非常感谢您的解答!

  1. 每一个iteration是只训练其中一块,通过随机裁剪得到;
  2. 不好意思,我并没有在ycbcr空间中训练过。使用ycbcr空间(Y通道)计算PSNR、SSIM是依据之前的方法,确保公平对比。在计算其他指标,如LPIPS还是在rgb通道上。(PS:我认为ycbcr活rgb通道训练,差别不大)
  1. 在显存足够的时候,直接将整个图片送入网络。网络可以接受任意大小的输入。

  2. 在显存不足的情况下,可以设置use_chop: True,使用滑动窗口的方式最后拼接起来。相比直接测试整个图片,速度会慢一些。

  3. 不论使用整个图片还是分块测试,性能差距不大,根据你的情况选择。

你好,我想問一下,您在訓練過程中是否遇到一些类似导入问题
,我这边一直显示报错DATModel 没有被正确注册到 MODEL_REGISTRY 中,我想咨询下这应该怎么解决

环境配置问题,重新安装一下。参考 #1

环境配置问题,重新安装一下。参考 #1

我的Cuda为12.4,默认情况下我装的torch2.4对应CUDA12.的版本与您 对应的basicsr 的要求,安装 torch==1.8.0 和对应的 torchvision 和 torchaudio 版本不一致,
出现了版本不兼容的问题
这个basicsr只能支持1.8.0的版本吗?

不止支持1.8.0,这个是我当时实验的环境,便于复现结果。
最新版本的也可以使用。但是建议用2.0以前的。
重新安装环境,建议用一个新的环境。DATModel没有注册,应该是basicsr setup错误,此时已经安装了basicsr,后续可能会始终存在问题。