HarukiYqM/Non-Local-Sparse-Attention

在Urban100上的测试结果偏差很大

laoyangui opened this issue · 2 comments

由于显存限制,batch_size训练时设为8,以下是epoch=158的测试结果:
Evaluation:
100%|██████████| 5/5 [00:04<00:00, 1.04it/s]
[Set5 x2] PSNR: 38.051 (Best: 38.051 @epoch 1)
100%|██████████| 14/14 [00:18<00:00, 1.30s/it]
[Set14 x2] PSNR: 33.845 (Best: 33.845 @epoch 1)
100%|██████████| 100/100 [01:33<00:00, 1.07it/s]
[B100 x2] PSNR: 32.246 (Best: 32.246 @epoch 1)
100%|██████████| 100/100 [06:51<00:00, 4.11s/it]
[Urban100 x2] PSNR: 32.461 (Best: 32.461 @epoch 1)

Set5 、Set14、B100测试结果符合预期,但在Urban100上比论文结果(33.42)低了接近1DB。训练参数除了batch_size设为8其余保持默认。为什么在Urban100上会突然降低这么多,请问是什么原因呢?

你好,这是一个正常的现象。Urban100和manga109比其他数据集困难得多,分辨率高同时纹理细节繁多。其他数据集相对简单很多performance很快就可以饱和了。想要在Urban100达到较好的效果,需要train更多的epoch (1000),以及更小的learning rate,Urban100上的performance会在训练后期boost。近些年的模型都有类似的特点,performance的差距也主要集中在Urban100和manga109。

按照论文的setting,显存不够的话,尽可能增大batchsize(可以的话12),train满1000个epoch ,是可以得到和论文接近的结果的。

@HarukiYqM 感谢回复,后续有显卡的话我会按原设置跑下。非常棒的工作!!