moothes/A2S-v2

关于无监督RGB-D SOD数据集的实验

Opened this issue · 3 comments

作者您好,最近拜读了您的A2S-v2,并用您提供的代码进行了复现,MAE结果如下:

第一阶段:d;第二阶段:d

RGBD135 NJUD NLPR SIP
原文 .037 .109 .043 .124
复现 .063 .159 .063 .166

第一阶段:cdot;第二阶段:d

RGBD135 NJUD NLPR SIP
原文 .029 .060 .034 .051
复现 .033 .069 .041 .071

复现的性能与原文似乎有一定差异,特别是只将rgb-d sod数据集用于第一阶段,请问作者出现这种差异的原因是什么?
论文中的Ours是否表示的是:在第一阶段只使用RGB-D SOD数据集呢?

感谢您对我们工作的关注。
我认为您可以从以下方面进行验证:

  1. 文中的Tab5提供了第一阶段训练得到的伪标签质量结果(经过CRF)。您可以先对比一下该结果,验证伪标签生成是否有差异。
  2. 您可以先下载我们提供的训练好的模型,验证其结果与文中是否有差异。
  3. 第二阶段训练时,我们发现会有比较严重的过拟合,因此我们是选用的训练过程中的最佳模型,而不是最后一轮的训练结果。

论文中的Ours是否表示的是:在第一阶段只使用RGB-D SOD数据集呢?

您的理解是正确的。

作者您好,我用您提供的模型在RGBD-TR-2185数据集上进行测试,MAE结果如下:

RGBD-TR (MAE)
Ours(原文) .110
Ours(提供的模型) .138
Ours(复现) .147
RGBD-TR (MAE)
Ours_mm(原文) .062
Ours_mm(提供的模型) .062
Ours_mm(复现) .062

从上述表中可以看到,使用mm设置的模型效果与论文中的结果一致,但是为什么在第一阶段只使用RGB-D SOD数据集得到的效果和论文中有一定差异呢?根据实验结果,您提供的模型(a2s_rgbd_split.pth)在RGBD-TR上仅有0.138的MAE以及0.658的F,与论文似乎还有一定差距,请问导致这种情况的原因是什么呢?

我测试的命令如下:

python test.py a2s --gpus 0 --stage 1 --weight ./Stage1/a2s_rgbd_split.pth --crf

输出结果如下:

Dataset d_RGBD-TR : |################################| 2184/2185 Mean-F: 0.658, EM: 0.682, MAE: 0.138, IOU: 0.438, dis: 0.144.

目前的代码是较早的版本,我们会尽快更新到最新的代码。
我们已经更新了训练好的模型,您可以再次下载测试一下