Cannot reproduce the accuracy in the paper

Question

Cannot reproduce the accuracy in the paper

Closed this issue 2 years ago · 7 comments

longmalongma commented 2 years ago

我按照默认参数，先经过预训练stage0静态图片，stage1bl30k，然后经过youtube和davis的主训练，最后按照默认参数测试只得到85.6%的精度，比论文中报告的86.1%低0.6%，麻烦问下这可能是什么因素导致的呢？

Answer 1 · 2022-11-25T13:51:33.000Z

个人认为存在一些抖动是正常的，我的实验中，不经过预训练只训练stage2可以复现84.5的结果。
另外，可以问一下，楼主训练使用的设备和训练各个阶段的耗时吗。

Answer 2 · 2022-11-25T13:56:22.000Z

个人认为存在一些抖动是正常的，我的实验中，不经过预训练只训练stage2可以复现84.5的结果。另外，可以问一下，楼主训练使用的设备和训练各个阶段的耗时吗。

我只训练stage02复现结果是83.9%，我用2卡1080ti，耗时没有具体记录，大概3轮得一周多吧至少。

Answer 3 · 2022-11-25T13:57:40.000Z

个人认为存在一些抖动是正常的，我的实验中，不经过预训练只训练stage2可以复现84.5的结果。另外，可以问一下，楼主训练使用的设备和训练各个阶段的耗时吗。

可以加v详聊，我邮箱dangjsh@mail2.sysu.edu.cn

Answer 4 · 2022-11-25T14:01:00.000Z

个人认为存在一些抖动是正常的，我的实验中，不经过预训练只训练stage2可以复现84.5的结果。另外，可以问一下，楼主训练使用的设备和训练各个阶段的耗时吗。

我只训练stage02复现结果是83.9%，我用2卡1080ti，耗时没有具体记录，大概3轮得一周多吧至少。

2卡1080ti显存有点太小了，现在VOS还是比较吃卡的。如果只是2*1080ti的话，这点衰减真不算大了。

Answer 5 · 2022-11-25T14:03:48.000Z

个人认为存在一些抖动是正常的，我的实验中，不经过预训练只训练stage2可以复现84.5的结果。另外，可以问一下，楼主训练使用的设备和训练各个阶段的耗时吗。

我只训练stage02复现结果是83.9%，我用2卡1080ti，耗时没有具体记录，大概3轮得一周多吧至少。

2卡1080ti显存有点太小了，现在VOS还是比较吃卡的。如果只是2*1080ti的话，这点衰减真不算大了。

好吧，那我用4卡1080ti试试。

Answer 6 · 2022-11-25T17:59:55.000Z

Fluctuations in performance exist (std in s03: https://github.com/hkchengrex/XMem/blob/main/docs/TRAINING.md#outputs). The performance might also be different if/when you use a different batch size.
You can also try model selection -- test the last few models and use the best one (also documented in https://github.com/hkchengrex/XMem/blob/main/docs/TRAINING.md#outputs).

Related: #32

Answer 7 · 2023-02-14T18:38:11.000Z

Continue in #60 if needed