yaoppeng/U-Net_v2

训练超参数epochs的选择

Opened this issue · 6 comments

作者您好,我看到您在论文中中写道"The maximum number of training epochs is set to
300.",但是github中 PolypSeg/Train.py 中 周期数设置为100,请问:论文里息肉分割的评估结果是基于300个还是100个epoch跑的?

我复现Unet-V2的代码,按照Train.py的默认参数跑,(epoch设的100),结果精度都略低于原文的结果,不知是否是周期的原因?

dataset              dsc    iou    mae
-----------------  -----  -----  -----
CVC-300            0.875  0.805  0.011
CVC-ClinicDB       0.937  0.890  0.007
Kvasir             0.923  0.871  0.021
CVC-ColonDB        0.808  0.729  0.025
ETIS-LaribPolypDB  0.757  0.684  0.016
mean               0.860  0.796  0.016

当时我在GPU上跑了5次取的平均值。PolyP上我好像跑了100个epoch。不知道你有没有做过其他的改动呢? 一般不同的训练环境会有些误差, 但是感觉你这个差距还是稍微有点大的。

好的。上面的结果是第100个epoch的,我取了best_epoch观察结果,如下所示。总体比刚刚好些,但像CVC-300(EndoScene)和Kvasir这种差得略多。关于代码,我只修改了一些保存路径,其余的未做修改。
另外,想请教一下作者是否有test.py文件,想获取测试集上的预测图像,看一看。非常感谢。

dataset              dsc    iou    mae
    -----------------  -----  -----  -----
    CVC-300            0.880  0.809  0.011
    CVC-ClinicDB       0.940  0.895  0.007
    Kvasir             0.917  0.865  0.027
    CVC-ColonDB        0.813  0.731  0.026
    ETIS-LaribPolypDB  0.794  0.717  0.013
    mean               0.869  0.803  0.017
    =============got best dice 0.8686372222226902 at epoch 61=============

repo里面好像已经有了。

by the way, 下面是我跑过的其中一个数据供参考。

                        dsc    iou    mae
 492 ----------------- ------  -----  -----
 493 CVC-300            0.899  0.832  0.008
 494 CVC-ClinicDB       0.945  0.900  0.007
 495 Kvasir             0.930  0.882  0.018
 496 CVC-ColonDB        0.806  0.726  0.028
 497 ETIS-LaribPolypDB  0.798  0.720  0.016
 498 mean               0.875  0.812  0.016