想问问，作者跑的时候有没有发现边界比较差

Question

GYxiaOH opened this issue 5 years ago · 19 comments

rt。。。发现最后的结果边界都比较差，会往内缩一点，不知道是不是我迭代的次数太少了，但是600个epoch也太长了吧，现在我一般只训50个epoch左右，600个估计一个星期能有一个结果

Answer 1 · 2019-11-19T11:34:13.000Z

PSE好像也是这个问题

Answer 2 · 2019-11-22T03:44:09.000Z

@GYxiaOH 你有改他后处理的参数吗，我训练一开始边界还行，后来越训练边界差的越多了。不仅仅是收缩的问题，一开始输出的框比较贴文字轮廓的，但是后来就趋向输出水平的四边形，还有就是漏检的比较多。

Answer 3 · 2019-11-22T04:12:46.000Z

@FredlinT 尝试过后处理参数，没啥作用，后期趋向水平我到是没发现，漏检确实多。。看召回率就觉得挺差的

Answer 4 · 2019-11-22T04:15:19.000Z

@GYxiaOH 我改后处理的那个参数，边界能有一定的调整，但是漏检和趋向水平我没办法。

Answer 5 · 2019-11-22T04:23:15.000Z

@FredlinT 你怎么改的，我怎么改边界感觉都不大好

Answer 6 · 2019-11-22T04:24:31.000Z

@也只是相对变好，你试试pse_cpp传进去的最后一个阈值，改到3以上。

Answer 7 · 2019-11-25T10:00:11.000Z

我也觉得边界是有点问题

Answer 8 · 2019-11-29T02:14:29.000Z

而且我发现一个问题，对于比较长的图，越靠近图像下部，拟合边界会有整体上移的趋势，大家有遇到么

Answer 9 · 2019-12-02T07:38:13.000Z

而且我发现一个问题，对于比较长的图，越靠近图像下部，拟合边界会有整体上移的趋势，大家有遇到么

pse也是这个问题,whai362/PSENet#121

Answer 10 · 2019-12-02T07:45:48.000Z

而且我发现一个问题，对于比较长的图，越靠近图像下部，拟合边界会有整体上移的趋势，大家有遇到么

pse也是这个问题,whai362/PSENet#121

好的，十分感谢

Answer 11 · 2019-12-03T08:43:09.000Z

把长和宽都resize到32的倍数就没问题了，因为icdar图片大小都是一样的而且是32的倍数，所以这个项目里没出问题 @pekinghk

Answer 12 · 2019-12-03T09:16:34.000Z

@xxlxx1 ..好像是好一点，这是什么原理啊。。

Answer 13 · 2019-12-03T09:17:18.000Z

@GYxiaOH 我感觉是因为网络中间过程polling取整了，最小的是原始图片的1/32，如果原始图片大小不能被32整除，那么特征图得到的框对于原始图片就会产生便宜，因为取整舍去了小数部分。有点像maskrcnn里面说的roipooling 和它提出的 roialign

Answer 14 · 2019-12-03T09:32:18.000Z

把长和宽都resize到32的倍数就没问题了，因为icdar图片大小都是一样的而且是32的倍数，所以这个项目里没出问题 @pekinghk

好的，我试试

Answer 15 · 2020-05-18T02:13:26.000Z

trainer.py[line:171]: test: recall: 0.000000, precision: 0.000000, f1: 0.000000
在验证的时候，出现这样的问题，请问有人知道吗？

Answer 16 · 2020-10-06T11:10:13.000Z

@Debugerss I have a same error, have you fixed it yet ?

Answer 17 · 2020-12-16T02:00:14.000Z

trainer.py[line:171]: test: recall: 0.000000, precision: 0.000000, f1: 0.000000
在验证的时候，出现这样的问题，请问有人知道吗？

你好！请问你解决了吗？ @Debugerss

Answer 18 · 2021-05-24T12:03:26.000Z

@Debugerss I also get the same error, have you fixed it?( test: recall: 0.000000, precision: 0.000000, f1: 0.000000)

Answer 19 · 2021-06-20T07:38:54.000Z

@xxlxx1 你好，为什么最后的预测结果只有标注框的坐标信息但没有实际的文本识别信息呢？