fh2019ustc/DocGeoNet

OCR指标存在一些diff

Opened this issue · 3 comments

作者您好:

我们所使用的矫正图均为github上贴的,但是我们评测的OCR指标与paper中的指标存在一些diff,我们的环境是mac os。

这是我们的tesseract以及pytesseract版本:

image

image

      这是我们复线的指标:

image

非常感谢您的工作,希望能得到您的解答!

您好,谢谢你对我们工作的关注,以及感谢您提供的数据~!

关于这个问题,您可以参考一下DocTr的这个issue
Windows,Linux,Mac三个版本测出来的性能都略有不同,这是正常的。
对于我们的DocTr、DocScanner、DocGeoNet,我们都是在windows10下测试的。

为了这个领域的长期健康发展,我们也建议您可以在paper里注明你们自己的测试环境。
OCR性能对比,我觉得只要环境一致,对比的图像一致,我觉得没什么问题。

祝好~

好的,非常感谢您的解答!

还有一个问题,作者可以分享一下数据集 DIR300的矫正图吗?期待得到您的回复~

好的,我们最近两天会更新repo~