生成的字符较少时,外围框过大
lvjianjin opened this issue · 2 comments
lvjianjin commented
对于那种一个框内字符较少的情况,经常会出现方框比文本长很多的情况,请问关于这个问题有什么解决方案吗
BboyHanat commented
这个问题可能的情况有两种, 第一是我们为了维持一个特定宽高比例,我们会给框内字少的区域补一些区域(在两边),要不然crnn 训练的时候要padding 黑边,这个实验下来发现是直接从图像中crop多一点来保证字条图宽高比例的效果会好一点(不过这个生成lsvt 格式的数据集的时候已经加了最小旋转矩形包框,应该能解决你的问题,会因为多进程而生成多个文件,合并一下就ok),第二可能就是你的字符集里缺少了一些字符(这个相对概率小一点,但是可能也需要检查一下)
ltm920716 commented
这个问题可能的情况有两种, 第一是我们为了维持一个特定宽高比例,我们会给框内字少的区域补一些区域(在两边),要不然crnn 训练的时候要padding 黑边,这个实验下来发现是直接从图像中crop多一点来保证字条图宽高比例的效果会好一点(不过这个生成lsvt 格式的数据集的时候已经加了最小旋转矩形包框,应该能解决你的问题,会因为多进程而生成多个文件,合并一下就ok),第二可能就是你的字符集里缺少了一些字符(这个相对概率小一点,但是可能也需要检查一下)
@BboyHanat
以上情况的话,对于单纯识别训练可能会好,但是如果接检测模型的话,检测的结果一般是不会扩的,反而会影响实际效果;此外对于训练检测模型的话,扩的太多可能也不是太合适