GuangtaoLyu/FETNet

训练数据集准备方式咨询

Closed this issue · 5 comments

作者好,首先感谢开源FETNet。

背景:我想使用FETNet获取去除手写体后的图片。因此需要使用自己的数据集进行训练,目前有两种方式准备数据集。

第一:使用PS工具,将手写体涂抹成白色
image

第二:打印图片,然后人工手写红色字体,最后扫描。 通过不同颜色区分
image

问题:

  1. 这两种数据准备方式的优缺点,哪种方式更适用于FETNet
  2. 数据集的数量最少需要达到多少张才足够
  3. 有没有更好的数据准备方式推荐

希望能得到回答,不胜感激。

感谢回答。
屏幕截图 2024-03-05 182731

描述:如上图,我使用第一种方式准备了数据集进行训练,然后再对训练集中的某一张图片进行推理,得到的结果显示有部分推理得到的区域和标注的区域不一致(左边是训练的标注、右边是推理的结果)。 这会是什么原因呢。

好的,稍后我发到您的邮箱。我先关闭此issue。