tommyMessi/PST-table

请问数据是如何进行标注的,如何进行数据转换?

Opened this issue · 2 comments

请问数据是如何进行标注的,如何进行数据转换?

看样子是pdf->html->json作为label

然后pdf直接图片导出作为输入图片,加上ocr结果作为input