Use baidu OCR Form api and ChatGPT api to extract FORM from the PDF.
A sample project to serve as the first step to data anylsis.
- text your ocr api and ChatGPT api in the config.ini
- put your pdf in the user_file folder.
- adjust your needed prompt in the config.ini
- simply run the src/ and you can see all the temp form in the temp folder and display form in the output folder.
2023-05-30 10:34 基本满足最小实现要求, 确认需求后再继续改进
2023-06-01 15:44 基本完成了,满足 zoe 的需求,但 ocr 识别上存在的问题还是蛮明显的,考虑要不要换 ocr 识别。
- 单元测试
- GPT prompt engeering
- 使用表格+文本识别时, 文本内容可能过长, 需要对内容进行简单的分割
- 文本识别时,返回的内容空格较多, 可能会对 ChatGPT 调用产生影响
- GPT4 支持
- 其他 ocr 支持
- 百度表格 高精度 v2 支持?
- 表格合并指定内容?
- 文本内容数据转换?
- 多 pdf 处理
- pdf 文件名抓取
- 数据验证