/PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

Primary LanguagePythonApache License 2.0Apache-2.0

English | 简体中文

Chat

简介

PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用落地。

🚀 社区

PaddleOCR 由 PMC 监督。Issues 和 PRs 将在尽力的基础上进行审查。欲了解 PaddlePaddle 社区的完整概况,请访问 community

⚠️注意:Issues模块仅用来报告程序🐞Bug,其余提问请移步Discussions模块提问。如所提Issue不是Bug,会被移到Discussions模块,敬请谅解。

📣 近期更新(more)

  • 🔥🔥《PaddleX文档信息个性化抽取新升级》,PP-ChatOCRv3创新性提供了基于数据融合技术的OCR模型二次开发功能,具备更强的模型微调能力。百万级高质量通用OCR文本识别数据,按特定比例自动融入垂类模型训练数据,破解产业垂类模型训练导致通用文本识别能力减弱难题。适用自动化办公、金融风控、医疗健康、教育出版、法律党政等产业实际场景。10月10日(周四)19:00直播为您详细解读数据融合技术以及如何利用提示词工程实现更好的信息抽取效果。 报名链接

  • 🔥2024.10.1 添加OCR领域一站式全流程开发能力:

    • 飞桨一站式全流程开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的一站式全流程开发能力:

      • 🎨 模型丰富一键调用:将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的17个模型整合为5条模型产线,通过极简的Python API一键调用,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计200+模型,形成20+单功能模块,方便开发者进行模型组合使用。
      • 🚀提高效率降低门槛:提供基于统一命令图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持高性能部署、服务化部署和端侧部署等多种部署方式。此外,对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等,进行模型开发时,都可以无缝切换
    • 支持文档场景信息抽取v3(PP-ChatOCRv3)、基于RT-DETR和PicoDet的高精度版面区域检测模型、高精度表格结构识别模型SLANet_Plus、版面矫正预测模型UVDoc、公式识别模型LatexOCR、基于PP-LCNet的文档图像方向分类模型

  • 🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案

🌟 特性

支持多种 OCR 相关前沿算法,在此基础上打造产业级特色模型PP-、PP-Structure和PP-ChatOCR,并打通数据生产、模型训练、压缩、预测部署全流程。

📝 文档

完整文档请移步:docs

📚《动手学 OCR》电子书

🎖 贡献者

⭐️ Star

Star History Chart

许可证书

本项目的发布受 Apache License Version 2.0 许可认证。