/Dango-ocr

DangoOCR: screenshot OCR recognize 文字识别,支持多种语言,识别后翻译,播放声音

Primary LanguagePython

Dango-OCR(Windows, Mac, Ubuntu)

软件介绍:

DangoOCR:一个开源的文字识别工具,通过选择识别范围自动截取屏幕图片,或者手动加载本地图片实现文字的识别/提取。特点:

  • 界面简单,即下即用
  • 目前支持汉语, 日语, 英语, 韩语, 德语, 法语的文字识别, 会持续优化识别算法
  • 支持截图或者本地加载图片进行识别
  • 支持可视化识别结果,可以手动修正识别结果,并导出文件(.docx, .txt)及对应图片
  • 支持翻译为汉语
  • 如果开启“自动模式”, 选择一个区域后可以自动截屏并进行识别
  • 如果无法使用, 复制"config/error.txt"的内容进行反馈
  • 软件下载(存放目录路径中不能有空格):
    服务器已到期,不再提供下载Windows版下载
    服务器已到期,不再提供下载Mac版(只测了macOS 10.13.3)下载
    服务器已到期,不再提供下载Ubuntu版(只测了ubuntu16.04)下载

OCR算法服务

TODO计划

  • 优化高分辨率屏幕文字较小
  • 导出docx文件时优化排版
  • 算法轻量化,实现离线文字识别

使用方法(以Windows系统为例):

  • 1 解压压缩包后,找到“DangoOCR.exe”文件双击即可运行("Ubuntu"系统下也是双击。macOS系统下需要右键,打开方式选择终端)。在“设置”界面设置"待识别的语言类型"。

  • 2 软件界面如下(汉语识别)。

  • 3 如果在'设置'勾选了'可视化识别结果',可以对结果进行修改并可以导出为txt/docx。
  • 4 软件界面如下(日语识别)。
  • 5 识别英语文档并手动修改。
  • 6 算法debug

参考: