/Old_Book_OCR

古籍识别

Primary LanguagePython

汉语古籍のOCR

环境:Window10 python3.7.1 PyCharm Community 2019.3.2

图片文件./img

pdf文件./pdf

代码文件暂定放在根目录

聚类实现代码./cluster

进度报告文件./log

getImg.py 从pdf中获取图片

Binarization.py 对图片进行二值化

splitImg.py 图片分割

checkSplit.py 检测图片合理切割的正确率