汉语古籍のOCR 环境:Window10 python3.7.1 PyCharm Community 2019.3.2 图片文件./img pdf文件./pdf 代码文件暂定放在根目录 聚类实现代码./cluster 进度报告文件./log getImg.py 从pdf中获取图片 Binarization.py 对图片进行二值化 splitImg.py 图片分割 checkSplit.py 检测图片合理切割的正确率