使用 Python、OpenCV、OCR(Tesseract)來取得帶有雜點的驗證圖片文字。
將圖片裁切(此例有邊框),並進行灰階設定,再透過迭代每一個 pixel,走訪過上下左右共 49 個點,來決定原先的點是否為雜點,然後將其去除,最後把圖片膨脹(另一種說法,就是把白色加粗),讓 OCR 好辨識圖片當中的文字,再建立文字檔案,並加以輸出。
Using python, Open-CV, and OCR to retrieve words from images with specks.
Python