/OCR

repositório dedicado a reconhecimento de texto com python

Primary LanguagePython

OCR

repositório dedicado a reconhecimento de texto com python

instalação do tesseract

para baixar para windows
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.0.1.20220118.exe
suport de linguagens https://github.com/tesseract-ocr/tessdata

instalações para o uso do keras

pip install sklearn
pip install imutils
pip install numpy
pip install tensorflow
pip install keras

- o uso do helpers é para padronizar os tamanhos das imagens
  • basicamente você pega o diretório da imagem
  • o trata
  • e do converte em text

melhorias

Aplicação de aprendizado de maquina seria bem útil

imagens utilizadas

oi mundo

promoção do Mequi donalts

para OMR

filtros

  • original
  • escala de cinza
  • escala de azul
  • saida em linhas

referencias

https://medium.com/@ageitgey/how-to-break-a-captcha-system-in-15-minutes-with-machine-learning-dbebb035a710 https://shubhamchauhan125.medium.com/cnncaptchasolver-5625b189a14f http://www.begnini.net/2016/02/08/quebrando-outro-captcha-com-opencv-e-python.html http://www.begnini.net/2015/12/30/quebrando-captcha-com-opencv-e-python.html https://thepythonguru.com/decoding-captchas-using-python/