Beispielcode zum Talk "Scalable OCR" vom DevDay 2018 in Dresden
Der Beispielcode zum Talk "Skalierbare OCR Pipelines mit Python, Tensorflow und Tesseract"
Requirements installieren
Die Jupyter-Notebooks nutzen verschiedene Python Pakete, von Jupyter über Numpy zu OpenCV und Tensorflow. Die Pakete können mit
pip install -r requirements.txt --user
installiert werden.
Tesseract
Damit das Tesseract-Notebook ausgeführt werden kann muss Tesseract installiert sein.
Der Link: Tesseract
Tensorflow:
Da das trainierte Modell nicht veröffentlicht werden kann möchte ich für die Tensorflow/Keras Beispiele auf das Jupyter Notebook von François Chollet aus dem Buch "Deep Learning with Python" verweisen.
Das Notebook zeigt wie
- Convolutions visualisiert werden
- Mit Grad-CAM Heatmaps über die Features im Bild generiert werden die zur Aktivierung geführt haben
Zum Notebook