OCR

Un script de python para convertir archivos PDF a texto y procesar palabras.

Instrucciones

Descargar e instalar Docker.
Descargar e instalar Visual Studio Code.
Descargar el repositorio.
En la carpeta pruebas, poner los archivos PDF a analizar.
Abrir la carpeta raiz del repositorio con Visual Studio Code.
Seleccionar Reopen in Container en Visual Studio Code para instalar las dependencies en un contenedor.
Ejecutar el script main.py desde el contenedor o Visual Studio Code.