Un script de python para convertir archivos PDF a texto y procesar palabras.
- Descargar e instalar Docker.
- Descargar e instalar Visual Studio Code.
- Descargar el repositorio.
- En la carpeta
pruebas
, poner los archivos PDF a analizar. - Abrir la carpeta raiz del repositorio con Visual Studio Code.
- Seleccionar
Reopen in Container
en Visual Studio Code para instalar las dependencies en un contenedor. - Ejecutar el script
main.py
desde el contenedor o Visual Studio Code.