Prueba tecnica Dapi (Digital Americas Pipeline Initiative)

Extrae texto de fotos de facturas, lo modela bajo archivos JSON e intenta extraer información especifica para colocarla en CSV

Hace uso de Boto3, API de AMAZON

No logre extraer con exactitud la informacion requerida para el CSV, para hacer esto de forma exacta para cualquier tipo de factura necesitaria muchos datos y algo de ML.
Implementar una expresion regular por cada factura es inviable.

Carpeta de resultados:

results/

Para instalar dependencias

python -m pip install -r requirements.txt

Para ejecutar

python test.py resources/images/
                (image dir)