Criar um sistema em que o usuário pudesse enviar arquivos e uma IA pudesse classificá-los quanto a categoria que pertecem. Isso foi inpirado no sistema da EMTU que geralmente fica pedindo para o usuário reenviar documentos, pois enviaram algo errado. Nesse caso o próprio sistema poderia dizer que os arquivos não condizem com a categoria.
Jéssica - Criação da tela, envio de arquivos, treinamento de modelos, envio de PDF
Pedro Torini - Integração com Chat-GPT, envio de JPG
- Python
- OpenAI
- Tesseract
- Zeroshot
- Azure Blob Storage
- Instalar o python na máquina, caso não possua, é possivel baixa-lo na Microsoft Store
- Entrar no site
Instalar a versão e manter tudo no padrão no processo de instalação (Programa necessário para reconhecimento de texto em imagem)
https://digi.bib.uni-mannheim.de/tesseract/
tesseract-ocr-w64-setup-5.4.0.20240606.exe
-
git clone https://github.com/PTorini1/poc-ia.git
-
cd poc-ia
-
pip install pandas streamlit fitz matplotlib streamlit-option-menu transformers tensorflow tf-keras streamlit-pdf-viewer PyMuPDF openai==0.28 pytesseract tesseract azure-storage-blob asyncio python-dotenv
-
python -m venv venv
-
venv\scripts\activate
- Criar arquivo .env na raíz do projeto e coloque suas chaves
OPENAI_API_KEY = <SUA CHAVE> BLOB = <SUA CHAVE>
-
streamlit run app.py
Obs: Na hora de rodar a aplicação, pode acontecer de a biblioteca não se comportar bem no localhost e será necessário usar o outro link pelo IP que é fornecido no terminal Também desabilitamos o envio de JPG para teste, pois seria necessário um passo extra para download