Este projeto é um aplicativo web que permite aos usuários fazer upload de uma imagem, extrair texto da imagem usando OCR (Optical Character Recognition) e converter o texto extraído em áudio usando a tecnologia de conversão de texto em fala (TTS).
app.py
: Código do servidor Flask com endpoints para fazer upload de imagens e recuperar arquivos de áudio.main.py
: Código do aplicativo Streamlit..gitignore
: Especifica arquivos e diretórios a serem ignorados pelo Git.requirements.txt
: Lista as dependências necessárias para o projeto.test/
: Diretório contendo código de teste.
Python 3.x
Pip (gerenciador de pacotes do Python)
Tesseract OCR
-
Clone o repositório e navegue até o diretório do projeto:
git clone https://github.com/gu1lh3rm3s0rd1/conversor-de-texto.git cd conversor-de-texto
-
Crie um ambiente virtual:
python -m venv venv venv\Scripts\activate # Windows source venv/bin/activate # Unix ou MacOS
-
Instale as dependências do projeto:
pip install -r requirements.txt
-
Inicie o servidor Flask:
python app.py
O serviço vai estar disponível em
http://localhost:5000
. -
Num segundo terminal, inicie o app do Streamlit:
streamlit run main.py
O serviço vai estar disponível em
http://localhost:8501
.
- Abra seu navegador e vá para
http://localhost:8501
para acessar o aplicativo Streamlit. - Carregue um arquivo de imagem.
- O aplicativo irá processar a imagem, extrair o texto, convertê-lo em áudio e disponibilizar um player para ser reproduzido.
- Python
- Flask
- Tesseract OCR
- Google Text-to-Speech API
- Streamlit