TTS-Rápido

TTS de maneira rápida com interface/UI utilizando EDGE-TTS, Elevenlabs e em breve ConquiTTS

Este é um projeto que permite gerar áudio a partir de texto usando diferentes modelos de voz e velocidades de fala. Ele utiliza duas APIs diferentes para gerar o áudio: Edge-TTS (Gratuitamente) e Elevenlabs com api e Elevenlabs de maneira grauita (com limite). Além disso, oferece a opção de cortar o silêncio do áudio resultante.

Funcionalidades

Edge-TTS: Utiliza a biblioteca Edge-TTS para gerar áudio a partir do texto inserido.
Elevenlabs: Oferece duas opções para gerar áudio usando a API Elevenlabs: uma versão gratuita e outra que requer uma chave de API.
Conqui-TTS: Em desenvolvimento.

Como usar

Online

No Colab, só dê play e seja feliz (Costuma funcionar mais a API FREE do elevenlabs, obviamente tem limite de requests.)
No Huggingface, tem mais limitações, mas o edge-tts é tranquilo.

Local

Clone o repositório para sua máquina local. git clone https://github.com/RafaelGodoyEbert/TTS-R-pido
Instale as dependências necessárias especificadas no arquivo requirements.txt. pip install -r requirements.txt
Execute o script Python app.py.
Acesse o aplicativo Gradio no navegador.
Ou execute o webui.bat

Dependências

gradio: Para criar a interface de usuário interativa.
pydub: Para manipular arquivos de áudio.
requests: Para fazer solicitações HTTP à API Elevenlabs.

Como contribuir

Se você deseja contribuir para este projeto, sinta-se à vontade para abrir uma issue ou enviar um pull request. Todas as contribuições são bem-vindas!

Agradecimentos

A rany2 pelo Edge-TTS.
A Elevenlabs pela API de TTS.
Aos colaboradores deste projeto.

Autor

Desenvolvido por Rafael Godoy Ebert.

Se gostou deste projeto e deseja apoiá-lo, considere doar pelo Pix.

RafaelGodoyEbert/TTS-R-pido