Adaptado de https://github.com/openai/whisper por J. E. S. Pimentel
O Whisper é um modelo de IA de reconhecimento de fala multilíngue da OpenAI. É de código aberto e suporta diversos formatos de entrada, inclusive o "asf", adotado pelo SAJ/eSAJ.
O código combina a praticidade do ambiente Colab, Python e a biblioteca ffmpeg com o modelo de IA para transcrever as audiências judiciais e gravar a saída em arquivo "txt".
- Salve sua cópia do Colab
- Use GPU
- Rode as célular individualmente.
- Atenção com espaços e caracteres especiais ao informar o nome do arquivo de vídeo/áudio (se preferir, renomeie-o).