Solução para transcrição de audiências judiciais com Whisper

Adaptado de https://github.com/openai/whisper por J. E. S. Pimentel

O Whisper é um modelo de IA de reconhecimento de fala multilíngue da OpenAI. É de código aberto e suporta diversos formatos de entrada, inclusive o "asf", adotado pelo SAJ/eSAJ.

O código combina a praticidade do ambiente Colab, Python e a biblioteca ffmpeg com o modelo de IA para transcrever as audiências judiciais e gravar a saída em arquivo "txt".

Instruções

Salve sua cópia do Colab
Use GPU
Rode as célular individualmente.
Atenção com espaços e caracteres especiais ao informar o nome do arquivo de vídeo/áudio (se preferir, renomeie-o).

jespimentel/whisper_01

Solução para transcrição de audiências judiciais com Whisper

Adaptado de https://github.com/openai/whisper por J. E. S. Pimentel

Instruções