/whisper_01

Solução de IA para transcrição de áudio para texto, inclusive de audiências judiciaisi gravadas em "asf"

Primary LanguageJupyter Notebook

Solução para transcrição de audiências judiciais com Whisper

Adaptado de https://github.com/openai/whisper por J. E. S. Pimentel


O Whisper é um modelo de IA de reconhecimento de fala multilíngue da OpenAI. É de código aberto e suporta diversos formatos de entrada, inclusive o "asf", adotado pelo SAJ/eSAJ.

O código combina a praticidade do ambiente Colab, Python e a biblioteca ffmpeg com o modelo de IA para transcrever as audiências judiciais e gravar a saída em arquivo "txt".


Instruções

  1. Salve sua cópia do Colab
  2. Use GPU
  3. Rode as célular individualmente.
  4. Atenção com espaços e caracteres especiais ao informar o nome do arquivo de vídeo/áudio (se preferir, renomeie-o).