/QuiAudientes

PyQt5 programm for transcribation

Primary LanguagePython

QuiAudientes (AudioTranscriber)

Это приложение позволяет транскрибировать аудио с видео YouTube с помощью модели Whisper.

Особенности

  • Возможность выбирать размер корпуса Whisper для транскрибации
  • Выбор языка для транскрибации
  • Простой интерфейс для ввода ссылки на видео и просмотра результата транскрибации

Использование

  1. Пожалуйста, обратите внимание на то, что для корректной работы приложения Вам необходимо установить CUDA драйвера и добавить их в системные переменные. Гайд по ссылке: https://www.youtube.com/watch?v=xTF_n1jp9n8 Также, пожалуйста, обратите внимание на то, что при первом запуске определённого корпуса нужно подождать пока он будет загружен. Интерфейс работает не ассинхронно, поэтому после нажатия на "кнопки" подождите пока окно приложения станет доступным для взаимодействия и в лог выведится информационное сообщение.
  2. Если фон отображается как чёрный экран, пожалуйста, укажите путь к фону в коде.
  3. Установите все необходимые зависимости.
  4. Откройте код в любом IDE, поддерживающем python.
  5. Запустите файл
  6. Укажите размер Whisper и язык для транскрибации.
  7. Вставьте ссылку на видео YouTube.
  8. Нажмите кнопку "Транскрибировать" и дождитесь результатов.

Пример работы приложения

Иллюстрация к проекту Иллюстрация к проекту

Автор

Kaktys36, Telegram: @KiloLex