/gui_recognizer

a simple voice recognition tool

Primary LanguagePython

справка по программе транскрибатор

Транскрибатор

Оглавление

О программе

Установка и настройка

Работа с программой

Горячие клавиши

Разработчики

В планах

О программе

Программа Транскрибатор предназначена для перевода из аудиофайлов в текст – транскрибации. Вы можете транскрибировать аудиокниги, лекции, разговоры, и прочее. Транскрибатору не нужен интернет для распознавания. Он написан на Pythonс использованием библиотеки vosk. Для лучшего качества транскрибации используйте большие модели распознавания и чистую от посторонних шумов запись. Внимание! Большие модели жрут много оперативной памяти, рекомендуемый объём не менее 8 ГБ. Лучше всего 12 или 16.

Установка и настройка

Для установки просто скачайте архив с программой, и распакуйте в удобное для вас место. Так же вам потребуется интернет для скачивания моделей языков для распознавания. Для того, чтобы скачать языковую модель, воспользуйтесь ссылкой ниже, или кнопкой «скачать язык для распознавания» в окне программы.

скачать языковую модель для распознавания

распакуйте модель в папку models\название-папки-с-языком

например так

models\ru в этой папке должны находиться следующие директории:

graph

conf

am"

итакдалее.

Работа с программой

При запуске, фокус попадает на комбинированный список для выбора языка распознавания. Кнопка «скачать язык для распознавания» - откроет страницу для скачивания языковой модели.

Кнопка «выберете файл для транскрибации» - откроет диалог выбора звукового файла для распознавания.

Кнопка «транскрибировать» запустит процесс транскрибации.

Меню «Файл» позволяет выйти из программы, просмотреть информацию о программе, получить справку.

Горячие клавиши

Tabи shift+tab– переходит к следующему элементу окна;

F1 – открывает файл справки в браузере;

CTRL+Q– выход из программы. Список будет пополняться.

Разработчики

Иван Юрьев R1OAZ
r1oaz@yandex.ru
придумал транскрибатор и начал писать программу.

Дениз Синджар denizsincar29
bomberman29ds@yandex.com
оптимизировал и исправлял код, а точнее почти всё переделывал.

О замеченных проблемах, пожеланиях и предложениях пишите на почту разработчиков.

В планах

Прикрутить горячие клавиши к кнопкам, встроить возможность самому наговаривать текст для транскрибации, добавить возможность выбора способа транскрибации, онлайн или офлайн, что-нибудь ещё.