/hackathon-eksmo-backend-test

Тестовое задание для участия в хакатоне издательства «ЭКСМО»

Primary LanguagePython

Описание задачи:

  1. На серверной стороне должна быть реализована возможность распознавания голосовых сообщений с помощью API асинхронного распознавания (Yandex SpeechKit).
  2. Приложение должно иметь возможность записывать голосовые сообщения в режиме реального времени и отправлять их на сервер для распознавания.
  3. Приложение должно иметь возможность распознавать голосовые сообщения, сохраненные в формате аудиофайла, и выводить результат на экран.

Требования к реализации:

  1. Для работы приложения необходимо получить API-ключ от сервиса API асинхронного распознавания (Yandex SpeechKit).
  2. Приложение должно предоставлять пользователю возможность записи голосовых сообщений и отправки их на сервер для распознавания.
  3. Приложение должно иметь возможность распознавания голосовых сообщений в формате аудиофайла.
  4. Приложение должно выводить результат распознавания голосовых сообщений на экран/консоль.
  5. Код должен быть выложен на GitHub и содержать инструкцию по запуску приложения.

Инструкция по запуску приложения:

Подготовка

Клонируем репозиторий:

git clone https://github.com/alexander-kurchin/hackathon-eksmo-backend-test

Создаём виртуальное окружение:

cd hackathon-eksmo-backend-test
python -m venv venv && . venv/scripts/activate
pip install -r requirements.txt

Создаём файл .env и помещаем туда свой API-ключ по аналогии с .envexample.

Запуск

Запись и распознавание 5-секундной речи через микрофон:

python microphone.py

Либо сами устанавливаете длительность записи:

python microphone.py --time <seconds>

Распознавание аудиофайла example_audiofile.wav:

python audiofile.py

Распознавание вашего аудиофайла:

python audiofile.py --path <path>