Этот бот преобразует голосовые сообщения в текст, используя API Whisper от OpenAI. Пользователи могут отправить боту голосовое сообщение, и он вернёт расшифрованный текст в чат.
- Распознавание голосовых сообщений с помощью модели Whisper от OpenAI.
- Конвертация аудиофайлов из формата
.ogaв.wavс помощьюffmpeg. - Простые команды для начала работы и получения помощи.
- Node.js (версия 14.x или выше)
- FFmpeg (убедитесь, что
ffmpegустановлен и доступен в системе)
-
Клонируйте репозиторий:
git clone https://github.com/reactcoder-it/telegram-voice-transcriber.git cd telegram-voice-transcriber -
Установите зависимости:
npm install
-
Создайте файл
.envв корневом каталоге проекта и добавьте в него ваши ключи API:TELEGRAM_BOT_TOKEN=ваш_токен_бота OPENAI_API_KEY=ваш_ключ_от_OpenAI
-
Убедитесь, что
ffmpegустановлен и доступен в PATH системы. Для проверки выполните команду:ffmpeg -version
После завершения настройки запустите бота командой:
npm start