/ai-audio-vg

Artificial Intelligence for Windows by VladimirGav. ai-audio-vg

Primary LanguageBatchfile

AI Audio для Windows от VladimirGav

Официальные репозитории

Возможности сборки

  • Автоматическая установка для Windows
  • Генерация речи по тексту
  • Генерация песен по тексту
  • Поддержка нескольких языков
    • English (en)
    • German (de)
    • Spanish (es)
    • French (fr)
    • Hindi (hi)
    • Italian (it)
    • Japanese (ja)
    • Korean (ko)
    • Polish (pl)
    • Portuguese (pt)
    • Russian (ru)
    • Turkish (tr)
    • Chinese, simplified (zh)
  • Поддержка эмоций
    • [laughter] - смех
    • [laughs] - смеётся
    • [sighs] - вздыхает, выдох, обычно после стресса
    • [music] - музыка
    • [gasps] - вздыхает, резкий вдох, удивление
    • [clears throat] - прокашливается
    • или ... для колебаний
    • для текстов песен
    • ЗАГЛАВНЫЕ буквы для выделения слова
  • Поддержка нескольких голосов, список спикеров
  • Подключение к телеграм боту https://github.com/VladimirGav/telegrambot
  • Автоматическая загрузка и обновление моделей из https://huggingface.co/
  • Работает со слабыми видеокартами, протестировал на NVIDIA GeForce RTX 3050 Laptop GPU

Установка на Windows

Видео инструкция Скоро

  1. Установите Windows Cuda local версии 11.7.0 для своей видеокарты
  1. Загружаем zip архив репозитория VladimirGav/ai-audio-vg на компьютер и распаковываем.
  2. Запускаем автоматическую установку на Windows vladimirgav/StartInstallWindows.bat

Как генерировать изображения по текстовому описанию в Windows

Видео инструкция Скоро

  1. Вводим текст, голос и другое в файл vladimirgav/inputdata/txt2audio.json
  2. Запускаем файл vladimirgav/vg_txt2audio.bat
  3. Получаем готовые аудио файлы, например в vladimirgav/audio

Разработчик: VladimirGav