音声認識でテキスト化したあとずんだもんとかに喋らせる(遅延すごい)
マイク入力
↓
SpeechRecognition(Googleの音声認識)
↓
VOICEVOX ENGINEにリクエスト投げる
↓
WAVファイルを作ってもらう
↓
WAVファイルを再生(デバイス指定して)
- Python 3.9.6
- VOICEVOX Ver0.13.2 (GPU)
- VoiceMeeter Banana(仮想オーディオデバイス&ミキサー的な)
- Discordとかでずんだもんに喋らせたいときに使える
入力/出力デバイスIDは環境依存
未指定の場合はWindowsの規定のデバイスが使用される
speech_to_voicevox.py 14行目
mic = sr.Microphone(X)
speech_to_voicevox.py 36行目
sd.default.device = X