必要最小限の機能の軽量化AIスタックチャンです。
- 音声合成にWeb版 VOICEVOX:ずんだもんを使用しています。
- 音声認識に"Google Cloud STT"か"OpenAI Whisper"のどちらかを選択できます。
AIスタックチャンがしゃべる動画を投稿するときは下記の様な表記を付けて下さい。
ずんだもんの部分は使用した声の種類に変えて下さい(AIスタックチャンのデフォルトはずんだもんです)。
#VOICEVOX:ずんだもん
- M5StickC PLUS + Speaker 2 HAT
- AtomS3 + ATOMICスピーカーベース + PDMマイクユニット
- M5Stack Core2
- VSCode
- PlatformIO
使用しているライブラリ等は"platformio.ini"を参照してください。
- 以下の内容を設定してください。
-
Wi-Fi設定。main.cppの23行目付近。
"YOUR_WIFI_SSID"
"YOUR_WIFI_PASS" -
APIキー設定。main.cppの32行目付近。
"YOUR OPENAI APIKEY"
"YOUR VOICEVOX APIKEY"
"YOUR STT APIKEY"
- 【注意】
"YOUR_STT_APIKEY"には"Google Cloud STTのAPIキー" または、"YOUR_OPENAI_APIKEY"と同じものを設定します。
"YOUR_STT_APIKEY"に"YOUR_OPENAI_APIKEY"と同じものを設定した場合は音声認識にOpenAI Whisperが使われます。
- ボタンAを押す(CoreS3の場合は額にタッチ)とマイクからの録音が始まり音声認識で会話できるようになります。
録音時間は3秒程度です。
- Web版 VOICEVOX のAPIキーの取得方法は、このページ(ttsQuestV3Voicevox)の一番下の方を参照してください。)