/TTSController

各種 Text-to-Speech エンジンを統一的に操作するライブラリです

Primary LanguageC#Apache License 2.0Apache-2.0

TTSController

各種 Text-to-Speech エンジンを統一的に操作するライブラリです。VOICEROIDなどを自動化する簡易Webサーバもあります。

対応プラットフォーム

  • Windows 10/11 (64bit)

対応音声合成ライブラリ

  • VOICEROID+ 各種
  • 音街ウナTalkEx
  • VOICEROID2 各種 (x86, x64)
  • A.I.VOICE (要x64ビルド)
  • ガイノイドTALK 各種
  • かんたん!AITalk3 / 関西風 / Lite
  • CeVIO CS6 / CS7 (x86, x64)
  • CeVIO AI (要x64ビルド)
  • VOICEVOX
  • COEIROINK
  • SAPI5 (Windows10標準の音声合成機能。スタートメニュー>設定>時刻と言語>音声認識>音声の管理>音声の追加から各国語の音声が追加できます。API仕様により追加しても列挙されない音声があります。)
  • VOICEPEAK

動作確認済みリスト

ライブラリ名はインストールされたフォルダなどを参照して機械的に抽出しているため、リストにないものでも音声合成エンジンが共通であれば動作する可能性が高いです。

音声合成エンジン ライブラリ名
VOICEROID+ EX 民安ともえ EX, 東北ずん子, 東北きりたん, 京町セイカ
音街ウナTalkEx 音街ウナ
VOICEROID2 琴葉 茜, 琴葉 葵, 結月ゆかり, 紲星あかり, 東北イタコ, 桜乃そら, ついなちゃん(標準語), ついなちゃん(関西弁)
VOICEROID2 (VOICEROID+ EX からのアップグレード) 民安ともえ(v1), 東北ずん子(v1), 東北きりたん(v1), 京町セイカ(v1)
かんたん!AITalk3 あんず, かほ, ななこ, のぞみ, せいじ
かんたん!AITalk3 関西風 みやび, やまと
かんたん!AITalk3 LITE あんず(LITE), かほ(LITE), ななこ(LITE), のぞみ(LITE), せいじ(LITE)
ガイノイドTALK 鳴花ヒメ, 鳴花ミコト
A.I.VOICE 琴葉 茜,琴葉 茜(蕾),琴葉 茜,琴葉 茜(蕾),Kotonoha Akane (English),Kotonoha Aoi (English),結城 香, 足立 レイ,栗田まろん
CeVIO CS6 / CS7 さとうささら, すずきつづみ, タカハシ, IA, ONE
CeVIO AI さとうささら, 小春六花, 弦巻マキ (英), 弦巻マキ (日) ※ライセンスエラーが出る場合は #5 へお知らせください
VOICEVOX 四国めたん,ずんだもん,春日部つむぎ,雨晴はう,波音リツ,玄野武宏,白上虎太郎,青山龍星,冥鳴ひまり,九州そら
COEIROINK つくよみちゃん,MANA,おふとんP,ディアちゃん,アルマちゃん
SAPI5 Microsoft Haruka Desktop, Microsoft David Desktop, Microsoft Zira Desktop, Microsoft Irina Desktop
VOICEPEAK(1.2.1以降) Frimomen, Tohoku Zunko, Zundamon, Japanese Female Child, Japanese Male 1, Japanese Male 2, Japanese Male 3, Japanese Female 1, Japanese Female 2, Japanese Female 3

ブラウザで音声合成する

この実装は簡易実装であり、音声合成ライブラリと同一のPC上で実行することを想定しています。インターネット上への公開は、セキュリティ上のリスクや音声合成ライブラリのライセンス上の問題がある可能性があります。

準備

  • SpeechWebServer のプロジェクトを Visual Studio 2019 でビルドして SpeechWebServer.exe を実行します(管理者権限が必要です)

利用方法

スピーカー名の表示

TODO

制御機能

  • 話者の一覧取得
  • 話者に応じたTTS切り替え
  • Bluetooth スピーカーの安定動作のための無音区間挿入
  • 同時起動対応(先に起動しているほうに処理を委譲)

音声コントロール

  • 再生
  • 音量の取得・変更
  • 話速の取得・変更
  • ピッチの取得・変更
  • 抑揚の取得・変更
  • 発話中の音声停止
  • 合成した音声の保存
  • 連続して文字列が入力されたときの対応
  • 音声合成対象の文字列の途中に .wav ファイルを差し込み
  • 音声合成対象の文字列の途中に音声コントロールを埋め込み
  • 音声出力デバイス選択