VOICEVOX の音声合成コア。
Releases にビルド済みのコアライブラリ(.so/.dll/.dylib)があります。
(エディターは VOICEVOX 、 エンジンは VOICEVOX ENGINE 、 全体構成は こちら に詳細があります。)
- ONNX Runtime v1.9.0/v1.9.1: https://github.com/microsoft/onnxruntime
環境に対応したONNX Runtimeをダウンロードし、リポジトリにonnxruntime
というディレクトリ名で展開します。
GPU対応版はCUDA 11.1 と CUDNN のインストールとGPUに対応した ONNXRUNTIME のダウンロードが必要です。
CUDA の macOS サポートは現在終了しているため、VOICEVOX CORE の macOS 向けコアライブラリも CUDA, CUDNN を利用しない CPU 版のみの提供となります。
core.zip
にRaspberry Pi用のONNX Runtimeを同梱しています。
利用には、libgompのインストールが必要です。
sudo apt install libgomp1
core.h をご参照ください。
まず Releases からコアライブラリが入った zip をダウンロードしておきます。
pip install .
cd example/python
python run.py \
--text "これは本当に実行できているんですか" \
--speaker_id 1
--root_dir_path="../../model"
# 引数の紹介
# --text 読み上げるテキスト
# --speaker_id 話者ID
# --use_gpu GPUを使う
# --f0_speaker_id 音高の話者ID(デフォルト値はspeaker_id)
# --f0_correct 音高の補正値(デフォルト値は0。+-0.3くらいで結果が大きく変わります)
# --root_dir_path onnxファイル等必要なファイルがあるディレクトリ
# イメージのビルド
docker build -t voicevox_core example/python
# コンテナの起動(音声を保存しておくボリュームを作成)
docker run -it -v ~/voicevox:/root/voice voicevox_core bash
# テスト音声 `おはようございます-1.wav` を生成
python run.py --text おはようございます --speaker_id 1
mv *.wav ~/voice
exit
# 音声の再生
aplay ~/voice/おはようございます-1.wav
サンプルコードを実装された際はぜひお知らせください。こちらに追記させて頂きます。
VOICEVOX ENGINE SHARP @yamachu ・・・ VOICEVOX ENGINE の C# 実装
Node VOICEVOX Engine @y-chan ・・・ VOICEVOX ENGINE の Node.js/C++ 実装
サンプルコードおよび core.h は MIT LICENSE です。
Releases にあるビルド済みのコアライブラリは別ライセンスなのでご注意ください。