VOICEVOX/ort

開発方針の検討

Opened this issue · 0 comments

qryxip commented

内容

以下を開発方針としたいと考えています。

  • 現在alpha版であるv2をベースに実装する
    • ortにはリリースブランチは無いので、mainをそのまま使ってもよさそう?
      • pykeio/ortをマージするタイミングはv*.*.*が出たとき、とするとちょうどよさそう。とりあえずmainv2.0.0-alpha.4まで戻す?
  • Cargoプロジェクトとしてのpackage.namevoicevox-ortvoicevox-ort-sysとする (crates.ioにはこの名前でアップロードする)
    • READMEは書き換える?
  • onnxruntime-rsなどとは異なり本家が生存している状態でフォークする以上、diffを少なめにすることを優先する
    • pykeio/ortに還元できそうな部分はPRを出す

また現状考えられるタスクリストは以下の通りです。

  • VOICEVOX/voicevox_core#725で動くようにする
    • VOICEVOX/onnxruntime-builderのlibonnxruntimeをダウンロードして使うようにする
      • ダウンロード先を~/.cache/ort.pyke.ioから~/.cache/voicevox_ortにする
      • GHA上だとキャッシュ次第でsymlinkが壊れたままビルドが完了されたりするので、なんとかする
        pykeio#146
      • 実機でCUDAとDirectMLが動くか確認する
    • 足りないAPIを実装する よく探したら全部既にあった
    • ログを潰す (VOICEVOX/onnxruntime-rs#10, VOICEVOX/onnxruntime-rs#16)
  • dlopen/LoadLibraryで動くようにする (上記を実装した時点で達成されている可能性有り)
  • Cargoプロジェクトとしてのpackage.namevoicevox-ortvoicevox-ort-sysにリネームする
  • VOICEVOX/voicevox_project#24を達成できるなら、"libvoicevox_onnxruntime"を読むようにする

Pros 良くなる点

Cons 悪くなる点

実現方法

VOICEVOXのバージョン

N/A

OSの種類/ディストリ/バージョン

  • Windows
  • macOS
  • Linux

その他