OpenAI TTS StreamingのバックエンドAPI

OpenAIのTTS Streamingを試してみたかったので、FastAPIを使って簡易的に試してみた。

UIを持って出力するならばNext.jsとかを使うのが良いのかも。

前提

  • pyenv+Poetryが必要です

実行手順

  1. .env.exampleをコピーして.envを作成します。
  2. .envOPENAI_API_KEYを記載します。
  3. make installを実行します。
  4. make runを実行するとAPIが立ち上がります。
  5. Swaggerからstream_and_playエンドポイントを確認します。
  6. stream_and_playエンドポイントのtextフィールドの値を変えることで、streamingで受け取る音声データを再生することができます。