/realtime-speech-to-text

Realtime Speech To Text

Primary LanguageTypeScript

Realtime Speech to Text

Description

This is a simple example of how to use the Speech to Text service in a realtime scenario.

Requirements

  • node-record-lpcm16 というマイク音声をNodeプログラムから扱えるライブラリを使用します。
    • node-record-lpcm16
    • このライブラリは、SoX というライブラリを使用しています。
      • SoX
      • SoXは、Homebrew でインストールできます。(Macの場合)
        • brew install sox

Setup

  1. Create a Google Cloud Platform project
  2. Enable billing
  3. Enable Speech to Text API
  4. Create a service account and download the JSON file
  5. Set the environment variable GOOGLE_APPLICATION_CREDENTIALS to the path of the JSON file you downloaded
  6. Clone this repository
  7. cd into this repository
  8. Run npm install
  • こちらの記事を参考に認証キーを取得することもできます。
    • Speech-to-Text API 認証キーの取得
    • サービスアカウント名、サービスアカウントIDは任意のものでOKです。eg. speech-to-text
    • JSONキーは、****auth-key.json(***** 任意) で、ルートディレクトリに保存してください。

Usage

  1. Run npm run start:dev