本项目基于snowboy-seasalt进行翻译 源链接。
基于 Docker 的 Web 界面,用于.pmdl
从 snowboy 的音频示例生成文件。
感谢 seasalt-ai
首先,运行预先构建的 Docker 镜像:
$ docker run -it -p 8000:8000 james18178/snowboy-seasalt-chinese
现在可以在http://localhost:8000访问 Web 界面
如果您想自己构建 Docker 映像,请参阅 scripts/build-docker.sh
可以直接在 Web 浏览器中记录和提交示例。启用麦克风后(Chrome 需要),每个示例都可以通过以下方式录制:
- 单击“录制”按钮并等待它准备就绪
- 说出唤醒词,然后静静地等待它完成
这里的时间限制用于避免需要从音频中修剪按钮点击。
获得 3 个关键词后,单击“提交”,您应该会看到一个“保存模型”按钮。将.pmdl
文件保存在某处并享受您的新唤醒词!
音频可视化由 wavesurfer-js 提供
您还可以POST
将您的音频示例直接发送到 Web 服务器并取回.pmdl
文件!
该/generate
提交表单数据有:
- 一个
modelName
模型文件名称 - 至少 3 个包含音频样本的文件
- 这些将被转换为适当的格式
ffmpeg
- 除非
?noTrim=true
给出,否则会从每个示例的开头和结尾自动修剪静音
- 这些将被转换为适当的格式
$ curl \
-X POST \
-F modelName=okay-rhasspy \
-F example1=@example1.wav \
-F example2=@example2.wav \
-F example3=@example3.wav \
--output okay-rhasspy.pmdl \
localhost:8000/generate