这是我用来播放短语音文件的小工具,主要用来辅助我自己的英语跟读训练。没什么特别的,就是在播放的时候,在波谱(Waveform)上多叠加了一个 “音高标注”(Pitch Contour),以便我可以直观地 “看到” 语音的音高变化 —— 这对我来说很重要,因为我是五音不全的人,识别音高有生理困难,所以,我更需要 “看到” 而不仅仅是 “听到”……
跟读训练(尤其是 “无他人监督的自我跟读训练”)可以参照一下计算机科学家们用来做 TTS(Text To Speech)的一个理论工具,叫做 “ToBI”(Tone and Break Index)…… 请参考 MIT 关于 ToBI 的课程。
我没单独申请 Apple Developer 账号 —— 所以,也没办法把这个播放器打包成 APP 分发给别人。
这不是个严肃的产品,只是自己用来解决自身需要的东西,甚至连 “玩具” 都称不上…… 有太多细节顾不上,就先这样凑合着用,毕竟,对我来说 “写程序” 并不是最主要的工作 —— 请理解。
估计想要用这个东西的人,也不是啥程序员…… 不过,想要用,就得自己安装 nodejs
:
brew install nvm
nvm install 20.5.1
nvm use 20.5.1
语音文字识别,我使用的是 stable-ts,略慢(相对于 whisper.cpp)…… 需要本地 Mac 已经安装 Python3,而后安装 stable-ts
:
pip install -U stable-ts
注意 如果不知道如何在
Terminal
程序中使用brew
命令的话,可以先去看看这篇文章: 《从 Terminal 开始……》……
然后:
git clone https://github.com/xiaolai/tobiplayer.git
cd tobiplayer
npm install
npm run dev
打包成 APP 自己本地使用的话,就:
npm run build:mac
(我还没研究明白怎么把本地的 python 脚本与 electron-builder 正确搭配…… 2023.09.23)