/Auto_Caption_Generated_Offline

这是一个音频-字幕的离线转换器,基于Funasr,支持wav-srt。中文性能优于Whisper

Primary LanguagePython

项目介绍:

如果你从github搭建,请将time_stamp.py中的模型路径改掉./model/MODEL_NAME替换成/damo/MODEL_NAME,那么模型会自动下载。

使用Funasr的带time_stamp的语音识别后转换成srt,并不复杂,

注意:

Models 会自动下载,不过会下到C盘的User用户路径下,如果有需要自己配置环境的,可以手动下载然后放到当前根目录的Model下方。

环境配置见:https://alibaba-damo-academy.github.io/FunASR/en/installation/installation.html

2023/12/26: fix

之前的版本经常会存在一个长句识别出来后一直停留在屏幕上面的问题,这次给予了修复。另外这里附上网盘链接:

链接:https://pan.baidu.com/s/1g0LIUebXubgS-tkWKlB16A?pwd=j2e2 提取码:j2e2 请将dlc复制到字幕提取中。整合包包含了所需环境和Model所以会比较大。

有bug,请在b站私信反映,或者放在Isuue中。

b站:https://space.bilibili.com/556737824?spm_id_from=333.788.0.0