本工具是python tkinter编写的一个简单的Gui,任务批量管理器。通过Gui选项生成CMD(command),来调用whisper,达到批量生成,管理的目的。
隔壁-在另一个项目里面更新了faster-whisper-GUI,比whisper快几十倍的模型,强烈推荐!
关于拓展选项 有朋友反应说这个"禁用"开启后,会出现断句不精准的问题,会比较机械的按照时间断句,而不是一整句话断开一次。
About the expansion option Some people say that when this "disable" option is turned on, there will be a problem of imprecise sentence break, which will be more mechanical according to the time break, instead of a whole sentence break once.
但是有时候关闭这个选项,个别情况会重复一句话。这种情况也和原视频时间戳错误有关。官方好像也没有很好的解决这个问题。
However, sometimes when this option is turned off, a sentence will be repeated in some cases. This situation is also related to the original video timestamp error. Officials do not seem to have a good solution to this problem.
具体开不开就大家视情况而定吧。我这边先默认关闭了,按官方原生的配置来。
The specific open or not on the situation depends on it. My side first closed by default, according to the official native configuration.
支持的操作如下
- 支持文件/文件夹拖入,或批量选择加载任务
- 显示每个任务的状态
- 可以对每一个文件任务单独设置不同的配置
- Gui界面支持自定义大小调整,自适应界面
- 对官方指令进行一定的修改,优化。改善长音频,语句重复的问题,识别错误的。
- 软件自带功能将视频转化为aac音频,并且转化过程中重建时间戳,提高转化成功率
- 可以选择指定的设备(CPU、显卡)
- 支持将生成的srt字幕文件,复制到同目录下,并编辑为相同的文件名
- 在支持whisper的前提下,增加支持whisperx,这个项目有更多的选项和拓展功能,详细请看相关目录。
- 支持任务完成时间统计
还有英文版的界面
需要自行安装Python 3,cuda,whisper以及FFmpeg。
本工具是按照有显卡的版本设计的,纯cpu环境暂无测试,可能需要修改一下代码。
本工具只是提供方便操作的Gui界面,适合有一定基础的人使用。
python --version
ffmpeg -version
这样启动可以无窗口直接启动
有黑窗,但可以看到程序运行和输出
部分灵感来源于https://github.com/ADT109119/WhisperGUI
whisperx:https://github.com/m-bain/whisperX