RealTimeCaption

将视频中的对话自动翻译成用户选择的语言,以实时字幕形式呈现

整个软件的设计

  1. 先从视频中抽离出音频
  2. 然后通过ffmpeg对音频进行小片段(大约七秒一次)切割
  3. 将切割的音频实时发送到百度语音识别系统进行文字返回
  4. 在对识别的文字进行翻译
  5. 然后将文字添加到视频上进行展示

编译和运行

  • 需要编译的话需要下载Aplayer
  • 运行的话只需要打开exe就ok

效果

  • 英文到中文效果很好
  • 中文到英文效果一般