/Chenyme-AAVT

这是一个全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频。

Primary LanguagePythonMIT LicenseMIT

AI Auto Video(Audio) Translation

简体中文 badge 英文 badge Open In Colab Download PyPI - Version

Chenyme-AAVT V0.8.4

非常感谢您来到我的 全自动视频翻译 项目!该项目旨在提供一个简单易用的自动识别、翻译工具和其他视频辅助工具,帮助快速识别视频字幕、翻译字幕、辅助图文。

  • Note1 :推荐选用 Faster-whisper 和 Large 模型以获得最好的断句、识别体验!
  • Note2 :由于考研,更新速度可能会放缓,学业为重,感谢理解~~~ 大家有想法、有问题、想交流的朋友们可以加群一起讨论噢!
  • 【紧急公告】Pytorch近期 2.4.x 版本,部分用户会直接报错:OSError找不到指定的模块fbgemm.dll,目前尚未知任何原因!

若发生此类错误,请尝试将对应的安装脚本(.bat文件)中的 torch 版本 修改为 2.3.1 并删除已安装 env 文件,重新运行安装脚本!

(示例)原:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

(示例)改:pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

给一颗免费的星支持一下叭~感谢!AAVT项目文档

本项目开源可魔改,发布请保留原作者 @chenyme 和 项目链接,感谢支持!请勿在任何平台收费项目源码!(代码这么烂也能收?)

由于微信限制,已开通电报群组👉 ,点击此图标即可前往群聊

项目亮点

  • 支持 OpenAI APIFaster-Whisper 识别后端。
  • 支持 GPU 加速VAD辅助FFmpeg加速
  • 支持 本地部署模型ChatGPTKIMIDeepSeekChatGLMClaude等多种引擎翻译。
  • 支持识别、翻译 多种语言多种文件格式
  • 支持对 一键生成字幕微调视频预览
  • 支持对内容直接进行 AI总结、问答
  • 支持视频 生成图文博客

如何安装

修复闪退.bat请在 出现闪退/报错OMP/报错NoneType 的情况下 再运行,不要直接运行!

使用 Windows

  1. 安装 Python,请确保Python版本大于3.8

  2. 安装 FFmpegReleaseFull版本已经打包了FFmpeg库

  3. 运行 install.bat

使用 docker

docker pull eisai/chenyme-aavt

具体使用方法,请查阅:eisai/chenyme-aavt

感谢 @Eisaichen 提供此版本

使用 Colab

Open In Colab

感谢 @Kirie233 提供此版本

TODO

识别相关

  • 更换更快的Whisper项目
  • 支持本地模型加载
  • 支持个人微调Whisper模型
  • VAD辅助优化
  • 字词级断句优化
  • 更多的语种识别

翻译相关

  • 翻译优化
  • 更多的语种翻译
  • 更多的翻译模型
  • 更多的翻译引擎
  • 支持本地大语言模型翻译

字幕相关

  • 个性化字幕
  • 更多字幕格式
  • 字幕预览、实时修改
  • 自动化字幕文本校对
  • 双字幕

其他

  • 视频总结、罗列重点
  • 视频预览
  • AI助手
  • 视频生成博客*
  • 实时语音翻译
  • 视频中文配音
注:含*的功能还不稳定,可能存在某些BUG。

Star History

Star History Chart

项目界面预览

主页面

1716910190616

设置

1716910203660

视频识别

参数设置

d967ac4074d0c8ecba07b95de533730

运行界面

b861c5019833b770f98344f7a4c73a4

视频生成

1716650985701

字幕微调

1716651009788

内容助手

参数设置

461474f5d96b61b70bd239a9e3ddf8d

运行界面

14575fd5efbe138f364329626501b09

字幕翻译

35bc5a96676c7f2b9d71042eb7c877f

视频博客

09f60b8099f8ce19b83f4da63b26817

鸣谢

本人是 AI 时代的受益者,本项目的开发基本是站在巨人的肩膀上实现的。主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕 ,利用 Streamlit 搭建快速使用的 WebUI 界面,以及 FFmpeg 来实现字幕与视频的合并。

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper 等开发人员!