TODO-LIST(极大可能不做了)
- 搜索模块的去重
- 文字转语音的去除第一秒以及语音调整
- 返回文件
- 提取视频字幕
Katna
DCCRN
towhee贯穿全部,使用了Clip等模型,faiss进行存储,googletrans进行中译英
- 文本/图片 搜图
- 文本/视频 搜视频
- 查重没写
Real-ESRGAN
MockingBird(含降噪)
googletrans
python相关依赖在requirements.txt中 还要自行安装FFMPEG 注意根目录下两个app文件都要启动,因为关键帧服务和部分服务冲突,只好拆分服务