Issues
- 2
感谢大佬,请问可以支持实时驱动或者流式生成吗?
#89 opened - 1
在中断训练以后能否在上一次中断位置继续训练?
#88 opened - 1
如何让原始视频闭嘴
#87 opened - 1
合成出来音频和视频长短不一样,后面没声音
#86 opened - 2
抖得非常6+1,看看效果
#85 opened - 2
使用hubert提取音频特征时报错
#84 opened - 1
训练的视频如何移到别的背景上
#83 opened - 1
- 10
如果要部署到移动端并实时推理,wenet提取音频特征的步骤也一起放在移动端运行吗
#81 opened - 1
用最新的代码训练的,脸很闪,嘴巴倒是对的很好,是啥情况?200epoch不够么?
#80 opened - 0
请问在那里有3-5分钟的demo口播视频额
#79 opened - 0
推理完视频像是打了马赛克一样,这是怎么回事
#78 opened - 4
移动端实时性
#77 opened - 1
- 2
- 3
推理时能用GPU吗
#74 opened - 5
经过作者大大的建议,对视频的中的语音做了去底噪处理,基本没有多余的声音干扰
#73 opened - 1
能出一下mac M系统的安装教程吗
#72 opened - 3
- 6
wenet视频
#70 opened - 0
感谢大佬开源,comfyui 节点来了
#69 opened - 13
- 0
求实时推理方案
#67 opened - 1
在执行inference.py时报错
#66 opened - 4
口型训练了1000e 也不是很对得上
#65 opened - 7
音频处理是否可以替换为其他方案,例如AVE
#64 opened - 1
建议出个高清版本的分支
#63 opened - 2
人脸检测时两数组维度不一致报错,什么原因
#62 opened - 2
pth导出onnx报错
#61 opened - 0
推理时报错如下
#60 opened - 15
按文档训练的模型效果还行,但是训练的速度有点慢。加快训练的方案思路有好的建议吗
#59 opened - 3
- 1
可以做到将采访类的视频拆开合并成新的视频训练吗
#57 opened - 2
checkpoint_epoch_335.pth.tar
#56 opened - 2
- 3
嘴有点抖动问题
#54 opened - 1
- 1
在使用hubert报错了,大佬帮忙看看什么原因
#52 opened - 2
aud_hu.npy文件找不到
#51 opened - 11
- 2
谁下载的有encoder.onnx,麻烦放一下百度网盘,谷歌的下不动
#49 opened - 1
about wenet issue, I'll fix soon
#48 opened - 1
联系一下me,pay for fees
#47 opened - 4
使用process.py跑wenet的时候报错
#46 opened - 1
这个结果口型对不上,非常抖
#45 opened - 6
- 7
datasetsss.py疑问
#43 opened - 6
- 1
大佬求流式推理
#41 opened - 2
推理出的视频嘴部模糊
#40 opened