TencentGameMate/chinese_speech_pretrain

chinese speech pretrained models

Shell

Issues

请问我们在espnet/egs2/aishell/asr1/下使用，报TypeError: wav2vec2_custom() missing 1 required positional argument: 'ckpt'错误，怎么解决，非常感谢！！！
#46 opened 8 months ago by MELABIPCAS
1
如何获得1024维特征的离散id
#47 opened 7 months ago by wcr369
4
如何将预训练的权重转换成huggingface格式？
#54 opened 4 months ago by CodeMrSheep
1
采样率是多少啊？
#53 opened 4 months ago by sunjian2015
0
开源出来的hubert large 模型，有对应的kmean模型么？还是base和large使用同一个kmeans就可以？
#32 opened 2 years ago by joan126
2
音频fps如何调整为25
#52 opened 6 months ago by tailangjun
1
哪个模型最好？
#51 opened 6 months ago by piwawa
0
关于该项目的bibtex格式引用
#50 opened 7 months ago by mixxs
1
如何提取音频特征
#49 opened 7 months ago by tailangjun
1
Error
#48 opened 7 months ago by ChengsongLu
3
fairseq和huggingface输出结果不同
#45 opened 8 months ago by hao-qiang
1
.
#44 opened 8 months ago by Bingtai1015
0
可以提取采样率为22050的音频的特征吗？
#43 opened 9 months ago by Bingtai1015
2
关于模型中没有task_cfg、model_cfg、model_weight、dictionaries_symbols这一问题，求大佬解答
#18 opened 2 years ago by 646312715
11
请问该预训练模型们的语音的采样率是多少呢？
#40 opened a year ago by ywh-my
1
用CTC直接微调效果非常差
#39 opened a year ago by zyh3826
4
采用预训练模型提取语音特征，怎么处理长语音，直接切割或滑窗处理？
#23 opened 2 years ago by Owen1234560
2
Add WavLM
#42 opened a year ago by Blakey-Gavin
1
k-means参数的读取
#41 opened a year ago by jidanhuang
0
请问还传ESPnet的训练代码吗？
#8 opened 2 years ago by qixing-ai
18
这个可以用于speaker-diarization任务吗
#38 opened a year ago by luomingjun2023
1
能否使用预训练模型同时更改参数？
#37 opened a year ago by LwLiu-2012
1
可以同时提取中英文语音的特征吗
#36 opened a year ago by milely
1
hubert特征，用的是哪层的特征啊，还是哪些层的特征进行了加权和？比例是多少
#33 opened a year ago by yangsuxia
0
你好请问large的特征聚类的时候使用了百分之多少的特征?10%的话需要内存多大的机器？
#35 opened 2 years ago by manmushanhe
0
如何获得最后的unit?
#34 opened 2 years ago by mikesun4096
0
请问如何使用huggingface代码finetune
#28 opened 2 years ago by Yonnie1331
1
求一个能够输出最终文字的代码案例
#31 opened 2 years ago by moresun
1
如何测试？
#15 opened 2 years ago by qiuyuzhao
2
Failed to load pretrained model from huggingface
#10 opened 2 years ago by teinhonglo
12
Problem about time shape
#30 opened 2 years ago by huutuongtu
0
请问hubert模型训练时的batch_size大小是多少
#29 opened 2 years ago by dancinghui
0
最终输出是768维还是1024维呢？
#26 opened 2 years ago by ZiqiaoPeng
5
可以用作特征的是哪个字段里面的值
#12 opened 2 years ago by kejom-ou
3
请问最长能处理多长的语音？
#27 opened 2 years ago by ddlBoJack
0
请问预训练好模型之后提取音频特征时加权求和的具体做法是什么？
#19 opened 2 years ago by zdaaaaa
2
模型小型化
#13 opened 2 years ago by xuwenshen
1
请问如何用 fairseq 训练 wenetspeech
#25 opened 2 years ago by panpan-wu
1
HuBERT模型对应的kmeans模型
#7 opened 2 years ago by ziyichen-paii
3
How many days did the pre-training phase take on large model?
#24 opened 2 years ago by Qoboty
0
ASR finetune收敛速度问题
#11 opened 2 years ago by qinyuenlp
15
Fine-tune with my own dataset, wer is 1
#22 opened 2 years ago by abcdbosh
0
您好，改怎么进行微调呢？
#21 opened 2 years ago by SinLT
0
你好，有WavLM的中文预训练模型吗？
#20 opened 2 years ago by dengcunqin
0
能期待下vq-wav2vec的自监督backbone吗？
#17 opened 2 years ago by splinter21
0
预训练超参mask_prob设置
#16 opened 2 years ago by 212wzt5A
0
请问wenet speech中用于训练的100小时数据选取有技巧吗？还是任意选取都可以？
#14 opened 2 years ago by user-ZJ
1
有没有更详细的教程
#5 opened 2 years ago by hello2013
3
与原始版本预训练模型对比
#9 opened 2 years ago by zhangxueyangjuxie
4
About fairseq checkpoint link
#6 opened 2 years ago by godiclee
3