microsoft/SpeechT5

Unified-Modal Speech-Text Pre-Training for Spoken Language Processing

PythonMIT

Issues

soundfile.LibsndfileError: <exception str() failed>
#84 opened 2 months ago by ciwei6107563
0
Unable to Download wavLLM Due to Error
#83 opened 2 months ago by minkyu119
0
What's the model_path and data_name on inference code?
#80 opened 4 months ago by YepJin
1
What languages are supported? How to specify a language?
#82 opened 3 months ago by secsilm
0
Voice Conversion - Error with Some Mono, 16kHz, 16bit Audio
#58 opened a year ago by fabiocat93
3
SpeechUT does not have a link for download
#81 opened 4 months ago by world1tree
2
Error in loading WavLLM model
#78 opened 5 months ago by rishabh004-ai
9
WavLLM checkpoint
#76 opened 6 months ago by ming024
5
Confusion/Question about SpeechT5SpeechDecoderPostnet output
#79 opened 5 months ago by Student204161
0
Single Task Training
#77 opened 5 months ago by yangjiabupt
1
British English TTS model
#69 opened 5 months ago by omega3
1
ASR fine-tuning loss goes to zero after several epochs
#75 opened 6 months ago by yunigma
2
是否支持中文转语音？
#65 opened a year ago by xxm1668
4
How to setting language when do S2T
#66 opened 10 months ago by nhha1602
1
Baseline implementation
#67 opened 10 months ago by ussenuk
1
Does the pre-trained model for hidden unit tokenizer use speaker embeddings?
#73 opened 7 months ago by Kodhandarama
0
extract transorformer layer feature
#74 opened 7 months ago by zbpjlc
2
Getting TTS output voice close to the training data - Finetuning on different language
#57 opened a year ago by Srija616
2
The size of tensor a (674) must match the size of tensor b (600) at non-singleton dimension 1
#64 opened a year ago by poojitharamachandra
1
SpeechT5-tts fine-tuned on Chinese
#49 opened a year ago by qlmbeck
4
pretrain loss
#56 opened a year ago by MarsMeng1994
4
What is the time taken to converge for the hidden unit tokenizer?
#72 opened 7 months ago by Kodhandarama
0
Link to train_960.tsv is broken
#71 opened 8 months ago by Kodhandarama
0
"SpeechT5" on Android OS
#70 opened 8 months ago by taeyeonlee
0
how to pause between two words ?
#43 opened a year ago by hulk10425
2
Text feature extraction using SpeechLM
#68 opened 9 months ago by wonjune-kang
0
SpeechT5 - TTS - Tokenizer adding `▁` token between newly added Vietnamese characters
#63 opened 9 months ago by GinUTE
1
SpeechT5: extracting Chinese speaker embedding
#50 opened a year ago by QQ-777777
6
ASR SpeechT5 training - model predicts same output for different inputs
#62 opened a year ago by L7uan
0
Is end-to-end S2ST possible with Speecht5?
#61 opened a year ago by elia-ashraf
0
Generate the N-best (top few) hypotheses
#60 opened a year ago by cyfer0618
0
Reproduce ASR experiment results in Hugging Face
#59 opened a year ago by jjyaoao
0
The link for Prosody-SpeechT5 in the Readme is dead/404
#47 opened a year ago by svantana
2
SpeechLM
#46 opened a year ago by blueblue-bubble
2
SpeechT5：how much epoch is set
#45 opened a year ago by QQ-777777
5
how to fine tune sid on pretrained model？
#42 opened a year ago by haha010508
11
[SpeechLM] About phoneme tokenizer in detail?
#40 opened a year ago by yuseungwoo
1
Pretrain SpeechT5 on my own dataset
#38 opened a year ago by hungker
3
Missing speecht5 task
#37 opened a year ago by maximerenou
1
SpeechT5 Speech Enhancement
#36 opened 2 years ago by avramandrei
2
VATLM: Error when loading finetuned checkpoints for infer_s2s
#54 opened a year ago by naraysa
0
Pretraining SpeechT5, meet problems about batch_sampler in multitask_dataset. Should I get idx and bin files of data one by one (wav) or get all of them in only two file(idx and bin each have one)
#53 opened a year ago by Lemonaddeee
0
SpeechUT inference error in en_fr checkpoint
#52 opened a year ago by ytf-philp
1
SpeechT5 pretrain
#30 opened 2 years ago by benyang0506
5
Using SpeechT5 Large for TTS
#51 opened a year ago by imranmaj
0
Fine-tunning on Hugging Face
#35 opened 2 years ago by ramonsanabria
1
hydra fine-tunning for speechT5?
#41 opened 2 years ago by ramonsanabria
0
reproduction steps for inference
#39 opened 2 years ago by awgr
2
SpeechUT inference and fine-tune problem
#34 opened 2 years ago by ytf-philp
3
SpeechT5: Finetuned SID model
#31 opened 2 years ago by entn-at
2