First speech research, have fun~
本项目为语音模型的学习项目,目前总共有三个部分:
- 语音SSL模型的复现
- Benchmarks的使用
- 语音技术基础
- 理解各个库的源码
- 学习使用Transformer库
- 梳理和比较不同的模型之间的共性和差异
- Wav2vec 2.0
- HuBERT
- WavLM
- SpeechLM
- Whisper(并不是SSL,但是也学一下)
- 学会使用SUPERB Benchmark
- 学会使用ASR librispeech数据库
- 其他库:SUPERB-SG 和 SUPERB-prosody
- 跑一下模型在上面的结果
- 语音处理课程(李宏毅老师的2020年NLP课程)