heiheihei730/Speech

first speech research, have fun~

Jupyter Notebook

Speech

First speech research, have fun~

本项目为语音模型的学习项目，目前总共有三个部分：

语音SSL模型的复现
Benchmarks的使用
语音技术基础

SSL模型的复现

理解各个库的源码
学习使用Transformer库
梳理和比较不同的模型之间的共性和差异

语音SSL模型包括

Wav2vec 2.0
HuBERT
WavLM
SpeechLM
Whisper（并不是SSL，但是也学一下）

Benchmarks的使用

学会使用SUPERB Benchmark
学会使用ASR librispeech数据库
其他库：SUPERB-SG 和 SUPERB-prosody
跑一下模型在上面的结果

语音技术学习

语音处理课程（李宏毅老师的2020年NLP课程）