ZhengRachel

Final-year Master Student at NERC-SLIP of USTC.

University of Science and Technology of ChinaHefei, China

Pinned Repositories

annotated-transformer
http://nlp.seas.harvard.edu/2018/04/03/attention.html
Language:Jupyter Notebook00
audio-visual-speech-enhancement
Language:Python0 0 00
Diff-A2A
Language:JavaScript00
DiffGAN-TTS
PyTorch Implementation of DiffGAN-TTS: High-Fidelity and Efficient Text-to-Speech with Denoising Diffusion GANs
Language:Python0 0 00
DiffSinger
PyTorch implementation of DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism (focused on DiffSpeech)
Language:Python0 0 00
DiffVC_and_GradTTS
This is the main repository of open-sourced speech technology by Huawei Noah's Ark Lab.
Language:Jupyter Notebook00
diffwave
DiffWave is a fast, high-quality neural vocoder and waveform synthesizer.
Language:Python00
Dive-into-DL-PyTorch
本项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为PyTorch实现。
Language:Jupyter Notebook0 0 00
End-to-End-VAD
an Audio-Visual Voice Activity Detection using Deep Learning
Language:Python0 0 00
UTIforAVSE-demo
Demo for "Incorporating Ultrasound Tongue Images for Audio-Visual Speech Enhancement Through Knowledge Distillation"
Language:HTML1 1 00

ZhengRachel's Repositories

ZhengRachel/UTIforAVSE-demo
Demo for "Incorporating Ultrasound Tongue Images for Audio-Visual Speech Enhancement Through Knowledge Distillation"
Language:HTML1 1 00
ZhengRachel/annotated-transformer
http://nlp.seas.harvard.edu/2018/04/03/attention.html
Language:Jupyter Notebook00
ZhengRachel/audio-visual-speech-enhancement
Language:Python0 0 00
ZhengRachel/Diff-A2A
Language:JavaScript00
ZhengRachel/DiffGAN-TTS
PyTorch Implementation of DiffGAN-TTS: High-Fidelity and Efficient Text-to-Speech with Denoising Diffusion GANs
Language:Python0 0 00
ZhengRachel/DiffSinger
PyTorch implementation of DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism (focused on DiffSpeech)
Language:Python0 0 00
ZhengRachel/DiffVC_and_GradTTS
This is the main repository of open-sourced speech technology by Huawei Noah's Ark Lab.
Language:Jupyter Notebook00
ZhengRachel/diffwave
DiffWave is a fast, high-quality neural vocoder and waveform synthesizer.
Language:Python00
ZhengRachel/Dive-into-DL-PyTorch
本项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为PyTorch实现。
Language:Jupyter Notebook0 0 00
ZhengRachel/End-to-End-VAD
an Audio-Visual Voice Activity Detection using Deep Learning
Language:Python0 0 00
ZhengRachel/FastSpeech2
An implementation of Microsoft's "FastSpeech 2: Fast and High-Quality End-to-End Text to Speech"
Language:Python00
ZhengRachel/ERVQ
Demo for paper "ERVQ: Enhancing Residual Vector Quantization in Audio Codecs through Intra- and Inter-Codebook Optimization".
Language:JavaScript
ZhengRachel/ImprovedTaLNet-demo
Demo for Improved methods based on pseudo target generation and domain adversarial training for voice reconstruction from silent tongue and lip articulation.
Language:HTML2 0
ZhengRachel/IUTIforAVSE-demo
Demo for paper "Incorporating Ultrasound Tongue Images for Audio-Visual Speech Enhancement".
Language:SCSS
ZhengRachel/NATSpeech
A Non-Autoregressive Text-to-Speech (NAR-TTS) framework, including official PyTorch implementation of PortaSpeech (NeurIPS 2021) and DiffSpeech (AAAI 2022)
Language:Python0 0
ZhengRachel/ProDiff
PyTorch Implementation of ProDiff (ACM-MM'22) with a Extremely-Fast diffusion speech synthesis pipeline
Language:Python0 0
ZhengRachel/py_class_homework
Homework of the Python class of USTC.
Language:Python
ZhengRachel/py_class_homework2
homework2 of py class of ustc due April 29th
Language:Python0 0
ZhengRachel/SpeakerRecognition_tutorial
Simple d-vector based Speaker Recognition (verification and identification) using Pytorch
ZhengRachel/VisualVoice
Audio-Visual Speech Separation with Cross-Modal Consistency
Language:Python0 0
ZhengRachel/VQ-VAE-Speech
PyTorch implementation of VQ-VAE + WaveNet by [Chorowski et al., 2019] and VQ-VAE on speech signals by [van den Oord et al., 2017]
Language:Python0 0
ZhengRachel/wavegrad2
Unofficial Pytorch Implementation of WaveGrad2
Language:Jupyter Notebook0 0
ZhengRachel/ZeroSpeech
VQ-VAE for Acoustic Unit Discovery and Voice Conversion
ZhengRachel/zerospeech2020
Python package for the Zero Speech Challenge 2020
Language:Python0 0
ZhengRachel/zhengrachel.github.io
ZhengRachel's HomePage (Forked from AcadHomepage: A Modern and Responsive Academic Personal Homepage)
Language:SCSS1

ZhengRachel

Pinned Repositories

annotated-transformer

audio-visual-speech-enhancement

Diff-A2A

DiffGAN-TTS

DiffSinger

DiffVC_and_GradTTS

diffwave

Dive-into-DL-PyTorch

End-to-End-VAD

UTIforAVSE-demo

ZhengRachel's Repositories

ZhengRachel/UTIforAVSE-demo

ZhengRachel/annotated-transformer

ZhengRachel/audio-visual-speech-enhancement

ZhengRachel/Diff-A2A

ZhengRachel/DiffGAN-TTS

ZhengRachel/DiffSinger

ZhengRachel/DiffVC_and_GradTTS

ZhengRachel/diffwave

ZhengRachel/Dive-into-DL-PyTorch

ZhengRachel/End-to-End-VAD

ZhengRachel/FastSpeech2

ZhengRachel/ERVQ

ZhengRachel/ImprovedTaLNet-demo

ZhengRachel/IUTIforAVSE-demo

ZhengRachel/NATSpeech

ZhengRachel/ProDiff

ZhengRachel/py_class_homework

ZhengRachel/py_class_homework2

ZhengRachel/SpeakerRecognition_tutorial

ZhengRachel/VisualVoice

ZhengRachel/VQ-VAE-Speech

ZhengRachel/wavegrad2

ZhengRachel/ZeroSpeech

ZhengRachel/zerospeech2020

ZhengRachel/zhengrachel.github.io