YUCHEN005

Ph.D. student at NTU, research focus on speech, multimodal and LLMs.

Nanyang Technological UniversitySingapore

Pinned Repositories

DPSL-ASR
Code for paper "Dual-Path Style Learning for End-to-End Noise-Robust Speech Recognition"
Language:Python39 2 64
GenTranslate
Code for paper "GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators"
Language:Python228 7 57
GILA
Code for paper "Cross-Modal Global Interaction and Local Alignment for Audio-Visual Speech Recognition"
Language:Python19 1 40
Gradient-Remedy
Code for paper "Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition"
Language:Python16 2 11
MIR-GAN
Code for paper "MIR-GAN: Refining Frame-Level Modality-Invariant Representations with Adversarial Network for Audio-Visual Speech Recognition"
Language:Python16 2 21
NASE
Code for paper "Noise-aware Speech Enhancement using Diffusion Probabilistic Model"
Language:Python84 3 62
RobustGER
Code for paper "Large Language Models are Efficient Learners of Noise-Robust Speech Recognition"
Language:Python158 6 43
STAR-Adapt
Code for paper "Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation Models"
Language:Python297 2 23
Unified-Enhance-Separation
Code for paper "Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation"
Language:Python42 2 27
UniVPM
Code for paper "Hearing Lips in Noise: Universal Viseme-Phoneme Mapping and Transfer for Robust Audio-Visual Speech Recognition"
Language:Python21 1 41

YUCHEN005's Repositories

YUCHEN005/STAR-Adapt
Code for paper "Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation Models"
Language:Python297 2 23
YUCHEN005/GenTranslate
Code for paper "GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators"
Language:Python228 7 57
YUCHEN005/RobustGER
Code for paper "Large Language Models are Efficient Learners of Noise-Robust Speech Recognition"
Language:Python158 6 43
YUCHEN005/NASE
Code for paper "Noise-aware Speech Enhancement using Diffusion Probabilistic Model"
Language:Python84 3 62
YUCHEN005/Unified-Enhance-Separation
Code for paper "Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation"
Language:Python42 2 27
YUCHEN005/DPSL-ASR
Code for paper "Dual-Path Style Learning for End-to-End Noise-Robust Speech Recognition"
Language:Python39 2 64
YUCHEN005/UniVPM
Code for paper "Hearing Lips in Noise: Universal Viseme-Phoneme Mapping and Transfer for Robust Audio-Visual Speech Recognition"
Language:Python21 1 41
YUCHEN005/GILA
Code for paper "Cross-Modal Global Interaction and Local Alignment for Audio-Visual Speech Recognition"
Language:Python19 1 40
YUCHEN005/Gradient-Remedy
Code for paper "Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition"
Language:Python16 2 11
YUCHEN005/MIR-GAN
Code for paper "MIR-GAN: Refining Frame-Level Modality-Invariant Representations with Adversarial Network for Audio-Visual Speech Recognition"
Language:Python16 2 21
YUCHEN005/RATS-Channel-A-Speech-Data
This is a public repository for RATS Channel-A Speech Data, which is a chargeable noisy speech dataset under LDC. Here we release its Log-Mel Fbank features and several raw wavform listening samples.
14 2 10
YUCHEN005/UNA-GAN
Code for paper "Unsupervised Noise adaptation using Data Simulation"
Language:Python12 1 00
YUCHEN005/RIO-TTS-demos
4 1 0
YUCHEN005/UNO-TTS-demos
4 1 0
YUCHEN005/UNA-GAN-Demo
Language:HTML2 1 00
YUCHEN005/Hypo2Trans
Single-blind supplementary materials for NeurIPS 2023 submission
Language:Python0 0
YUCHEN005/yuchen005.github.io
AcadHomepage: A Modern and Responsive Academic Personal Homepage
Language:SCSS

YUCHEN005

Pinned Repositories

DPSL-ASR

GenTranslate

GILA

Gradient-Remedy

MIR-GAN

NASE

RobustGER

STAR-Adapt

Unified-Enhance-Separation

UniVPM

YUCHEN005's Repositories

YUCHEN005/STAR-Adapt

YUCHEN005/GenTranslate

YUCHEN005/RobustGER

YUCHEN005/NASE

YUCHEN005/Unified-Enhance-Separation

YUCHEN005/DPSL-ASR

YUCHEN005/UniVPM

YUCHEN005/GILA

YUCHEN005/Gradient-Remedy

YUCHEN005/MIR-GAN

YUCHEN005/RATS-Channel-A-Speech-Data

YUCHEN005/UNA-GAN

YUCHEN005/RIO-TTS-demos

YUCHEN005/UNO-TTS-demos

YUCHEN005/UNA-GAN-Demo

YUCHEN005/Hypo2Trans

YUCHEN005/yuchen005.github.io