WenzheLiu-Speech

Hi, I am Wenzhe Liu. I work for Kuaishou, and was employed by Tencent. focusing on generalized speech enhancement, audio codec and speech synthesis

TencentBeijing, China

Pinned Repositories

aac-datasets
Audio Captioning datasets for PyTorch.
Language:Python2 1 00
ADSP_Tutorials
Advanced Signal Processing Notebooks and Tutorials
Language:Jupyter Notebook4 2 02
ai-audio-datasets
AI Audio Datasets 🎵. A list of datasets consisting of speech, music, and sound effects, which can provide training data for Generative AI, AIGC, AI model training, intelligent audio tool development, and audio applications.
50
awesome-speech-enhancement
speech enhancement\speech seperation\sound source localization
1.1k 42 1221
penguins-aicodec-demo
6 2 00
pyaec
simple and efficient python implemention of a series of adaptive filters (lms、nlms、rls、kalman、Frequency Domain Adaptive Filter、Partitioned-Block-Based Frequency Domain Adaptive Filter、Frequency Domain Kalman Filter、Partitioned-Block-Based Frequency Domain Kalman Filter) for acoustic echo cancellation.
Language:Python3 1 01
Realtime_AudioDenoise_EchoCancellation
Language:C++5 1 00
sound-source-localization-algorithm_DOA_estimation
关于语音信号声源定位DOA估计所用的一些传统算法
Language:MATLAB383 6 784
The-guidebook-of-speech-enhancement
105 3 06
wenzheliu-speech
3 2 01

WenzheLiu-Speech's Repositories

WenzheLiu-Speech/sound-source-localization-algorithm_DOA_estimation
关于语音信号声源定位DOA估计所用的一些传统算法
Language:MATLAB383 6 784
WenzheLiu-Speech/Realtime_AudioDenoise_EchoCancellation
Language:C++5 1 00
WenzheLiu-Speech/ADSP_Tutorials
Advanced Signal Processing Notebooks and Tutorials
Language:Jupyter Notebook4 2 02
WenzheLiu-Speech/pyaec
simple and efficient python implemention of a series of adaptive filters (lms、nlms、rls、kalman、Frequency Domain Adaptive Filter、Partitioned-Block-Based Frequency Domain Adaptive Filter、Frequency Domain Kalman Filter、Partitioned-Block-Based Frequency Domain Kalman Filter) for acoustic echo cancellation.
Language:Python3 1 01
WenzheLiu-Speech/ILRMA
MATLAB script of Independent Low-Rank Matrix Analysis (ILRMA)
Language:MATLAB2 1 00
WenzheLiu-Speech/JAECBF
Language:Python2 1 00
WenzheLiu-Speech/deepfilter_implement_see_-networks-speakerfilter.py
Wenzhe Liu Notes: deep filter reproduction, see: 23_3090_speakerfilter_new_deepfilter_final_1024_new/networks/speakerfilter.py i.e. https://github.com/heshulin/23_3090_speakerfilter_new_deepfilter_final_1024_new/blob/86dd75cb9f7858b11e8adc0097da372f706c23a1/networks/speakerfilter.py#L103
Language:Python1 1 00
WenzheLiu-Speech/DNS-Challenge-IACASlab9.github.io
Language:CSS1 1 01
WenzheLiu-Speech/eGeMAPS_estimator
Language:Python1 1 0
WenzheLiu-Speech/Neural-Speech-Dereverberation
Machine and Deep Learning models for speech dereverberation
Language:Python1 1 0
WenzheLiu-Speech/TFGAN-PLC
A Temporal-Spectral Generative Adversarial Network based End-to-end Packet Loss Concealment for Wideband Speech Transmission
Language:Python1 1 01
WenzheLiu-Speech/TinyNeuralNetwork
Language:Python1 1 01
WenzheLiu-Speech/Tutorial_Separation
This repo summarizes the tutorials, datasets, papers, codes and tools for speech separation and speaker extraction task. You are kindly invited to pull requests.
Language:MATLAB1 1 0
WenzheLiu-Speech/AudioCodingTutorials
Audio Coding Notebooks and Tutorials
Language:Jupyter Notebook1 0
WenzheLiu-Speech/clarity_CEC1
1st Clarity Enhancement Challenge
Language:HTML1 0
WenzheLiu-Speech/COSPA
Complex-valued Spatial Autoencoders for Multichannel Speech Enhancement
1 0
WenzheLiu-Speech/Dialog_Corpus
用于训练中英文对话系统的语料库 Datasets for Training Chatbot System
WenzheLiu-Speech/k2
FSA/FST algorithms, differentiable, with PyTorch compatibility.
Language:Cuda1 0
WenzheLiu-Speech/Maximilian
C++ Audio and Music DSP Library
Language:C++1 0
WenzheLiu-Speech/Microphone-Array-Generalization-for-Multichannel-Narrowband-Deep-Speech-Enhancement
This is the microphone array generalization investigation based on previous Narrow Band Deep Filtering methods.
Language:Python1 01
WenzheLiu-Speech/multi_quantization
Language:Python1 0
WenzheLiu-Speech/NELE-GAN
Implementation for paper: Multi-Metric Optimization using Generative Adversarial Networks for Near-End Speech Intelligibility Enhancement
Language:Python1 0
WenzheLiu-Speech/pam-nac
Psychoacoustic Calibration for Efficient Neural Audio Coding
Language:Python0 0
WenzheLiu-Speech/PercepNet
(Work In Progress) Unofficial implementation of PercepNet: A Perceptually-Motivated Approach for Low-Complexity, Real-Time Enhancement of Fullband Speech
Language:C++1 0
WenzheLiu-Speech/Percepnet-Keras
percepnet implemented using Keras, still need to be optimized and tuned.
Language:C1 0
WenzheLiu-Speech/pyroomacoustics
Pyroomacoustics is a package for audio signal processing for indoor applications. It was developed as a fast prototyping platform for beamforming algorithms in indoor scenarios.
Language:Python1 0
WenzheLiu-Speech/pytorch_complex
A temporal module for PyTorch-ComplexTensor
Language:Python1 0
WenzheLiu-Speech/SoundStream
This repository is an implementation of this article: https://arxiv.org/pdf/2107.03312.pdf
Language:Python1 0
WenzheLiu-Speech/vector-quantize-pytorch
Vector Quantization, in Pytorch
Language:Python1 0
WenzheLiu-Speech/Video_Conference_Enhancer
A software that supports real time video&audio processing for meeting application.
Language:Python1 0