jishengpeng

speech（text-to-speech, codec, speech language model）

zhejiang universitynantong

Pinned Repositories

2022MCM-C-problem
2022美赛C题（MCM/ICM）F奖源码数据公开
Language:Python45 1 08
ControlSpeech
ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec
Language:Python208 13 78
Design-compiler
吉林大学编译原理课程设计，基于SNL语言完成词法分析，语法分析程序。
Language:C++9 1 00
GPT-SoVITS
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
Language:Python0 0 00
Languagecodec
Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models
Language:Python215 9 715
Nucleic-acid-detection-system
吉林大学软件工程软构件与中间件课设
Language:Java15 1 00
SocketFTP
吉林大学计算机网络课设（实现FTP文件传输系统）
Language:C++24 1 02
TextrolSpeech
TextrolSpeech: A Text Style Control Speech Corpus With Codec Language Text-to-Speech Models (2024 ICASSP)
Language:Python157 8 15
WavChat
A Survey of Spoken Dialogue Models (60 pages)
225 7 413
WavTokenizer
SOTA discrete acoustic codec models with 40 tokens per second for audio language modeling
Language:Python925 22 5754

jishengpeng's Repositories

jishengpeng/WavTokenizer
SOTA discrete acoustic codec models with 40 tokens per second for audio language modeling
Language:Python925 22 5754
jishengpeng/WavChat
A Survey of Spoken Dialogue Models (60 pages)
225 7 413
jishengpeng/Languagecodec
Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models
Language:Python215 9 715
jishengpeng/ControlSpeech
ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec
Language:Python208 13 78
jishengpeng/TextrolSpeech
TextrolSpeech: A Text Style Control Speech Corpus With Codec Language Text-to-Speech Models (2024 ICASSP)
Language:Python157 8 15
jishengpeng/2022MCM-C-problem
2022美赛C题（MCM/ICM）F奖源码数据公开
Language:Python45 1 08
jishengpeng/SocketFTP
吉林大学计算机网络课设（实现FTP文件传输系统）
Language:C++24 1 02
jishengpeng/Nucleic-acid-detection-system
吉林大学软件工程软构件与中间件课设
Language:Java15 1 00
jishengpeng/Design-compiler
吉林大学编译原理课程设计，基于SNL语言完成词法分析，语法分析程序。
Language:C++9 1 00
jishengpeng/GPT-SoVITS
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
Language:Python0 0 00
jishengpeng/jishengpeng.github.io
A Modern and Responsive Academic Personal Homepage
Language:SCSS0 0 00
jishengpeng/libri-light
dataset for lightly supervised training using the librivox audio book recordings. https://librivox.org/.
Language:Python0 0 00
jishengpeng/mini-omni
open-source multimodel large language model that can hear, talk while thinking. Featuring real-time end-to-end speech input and streaming audio output conversational capabilities.
Language:Python0 0
jishengpeng/NeuralSVB
Learning the Beauty in Songs: Neural Singing Voice Beautifier; ACL 2022 (Main conference); Official code
Language:Python0 0
jishengpeng/OpenVoice
Instant voice cloning by MyShell.
Language:Python0 0
jishengpeng/parler-tts
Inference and training library for high-quality TTS models.
Language:Python0 0

jishengpeng

Pinned Repositories

2022MCM-C-problem

ControlSpeech

Design-compiler

GPT-SoVITS

Languagecodec

Nucleic-acid-detection-system

SocketFTP

TextrolSpeech

WavChat

WavTokenizer

jishengpeng's Repositories

jishengpeng/WavTokenizer

jishengpeng/WavChat

jishengpeng/Languagecodec

jishengpeng/ControlSpeech

jishengpeng/TextrolSpeech

jishengpeng/2022MCM-C-problem

jishengpeng/SocketFTP

jishengpeng/Nucleic-acid-detection-system

jishengpeng/Design-compiler

jishengpeng/GPT-SoVITS

jishengpeng/jishengpeng.github.io

jishengpeng/libri-light

jishengpeng/mini-omni

jishengpeng/NeuralSVB

jishengpeng/OpenVoice

jishengpeng/parler-tts