marcoyang1998

Speech recognition, Multi model

University of CambridgeCambridge

Pinned Repositories

audioset_tagging_cnn
Language:Python0 0 00
CED
Source code for Consistent ensemble distillation for audio tagging
Language:Python0 0 00
diff_pattern_mining
Language:Python0 1 00
divide_lm
Language:Python0 0 00
google-research
Google Research
Language:Jupyter Notebook00
icefall
Language:Python2 0 00
knowledge_distillation
Language:Python0 1 00
LAVIS
LAVIS - A One-stop Library for Language-Vision Intelligence
Language:Jupyter Notebook0 0 00
lhotse
Tools for handling speech data in machine learning projects.
Language:Python0 0 00
maml
Code for "Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks"
Language:Python0 0 00

marcoyang1998's Repositories

marcoyang1998/icefall
Language:Python2 0 00
marcoyang1998/audioset_tagging_cnn
Language:Python0 0 00
marcoyang1998/CED
Source code for Consistent ensemble distillation for audio tagging
Language:Python0 0 00
marcoyang1998/diff_pattern_mining
Language:Python0 1 00
marcoyang1998/divide_lm
Language:Python0 0 00
marcoyang1998/google-research
Google Research
Language:Jupyter Notebook00
marcoyang1998/knowledge_distillation
Language:Python0 1 00
marcoyang1998/LAVIS
LAVIS - A One-stop Library for Language-Vision Intelligence
Language:Jupyter Notebook0 0 00
marcoyang1998/lhotse
Tools for handling speech data in machine learning projects.
Language:Python0 0 00
marcoyang1998/maml
Code for "Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks"
Language:Python0 0 00
marcoyang1998/MLMI
MPhil Machine Learning and Machine Intelligence @ University of Cambridge
Language:Jupyter Notebook0 0
marcoyang1998/models
Models and examples built with TensorFlow
marcoyang1998/ncnn
ncnn is a high-performance neural network inference framework optimized for the mobile platform
Language:C++0 0
marcoyang1998/numpy-ml
Machine learning, in numpy
Language:Python0 0
marcoyang1998/panns_transfer_to_gtzan
marcoyang1998/Qwen-Audio
The official repo of Qwen-Audio (通义千问-Audio) chat & pretrained large audio language model proposed by Alibaba Cloud.
Language:Python0 0
marcoyang1998/shadowsocks-heroku
一键部署，随处可用的免费shadowsocks-heroku
Language:CoffeeScript0 0
marcoyang1998/sherpa
Speech-to-text server framework with next-gen Kaldi
Language:Python0 0
marcoyang1998/sherpa-ncnn
Real-time (online/streaming) speech recognition using next-gen Kaldi with ncnn. Support embedded systems
Language:C++0 0
marcoyang1998/unilm
Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities
Language:Python0 0
marcoyang1998/whisper
Robust Speech Recognition via Large-Scale Weak Supervision
Language:Python0 0

marcoyang1998

Pinned Repositories

audioset_tagging_cnn

CED

diff_pattern_mining

divide_lm

google-research

icefall

knowledge_distillation

LAVIS

lhotse

maml

marcoyang1998's Repositories

marcoyang1998/icefall

marcoyang1998/audioset_tagging_cnn

marcoyang1998/CED

marcoyang1998/diff_pattern_mining

marcoyang1998/divide_lm

marcoyang1998/google-research

marcoyang1998/knowledge_distillation

marcoyang1998/LAVIS

marcoyang1998/lhotse

marcoyang1998/maml

marcoyang1998/MLMI

marcoyang1998/models

marcoyang1998/ncnn

marcoyang1998/numpy-ml

marcoyang1998/panns_transfer_to_gtzan

marcoyang1998/Qwen-Audio

marcoyang1998/shadowsocks-heroku

marcoyang1998/sherpa

marcoyang1998/sherpa-ncnn

marcoyang1998/unilm

marcoyang1998/whisper