qiuzh20

Tsinghua UniversityBeijing

Pinned Repositories

CompeteSMoE
Code for this paper "CompeteSMoE - Effective Sparse Mixture of Experts Training via Competition"
Language:Python4 2 33
DL_project
Deep learning class project -- A rational search engine
Language:Python1 1 00
EEG-Cross-Subject-Emotion-Recognition
Language:Python6 1 00
eegnet_pytorch
EEGNet implementation in PyTorch
Language:Python0 0 00
EMoE
Official PyTorch Implementation of EMoE: Unlocking Emergent Modularity in Large Language Models [main conference @ NAACL2024]
Language:Python29 1 13
HMA
HMA: Heterogenous Memory Augmented Neural Networks
Language:Python4 1 00
MemLMM
An implementation of model parallel autoregressive transformers on GPUs, based on the DeepSpeed library.
Language:Python0 0 00
RMoE
Official implementation of RMoE (Layerwise Recurrent Router for Mixture-of-Experts)
Language:Jupyter Notebook18 1 10
Tuning-keys-v.s.-values
Official PyTorch Implementation of Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers [Tiny Paper @ ICLR 2024]
Language:Python2 2 00

qiuzh20/EMoE
Official PyTorch Implementation of EMoE: Unlocking Emergent Modularity in Large Language Models [main conference @ NAACL2024]
Language:Python29 1 13
qiuzh20/RMoE
Official implementation of RMoE (Layerwise Recurrent Router for Mixture-of-Experts)
Language:Jupyter Notebook18 1 10
qiuzh20/EEG-Cross-Subject-Emotion-Recognition
Language:Python6 1 00
qiuzh20/HMA
HMA: Heterogenous Memory Augmented Neural Networks
Language:Python4 1 00
qiuzh20/Tuning-keys-v.s.-values
Official PyTorch Implementation of Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers [Tiny Paper @ ICLR 2024]
Language:Python2 2 00
qiuzh20/DL_project
Deep learning class project -- A rational search engine
Language:Python1 1 00
qiuzh20/eegnet_pytorch
EEGNet implementation in PyTorch
Language:Python0 0 00
qiuzh20/MemLMM
An implementation of model parallel autoregressive transformers on GPUs, based on the DeepSpeed library.
Language:Python0 0 00