huangyuxiang03

Tsinghua UniversityBeijing, China

Pinned Repositories

AutoAWQ
AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference.
Language:C++0 0 00
automix
Mixing Language Models with Self-Verification and Meta-Verification
Language:Jupyter Notebook0 0 00
BeetleDB
简单数据库实现，支持SQL语句
Language:C++0 0 00
CourseNotes
清华大学计算机系课程笔记
6 1 00
huangyuxiang03.github.io
AcadHomepage: A Modern and Responsive Academic Personal Homepage
Language:SCSS0 0 00
iotdb-from-Apache-
Apache IoTDB
Language:Java0 0 00
Locret
Language:Python10 2 10
LookaheadDecoding
Language:Python0 0 00
vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python1 0 00
MiniCPM
MiniCPM3-4B: An edge-side LLM that surpasses GPT-3.5-Turbo.
Language:Jupyter Notebook7.1k 72 225468

huangyuxiang03's Repositories

huangyuxiang03/Locret
Language:Python10 2 10
huangyuxiang03/CourseNotes
清华大学计算机系课程笔记
6 1 00
huangyuxiang03/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python1 0 00
huangyuxiang03/AutoAWQ
AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference.
Language:C++0 0 00
huangyuxiang03/automix
Mixing Language Models with Self-Verification and Meta-Verification
Language:Jupyter Notebook0 0 00
huangyuxiang03/BeetleDB
简单数据库实现，支持SQL语句
Language:C++0 0 00
huangyuxiang03/huangyuxiang03.github.io
AcadHomepage: A Modern and Responsive Academic Personal Homepage
Language:SCSS0 0 00
huangyuxiang03/iotdb-from-Apache-
Apache IoTDB
Language:Java0 0 00
huangyuxiang03/knnlm
Language:Python0 0 00
huangyuxiang03/LookaheadDecoding
Language:Python0 0 00
huangyuxiang03/lzbench
lzbench is an in-memory benchmark of open-source LZ77/LZSS/LZMA compressors
Language:C0 0 00
huangyuxiang03/REKCARC-TSC-UHT
清华大学计算机系课程攻略 Guidance for courses in Department of Computer Science and Technology, Tsinghua University
Language:HTML0 0 00
huangyuxiang03/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python0 0 00
huangyuxiang03/Mooncake
0 0
huangyuxiang03/Ouroboros
1 0
huangyuxiang03/ring-flash-attention
Language:Python
huangyuxiang03/Star-Attention
Efficient LLM Inference over Long Sequences
Language:Python

huangyuxiang03

Pinned Repositories

AutoAWQ

automix

BeetleDB

CourseNotes

huangyuxiang03.github.io

iotdb-from-Apache-

Locret

LookaheadDecoding

vllm

MiniCPM

huangyuxiang03's Repositories

huangyuxiang03/Locret

huangyuxiang03/CourseNotes

huangyuxiang03/vllm

huangyuxiang03/AutoAWQ

huangyuxiang03/automix

huangyuxiang03/BeetleDB

huangyuxiang03/huangyuxiang03.github.io

huangyuxiang03/iotdb-from-Apache-

huangyuxiang03/knnlm

huangyuxiang03/LookaheadDecoding

huangyuxiang03/lzbench

huangyuxiang03/REKCARC-TSC-UHT

huangyuxiang03/transformers

huangyuxiang03/Mooncake

huangyuxiang03/Ouroboros

huangyuxiang03/ring-flash-attention

huangyuxiang03/Star-Attention