/fastllm

纯c++的全平台llm加速库,chatglm-6B级模型单卡可达10000+token / s,支持moss, chatglm, baichuan模型,手机端流畅运行

Primary LanguageC++

Stargazers

No one’s star this repository yet.