ArtificialZeng/baichuan-speedup
纯c++的全平台llm加速库,支持python调用,支持baichuan, glm, llama, moss基座,手机端流畅运行chatglm-6B级模型单卡可达10000+token / s,
C++
Issues
- 0
和fastllm什么关系?
#2 opened by xysnqdd - 2
没有fastllm文件
#1 opened by ak646260187
纯c++的全平台llm加速库,支持python调用,支持baichuan, glm, llama, moss基座,手机端流畅运行chatglm-6B级模型单卡可达10000+token / s,
C++