/fastllm

纯c++实现,无第三方依赖的大模型库,支持CUDA加速,目前支持国产大模型ChatGLM-6B,MOSS; 可以在安卓设备上流畅运行ChatGLM-6B

Primary LanguageC++Apache License 2.0Apache-2.0

Watchers

No one’s watching this repository yet.