基于chatglm.cpp项目构建的singularity容器,容器内含作者提供的chatglm-cpp[api]
,除包含chatglm.cpp外还包有类openai的api服务
singularity build --fakeroot chatglm.cpp.singularity.sif build.def
- 按照原作者说明准备好模型文件
- 使用命令行将目录绑定到容器内,并且启动服务
singularity exec \
--bind model:/model/ \
--env MODEL=/model/chatglm2-ggml.q4_0.bin \
chatglm.cpp.singularity.sif \
uvicorn chatglm_cpp.openai_api:app --host 0.0.0.0 --port 8877