NetEase-Media/grps
【深度学习模型部署框架】支持tf/torch/trt/trtllm/vllm以及更多nn框架,支持dynamic batching、streaming模式,支持python/c++双语言,可限制,可拓展,高性能。帮助用户快速地将模型部署到线上,并通过http/rpc接口方式提供服务。
C++Apache-2.0
Issues
- 1
- 14
Start grps server(my_grps) failed
#4 opened by KkemChen - 0
这是干啥用的
#1 opened by iEnthusiasm