Issues
- 0
SG2042 服务器 make 出错
#85 opened by JocelynPanPan - 0
无法加载模型bin或者guff模型
#84 opened by velonica0 - 0
有打算支持qwen吗
#83 opened by Gooddz1 - 4
在树莓派3b+上部署,出现无法打开模型的问题
#82 opened by Dominic23331 - 0
How to build wasm file?
#78 opened by njalan - 0
这个有windows的部署教程吗
#80 opened by ASHLEYDX - 0
在运行llama2-13b的时候出现以下问题
#77 opened by Wowoho - 12
Linux 运行时报以下错误
#28 opened by guangyuanyu - 0
移植问题
#76 opened by yinghuo302 - 1
请问可以在不支持V扩展的RISC-V CPU上运行吗
#75 opened by TheKiteRunner24 - 3
arm 平台输出乱码
#71 opened by tanjatang - 0
可以在RV64指令集的CPU上运行吗
#74 opened by TheKiteRunner24 - 2
- 3
- 3
chatglm3有计划支持吗?
#72 opened by sunzhe09 - 5
感觉回答有些错乱,用的是macbook pro 推理chinese-alpaca-7b-q4
#15 opened by realcarlos - 1
- 1
请问是否有计划支持Whisper?
#69 opened by nxprxf - 1
ChatGLM2 效果异常
#66 opened by adf1178 - 3
unsupported relocation 37 on musl libc
#58 opened by xhebox - 1
chatglm2 GPU版本的int4、int8量化模型预测结果异常
#67 opened by itfish1990 - 6
能否改为GPU辅助计算
#65 opened by bzy-080408 - 8
windows下面编译失败
#17 opened by kavern1128 - 8
- 2
【new feature】通义千问有没有计划支持
#63 opened by guangyuanyu - 1
请问一下,这个是不是比python的性能更好?
#56 opened by wuent - 2
大模型推理中这个推理引擎如何支持 lora,ptuning等私有语料训练插件后的新模型
#53 opened by leoluopy - 13
make error
#54 opened by forwiat - 3
O3 optimization are slower on SG2042
#60 opened by xhebox - 0
Please support RWKV for refs and compare.
#59 opened by xiaol - 2
目前不支持gpu跑吗?我看代码中有添加对gpu的支持啊
#50 opened by sf9218 - 1
请问主循环中的token指代的是什么呢?函数体内部也没有看出来是代表什么
#51 opened by wangxu569 - 10
ChatGLM 2已经出了,什么时候可以支持一下啊
#42 opened by kungrainbow - 5
- 1
chatglm-6b下的模型格式不正确
#41 opened by wildkid1024 - 4
Compile error: void inferllm::BaiChuanGraph::constuct_llm()? marked ?override?, but does not override
#43 opened by cjia4 - 0
希望可以封装openai兼容API
#47 opened by nexx5 - 0
- 0
没有支持最新的llama.cpp的格式吗
#38 opened by AceyKubbo - 1
asserts 那个目录,建议改成 assets
#35 opened by csukuangfj - 3
在线程数>1时,会占满cpu核心
#34 opened by Yricky - 0
decode & decode_iter 多线程会不会有问题
#31 opened by guangyuanyu - 1
向量计算中使用CPU AVX指令,能否支持不使用AVX指令的版本
#30 opened by kungrainbow - 2
请问如何实现的量化?
#26 opened by lwo2002 - 2
更新的太慢了,求加速
#18 opened by wfan1203 - 1
- 0
Support input prompt like llama.cpp
#23 opened by donge - 0
- 2
tokenizer 在哪里下载
#19 opened by ljiuyuan1987 - 3
希望能编译成so文件
#16 opened by realcarlos