jeinlee1991/chinese-llm-benchmark

10B以下的LLM排名不太准确,实际使用ChatGLM3-6B和Qwen1.5-7B表现更好

Opened this issue · 2 comments

如题,

ChatGLM3比ChatGLM4好哦,测试过一些。

我们之前算法团队内部评测过,综合下来ChatGLM3-6B比Qwen1.5-7B好一些。(我们是私有化场景)