open-compass/T-Eval

Llama2 7b chat 模型,输入长度超过 4096

Opened this issue · 1 comments

您好,我在测 llama2 7b chat模型时,发现测试数据输入长度有很多大于4096的情况,请问该如何处理才能对齐榜单中的测试结果?

我们测试的时候没有对超长的数据做特殊处理