大家好，有个T-Eval评测数据集的疑惑，希望各位帮忙解答一下，感谢。

Question

Closed this issue 3 months ago · 2 comments

在评测数据集中一般都给定了工具列表给模型，但是在现实中用户是直接向模型提问题，并没有添加任何工具列表（而且大多数都是普通用户，并不知道这些操作），请问用这样的评测数据集去评测模型的agent能力有意义不？

Answer 1 · 2024-02-27T04:52:06.000Z

但是现实中不也是要提供工具模型才能去解决用户提出的需要调用工具的问题吗hhh

Answer 2 · 2024-02-27T06:42:02.000Z

工具模型

明白，感谢回答。