评价材料的问题

Question

评价材料的问题

qianzhang2018 opened this issue 9 months ago · 0 comments

qianzhang2018 commented 9 months ago

感觉用于评价模型的这个材料太贴近生活实际了，就是模型本身很可能就已经知道问题的答案了，训练过了。
感觉合理的材料应该是创造一些或者改造成架空世界的问题，比如2013年miumiu杯比赛中的获奖者有哪些人？过去现在未来，模型都不会知道正确答案是啥，这样感觉评价题目更合理。我看很多中文问题其实模型不需要材料也可以作答。