chen700564/RGB

评价材料的问题

qianzhang2018 opened this issue · 0 comments

感觉用于评价模型的这个材料太贴近生活实际了,就是模型本身很可能就已经知道问题的答案了,训练过了。
感觉合理的材料应该是创造一些或者改造成架空世界的问题,比如2013年miumiu杯比赛中的获奖者有哪些人? 过去现在未来,模型都不会知道正确答案是啥,这样感觉评价题目更合理。我看很多中文问题其实模型不需要材料也可以作答。