数据集划分问题
cqcl1 opened this issue · 1 comments
cqcl1 commented
请问数据集文件有dev、train和test,test是没标签,请问带有标签的测试集用来评估测试结果是哪个文件呢?dev文件是验证集吗?evaluate.py这个文件是做什么的呢?评估测试集结果和预测未知标签数据集都是这个吗?
gaohongkui commented
你好,已更新了这部分混乱的逻辑。
dev.json 文件用于模型选择最优 f1 的依据,是验证集。
带有标签的测试集,可以在配置文件 train_config 中配置测试集文件,并切换 run_type 为 eval。具体实验逻辑是
GlobalPointer_pytorch/train.py
Lines 291 to 295 in 64d5cb8
evaluate.py 是用于最终无标签数据集的评价,也即预测过程