验证集的ppl代码

Question

验证集的ppl代码

Ultraman-Orb opened this issue 4 years ago · 6 comments

请问在STC_test.json的验证集中 loss怎么求，我在infer.py的文件中加了(loss), *_ = model(input_ids, labels=lm_labels, token_type_ids=token_type_ids) ，但是lm_labels的值不知道，而在train.py中
input_ids, token_type_ids, lm_labels = tuple(input_tensor.to(args.device) for input_tensor in batch)
在infer.py中
instance, sequence = build_input_from_segments(history, reply, tokenizer, current_output, with_eos=False)
input_ids = torch.tensor(instance["input_ids"], dtype=torch.long, device=args.device).unsqueeze(0)

请问能否公布一下测试过程中的ppl代码

Answer 1 · 2021-01-31T09:08:26.000Z

你说的测试集合？就和本仓库中代码求valid的loss一样呀。。。不是给出了吗，我过几天尽量找找吧，太久远了。

Answer 2 · 2021-01-31T11:20:13.000Z

是测试集的loss，train文件valid的loss是evaluator = Engine(inference)，而在单独利用以训练好的模型去测试loss，没用Engine。就是想了解一下在STC_test.json文件下的loss值是多少，好计算ppl值，因为您之前说代码显示的avg_ppl和readme里的ppl值不是一个，所以希望您公布下您在STC_test.json整体loss和n_words的计算

Answer 3 · 2021-01-31T12:18:00.000Z

或者我可以这样算ppl吗？我把一个epoch中的所有avg_ppl求个均值，就是测试集的ppl？

Answer 4 · 2021-02-02T02:37:28.000Z

欸？你把验证集路径换成测试集，用我们代码不就直接能算出来了吗？

Answer 5 · 2021-02-02T02:59:29.000Z

欸？你把验证集路径换成测试集，用我们代码不就直接能算出来了吗？

是是是，我刚发现是这样的，真的非常抱歉，非常感谢！

Answer 6 · 2021-02-02T03:01:23.000Z

害，客气啥，加油