关于ATIS中(Liu,2016)的结果

Question

关于ATIS中(Liu,2016)的结果

seeledu opened this issue 6 years ago · 3 comments

你好，请问为什么slot filling 中(Liu,2016)的结果中用得是94.2，而不是Liu论文中的95+

Answer 1 · 2018-11-22T10:41:49.000Z

感谢你指出了问题，我的结果是直接使用Slot-Gated Modeling for Joint Slot Filling and Intent Prediction中报的结果。
ATIS数据的版本很乱，从是否做大小写数字预处理或数字预处理，到测试集使用的数据部分，大概有6个左右的版本。
我猜想可能数据版本的差异导致的结果不同，另外(Liu,2016)有提到他们使用额外的ATIS数据，这也可能是结果不同的原因之一。

Answer 2 · 2018-11-25T03:35:11.000Z

同时，(Liu，2016)的论文里面没有跑snip数据集的，用18年的那篇短文复现出来的结果会不会有点不妥。

Answer 3 · 2018-11-26T06:41:56.000Z

关于这个问题，我们认真考虑了一下：1.首先18年论文数据和代码公开易于比较，而且他们使用的baseline结果来自同一份数据，结果可比性比较高。2. 我们这边最近有同学复现也得到了类似的结果趋势，结果还是比较有可信性。3. 由于这个leader board只能是做到大致地研究前进脉络把握，我们的结果只能建立在平等地相信所有已正式发表论文的基础上。
所有你指出问题确实很有道理但是，我们打算暂时维持原状。
另外如果你有更可信或者公开的复现结果，欢迎你把结果发给我，我会列在结果列表。
：）