tensorflow和theano的cnn代码准确率都轻松超过了80%。。。
pcgreat opened this issue · 6 comments
pcgreat commented
我用的作者原封不动的代码,数据是从这里拿的https://github.com/codekansas/insurance_qa_python,改成和作者一样的格式,跑起来以后发现用train拿来训练,用test1拿来validate。
无论是在作者tensorflow还是theano的代码上top-1 accuracy都轻松达到0.86,learning rate为0.1,epoch大概6000, 在K80上训练时间都不超过半小时。
据我所知,该项目的state-of-art不超过0.7,作者的代码简直轻松完虐。我仔细检查了代码,并没有发现明显的错误,有小伙伴跑出一样的结果吗?
运行的代码在这(仅仅清理了一下代码放上了train和test data,参数结构和原作者的完全一致) https://github.com/pcgreat/insuranceQA-cnn-lstm/tree/master/cnn/tensorflow
方便大家重现结果
pcgreat commented
@qilicun 是这样的,作者在tensorflow的版本里其实没用pretrained word2vec, 可以看这里https://github.com/white127/insuranceQA-cnn-lstm/blob/master/cnn/tensorflow/insqa_train.py他在第50行提取了word2vec向量,然后在第51行把它覆盖了,所以其实他并没有用pretrained word2vec