基于Pytorch实现多个中文文本匹配模型,使用的数据是来自哈工大提供的中文问题文本匹配数据Corpus,如需使用该数据,请自行发邮件去申请使用。
使用中文维基百科语料训练word2vec词向量,具体的训练过程请见:基于中文维基百科文本数据训练词向量。
运行环境:
- Python 3.6
- Pytorch 1.2
- GTX 1080ti
利用模型在测试集上的准确率作为评价指标。
结果比较:
模型 | ACC |
---|---|
ESIM | 80.752% |
SiameseGRU | 81.288% |
ABCNN | 79.656% |
更新中。。。
-
(ESIM) Enhanced LSTM for Natural Language Inference
-
(SiameseGRU) Siamese Recurrent Architectures for Learning Sentence Similarity
-
(ABCNN) ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs