identifying duplicate questions on Quora
- LabGuide_2017S.pdf课程任务要求
- Quora上任务详情
- 参考博客1
- 参考博客2
- preprocess.py对数据进行预处理,删除两行存在NaN数据,数据量为404288
- tfIdf.py提取每个词的词向量,并乘上tf-idf值形成最终的句子特征,300维
- quora.py训练并测试
- myKeras.ipynb搭建网络并最终完成实验
- IR实验报告_基于神经网络的重复问题检测实验报告
identifying duplicate questions on Quora