NLP 仓库
复现论文Entropy-based Term Weighting Schemes for Text Categorization in VSM的文本分类实验
使用语料库 Reuters R8
使用模型 : KNN、SVM
实现经典特征权重计算方法:
- tf-idf
- tf-chi
- tf-rf
- tf-ig
- tf-eccd
- iqf_qf_icf
实现论文提出的两种新的权重计算方法:
- tf-dc
- tf-bdc
整个实现过程详见这篇文章
百度机器阅读理解 神经网络和xgboost调参部分代码
神经网络包含M-LSTM和BIDAF两个官方给出的baseline
在baseline基础上改成从每篇文章抽取一个答案,增加r-net的核心层:self-matching
改动基于baseline的tensorflow版本
比赛总结详见这篇文章