复现论文Entropy-based Term Weighting Schemes for Text Categorization in VSM的文本分类实验
使用语料库 Reuters R8
使用模型 : KNN、SVM
实现经典特征权重计算方法:
- tf-idf
- tf-chi
- tf-rf
- tf-ig
- tf-eccd
- iqf_qf_icf
实现论文提出的两种新的权重计算方法:
- tf-dc
- tf-bdc
整个实现过程详见这篇文章
复现论文Entropy-based Term Weighting Schemes for Text Categorization in VSM的文本分类实验
使用语料库 Reuters R8
使用模型 : KNN、SVM
实现经典特征权重计算方法:
实现论文提出的两种新的权重计算方法:
整个实现过程详见这篇文章