NaiveBayes 20news
任务
-
给定20个类,每个1000个文档,训练朴素贝叶斯分类器完成文本分类
-
数据来源:http://www.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
-
用F值、准确率等作为评价指标
-
选取合适的特征选择方法调优
-
采用五重交叉验证选取适当的超参数
过程
见pdf文件:过程.pdf
注:code_dev.ipynb展示调试过程
完成于2020年12月
上传于2022年2月