/Naive-Bayes-Classifier-master

naive bayes classifier for text classification

Primary LanguagePython

Naive-Bayes-Classifier-master

naive bayes classifier for text classification

**数据:**文学、体育、校园、女性四类文本数据

**分类器:**朴素贝叶斯分类器 NBC(Naive Bayesian Classifier)

**编程语言:**Python+jieba分词库+sklearn

注意:

1. 文本预处理部分可以继续优化   
2. 使用PCA降维之后出现非正定报错,暂未解决,后面采用TFIDF方式
3. 可以采用nltk或sklearn,注意其中选取的特征格式不同。nltk要求特征为dict格式,sklearn要求特征为list