/chinese_text_classifier

中文文本分类,采用jieba分词、gensim、sklearn库实现,基于python2.7

Primary LanguagePython

chinese_text_classifier

运用流程:

1、先分词 segmentWord.py

2、得到词典 getDictinary.py

3、得到分词后语料 getCorpus.py

4、得到文档模型 getWordModel.py

5、然后word2vec w2vDemo.py

6、词云 worldCloudDemo.py

6、聚类 txtClusterDemo.py、txtClusterKmeansDemo.py

7、分类 svmClassify.py