/Sentiment-Analysis-Python

从携程网上采集整理客户对酒店的评论,形成正面评论和负面评论语料库,利用python搭建情感分析模型。

Primary LanguageJupyter Notebook

Sentiment-Analysis-Python

从携程网上采集整理客户对酒店的评论,形成正面评论和负面评论语料库,利用python机器学习方法搭建情感分析模型。

主要步骤涉及:

数据准备,读取文件,数据预处理包括:整合数据生成样本空间、生成词袋、统计词频生成模型

1 合并txt文本,形成正负评价语料

2 结巴分词

3 去掉停用词

4 生成词袋

5 统计词频

6 划分训练集和测试集

7 引入朴素贝叶斯分类器(其他分类器也可)

8 模型预测评估