从携程网上采集整理客户对酒店的评论,形成正面评论和负面评论语料库,利用python机器学习方法搭建情感分析模型。
主要步骤涉及:
数据准备,读取文件,数据预处理包括:整合数据生成样本空间、生成词袋、统计词频生成模型
1 合并txt文本,形成正负评价语料
2 结巴分词
3 去掉停用词
4 生成词袋
5 统计词频
6 划分训练集和测试集
7 引入朴素贝叶斯分类器(其他分类器也可)
8 模型预测评估
从携程网上采集整理客户对酒店的评论,形成正面评论和负面评论语料库,利用python搭建情感分析模型。
Jupyter Notebook