RelationshipMining 选择1个数据集进行频繁模式和关联规则挖掘
文件介绍:
RS_Mining.py 文件为源码
RS_Mining.pdf 文件为实验分析报告
RS_Mining.ipynb 文件是Jupyter Notebook格式文件
generate_rules.txt 为实验生成的关系规则文件
环境:
- pyCharm
- Anaconda+Jupyter Notebook
- python3.6
分析报告内容包括
一、数据
-
1.1 数据集选择
Wine Reviews:winemag-data-130k-v2.csv 数据集包括(国家,酒的评分) -
1.2 编程语言:python
二、数据分析要求
-
2.1 对数据集进行处理,转换成适合进行关联规则挖掘的形式
-
2.2 找出频繁模式
-
2.3 生成关联规则,计算其支持度和置信度
-
2.4 对规则进行评价,可使用Lift、卡方和其它教材中提及的指标,至少2种(这里采用了3种评价指标分别是:Lift、KULC、IR)
-
2.5 对挖掘结果进行分析
-
2.6 对挖掘结果可视化