gxh-ray/DataMining2

Jupyter Notebook

DataMining2

RelationshipMining 选择1个数据集进行频繁模式和关联规则挖掘

文件介绍:

RS_Mining.py 文件为源码

RS_Mining.pdf 文件为实验分析报告

RS_Mining.ipynb 文件是Jupyter Notebook格式文件

generate_rules.txt 为实验生成的关系规则文件

环境:

pyCharm
Anaconda+Jupyter Notebook
python3.6

分析报告内容包括

一、数据

1.1 数据集选择
Wine Reviews：winemag-data-130k-v2.csv 数据集包括（国家，酒的评分）
1.2 编程语言：python

二、数据分析要求

2.1 对数据集进行处理，转换成适合进行关联规则挖掘的形式
2.2 找出频繁模式
2.3 生成关联规则，计算其支持度和置信度
2.4 对规则进行评价，可使用Lift、卡方和其它教材中提及的指标，至少2种（这里采用了3种评价指标分别是：Lift、KULC、IR）
2.5 对挖掘结果进行分析
2.6 对挖掘结果可视化