-
因为在极客时间上面学习了陈旸老师的《数据分析实战45讲》,学完后发现里面讲了大概的数据分析方法和思路(但是觉得这门课偏数据挖掘更多😂),但是还差一些东西,所以结合自己的理解对从第10章之后开始回炉重新整理到41章。章节不一定按照陈老师这个来分布,但是大致走向是相同的。
-
这个仓库主要是对自己知识的一个巩固,如果对各位入门数据分析也有帮助,那就更好。
PS:(主要针对入门数据分析的选手)当然里面若有理解错误的地方,请指正,谢谢各位 😁
下面是陈老师课程的地址:
第一模块:数据分析基础篇 (从第11讲开始)
11 | 数据科学家80%时间都花费在了这些清洗任务上?
12 | 数据集成:这些大号一共20亿粉丝?
13 | 数据变换:考试成绩要求正态分布合理么?
14丨数据可视化:掌握数据领域的万金油技能
15丨一次学会Python数据可视化的10种技能
16 | 数据分析基础篇答疑
第二模块: 数据分析算法篇(20讲)
17 丨决策树(上):要不要去打篮球?决策树来告诉你
18丨决策树(中):CART,一棵是回归树,另一棵是分类树
19丨决策树(下):泰坦尼克乘客生存预测
20丨朴素贝叶斯分类(上):如何让机器判断男女?
21丨朴素贝叶斯分类(下):如何对文档进行分类?
22丨SVM(上):如何用一根棍子将蓝红两色球分开?
23丨SVM(下):如何进行乳腺癌检测?
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?
25丨KNN(下):如何对手写数字进行识别?
26丨K-Means(上):如何给20支亚洲球队做聚类?
27丨K-Means(下):如何使用K-Means对图像进行分割?
28丨EM聚类(上):如何将一份菜等分给两个人?
29丨EM聚类(下):用EM算法对王者荣耀英雄进行划分
30丨关联规则挖掘(上):如何用Apriori发现用户购物规则?
31丨关联规则挖掘(下):导演如何选择演员?
32丨PageRank(上):搞懂Google的PageRank算法
33丨PageRank(下):分析希拉里邮件中的人物关系
34丨AdaBoost(上):如何使用AdaBoost提升分类器性能?
35丨AdaBoost(下):如何使用AdaBoost对房价进行预测?
36 | 数据分析算法篇答疑
第三模块:数据分析实战篇 (从38讲-41讲)
38丨数据可视化实战:如何给毛不易的歌曲做词云展示?
39丨数据挖掘实战(1):信用卡违约率分析
40丨数据挖掘实战(2):信用卡诈骗分析
41丨数据挖掘实战(3):如何对比特币走势进行预测?