/Review-Data-Analysis-45-Projects-of-GeekTime

因为在极客时间上面学习了陈旸老师的数据分析实战45讲,发现里面还差了一些细节的东西,所以开了这个仓库重新对其中的部分章节进行回炉重整,希望对各位入门数据分析的有帮助。

Primary LanguageJupyter Notebook

回炉整理《数据分析实战45讲》部分章节

  1. 因为在极客时间上面学习了陈旸老师的《数据分析实战45讲》,学完后发现里面讲了大概的数据分析方法和思路(但是觉得这门课偏数据挖掘更多😂),但是还差一些东西,所以结合自己的理解对从第10章之后开始回炉重新整理到41章。章节不一定按照陈老师这个来分布,但是大致走向是相同的。

  2. 这个仓库主要是对自己知识的一个巩固,如果对各位入门数据分析也有帮助,那就更好。

PS:(主要针对入门数据分析的选手)当然里面若有理解错误的地方,请指正,谢谢各位 😁

下面是陈老师课程的地址:

第一模块:数据分析基础篇 (从第11讲开始)

11 | 数据科学家80%时间都花费在了这些清洗任务上?

12 | 数据集成:这些大号一共20亿粉丝?

13 | 数据变换:考试成绩要求正态分布合理么?

14丨数据可视化:掌握数据领域的万金油技能

15丨一次学会Python数据可视化的10种技能

16 | 数据分析基础篇答疑

第二模块: 数据分析算法篇(20讲)

17 丨决策树(上):要不要去打篮球?决策树来告诉你

18丨决策树(中):CART,一棵是回归树,另一棵是分类树

19丨决策树(下):泰坦尼克乘客生存预测

20丨朴素贝叶斯分类(上):如何让机器判断男女?

21丨朴素贝叶斯分类(下):如何对文档进行分类?

22丨SVM(上):如何用一根棍子将蓝红两色球分开?

23丨SVM(下):如何进行乳腺癌检测?

24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?

25丨KNN(下):如何对手写数字进行识别?

26丨K-Means(上):如何给20支亚洲球队做聚类?

27丨K-Means(下):如何使用K-Means对图像进行分割?

28丨EM聚类(上):如何将一份菜等分给两个人?

29丨EM聚类(下):用EM算法对王者荣耀英雄进行划分

30丨关联规则挖掘(上):如何用Apriori发现用户购物规则?

31丨关联规则挖掘(下):导演如何选择演员?

32丨PageRank(上):搞懂Google的PageRank算法

33丨PageRank(下):分析希拉里邮件中的人物关系

34丨AdaBoost(上):如何使用AdaBoost提升分类器性能?

35丨AdaBoost(下):如何使用AdaBoost对房价进行预测?

36 | 数据分析算法篇答疑

第三模块:数据分析实战篇 (从38讲-41讲)

38丨数据可视化实战:如何给毛不易的歌曲做词云展示?

39丨数据挖掘实战(1):信用卡违约率分析

40丨数据挖掘实战(2):信用卡诈骗分析

41丨数据挖掘实战(3):如何对比特币走势进行预测?