王成军
社会科学家的机器学习(Machine Learning for Social Scientists) 暑期课程简介
本工作坊面向社会科学研究者,采用Python介绍机器学习(和深度学习)的基本逻辑(需要学员提前安装Anaconda),主要内容包括三(或四)个部分:1. 机器学习简介:从泰坦尼克号讲起;2. 机器学习初步: 朴素贝叶斯与线性回归;3. 机器学习进阶:支持向量机与随机森林;4. 机器学习扩展:基于Pytorch的神经网络模型(备选)。本工作坊所使用到的Slides、Python代码、阅读文献、案例见 https://github.com/computational-class/machine-learning
Note: 本部分基于python介绍机器学习的基本逻辑和算法,需要学员提前安装Anaconda、熟悉Jupyter notebook的使用、安装pytorch)。
序号 | 日期 | 时间 | 内容 | 课时数量 |
---|---|---|---|---|
1 | 7月1日 周六 | 9:00-11:00 | 机器学习简介:从泰坦尼克号讲起 | 2 |
1 | 7月1日 周六 | 11:00-12:00 | 课堂练习&答疑 | 1 |
1 | 7月1日 周六 | 14:00-16:00 | 机器学习简介: 模型校验 & 特征工程 | 2 |
1 | 7月1日 周六 | 16:00-17:00 | 课堂练习&答疑 | 1 |
2 | 7月2日 周日 | 9:00-11:00 | 机器学习进阶:朴素贝叶斯 & 线性回归 | 2 |
2 | 7月2日 周日 | 11:00-12:00 | 课堂练习&答疑 | 1 |
2 | 7月2日 周日 | 14:00-16:00 | 机器学习简介: 支持向量机 & 随机森林 | 2 |
2 | 7月2日 周日 | 16:00-17:00 | 课堂练习&答疑 | 1 |
3 | 7月3日 周一 | 9:00-11:00 | 机器学习拓展:基于Pytorch的神经网络模型 | 2 |
3 | 7月3日 周一 | 11:00-12:00 | 课堂练习&答疑 | 1 |
3 | 7月3日 周一 | 14:00-16:00 | 机器学习拓展:结课 | 2 |
3 | 7月3日 周一 | 16:00-17:00 | 课堂练习&答疑 | 1 |
https://github.com/SocratesAcademy/machine-learning
- What Is Machine Learning?
- Introducing Scikit-Learn
- Hyperparameters and Model Validation
- Feature Engineering
- In Depth: Naive Bayes Classification
- In Depth: Linear Regression
- In-Depth: Support Vector Machines
- In-Depth: Decision Trees and Random Forests
- In Depth: Neural Networks: An introduction
- In Depth: Neural Networks: Hand-written Digits
- In Depth: Neural Networks: CNN
- In Depth: Neural Networks: RNN
- 房价预测 https://www.kaggle.com/c/house-prices-advanced-regression-techniques/
- 预测银行用户是否参与定期存款 http://www.dcjingsai.com/common/cmpt/ANZ%20Chengdu%20Data%20Science%20Competition_%E7%AB%9E%E8%B5%9B%E4%BF%A1%E6%81%AF.html?lang=en_US
- 游戏玩家的付费预测 http://www.dcjingsai.com/common/cmpt/%E6%B8%B8%E6%88%8F%E7%8E%A9%E5%AE%B6%E4%BB%98%E8%B4%B9%E9%87%91%E9%A2%9D%E9%A2%84%E6%B5%8B%E5%A4%A7%E8%B5%9B_%E7%AB%9E%E8%B5%9B%E4%BF%A1%E6%81%AF.html
- 预测假新闻 https://www.kaggle.com/c/fake-news
- Whirlwind Tour Of Python https://jakevdp.github.io/WhirlwindTourOfPython/
- Beiginning Python https://github.com/SocratesAcademy/beginning-python-3ed
- Python Data Science Handbook https://jakevdp.github.io/PythonDataScienceHandbook/
- 动手学深度学习PyTorch版 http://d2l.ai/
- Introduction to Machine Learning with Python: A Guide for Data Scientist https://github.com/amueller/introduction_to_ml_with_python.
- Hands-on machine learning with scikit-learn, keras & tensorflow https://github.com/ageron/handson-ml3
- Machine Learning in Action https://github.com/pbharrin/machinelearninginaction & https://github.com/RedstoneWill/MachineLearningInAction-Camp & https://github.com/TingNie/Machine-learning-in-action
- 周志华《机器学习》,北京:清华大学出版社,2016. (ISBN 978-7-302-42328-7)
- 黄佳《零基础学机器学习》,北京:人民邮电出版社,2020. (ISBN 978-7-115-54599-2)
- 邱锡鹏《神经网络与深度学习》,北京:机械工业出版社,2020. (ISBN 978-7-111-64968-7)
- 南京大学《大数据挖掘与分析》课程 https://github.com/computational-class/bigdata
- 用Python玩转数据_**大学MOOC(慕课) http://www.icourse163.org/course/nju-1001571005
- Advanced Machine Learning with scikit-learn, Andreas Müller http://bit.ly/advanced_machine_learning_scikit-learn & https://github.com/computational-class/PythonMachineLearning