/2017R

2017Rcourse

Primary LanguageHTML

2017R

这里我试图创建、分享2017年秋季学期的《数据科学与社会研究》的课程资料

课程针对没有编程经验、统计基础的本科生,因此难度不大,理论较少,偏操作化。重点在于让他们对数据科学产生强烈的兴趣,了解数据科学技能累积的学习路径,掌握一些基本的数据获取、数据整理、数据分析和结果呈现的基本方法。尽量当做学习游戏技能一样,玩起来。

课程初步结构如下

第1讲、望远:备战大数据时代

课程介绍:大数据时代对于青年人的要求,如何达到这些要求!(PPT)

课程安排:做好课前预习和课后作业;成绩构成(70%作业;30%考试)。

课后作业:建一个群;安装好相关的软件,不懂则问;速读一本大数据相关的通俗读物,加深对于大数据的理解。

相关资料:http://note.youdao.com/noteshare?id=351a5e712274bd552b70aeb557a9cae5

第2讲、登高:数据、信息、知识与理论

课前预习:社会研究方法教材速读一遍。

课堂演示:对社会研究方法体系进行串讲(PPT)。

课后作业:针对大数据时代和社会研究方法中的某个问题,你如何积累条件并将之解决?你可以简单写写自己的学习规划。

第3讲、立靶:数据汇总

课前预习:预习教材中数据可视化和基础部分

http://r4ds.had.co.nz/workflow-basics.html

http://r4ds.had.co.nz/data-visualisation.html

课堂演示:基于tidyverse的数据分析过程展示。请认真阅读课程演示大纲和设计:

http://note.youdao.com/noteshare?id=94c815919f88613d071d2254934ca53e

课后作业:完成大纲中的R基础操作部分的自学;尝试将ggplot的cheatsheet中的示例敲出来。

第4讲、夯基:关于R的基础

课前预习:将一份练习代码敲进电脑

课堂演示:R的基础性操作示范

示例1:http://r4ds.had.co.nz/workflow-basics.html

示例2:http://r4ds.had.co.nz/workflow-scripts.html

课后作业:用R完成几道简单的题目。

第5讲、备砖:数据管理

课前预习:将一份代码敲进电脑(R-basic cheatsheet)

课堂演示:如果利用dplyr包进行数据管理

示例1:http://r4ds.had.co.nz/transform.html

示例2:http://moderndive.com/5-wrangling.html

课后作业:用R完成一个数据处理的任务

第6讲、装修:信息呈现

课前预习:将一份数据图表和可视化的命令敲进电脑。

课堂演示:如何利用ggplot画图

示例1:http://moderndive.com/3-viz.html 示例2:http://r4ds.had.co.nz/data-visualisation.html

课后作业:用R完成一个数据可视化的任务。

第7讲、回炉:综合实例

课前预习:了解实例的数据和问题,分解出任务步骤,尝试寻找方案。

课堂演示:一起完成实例

示例1:http://r4ds.had.co.nz/exploratory-data-analysis.html

课后作业:在实例的基础上完成几个扩展问题

第8讲、推论:统计检验

课前预习:第二讲讲义中关于抽样和统计推论的部分

课堂演示:如何用R来进行卡方检验、T检验、方差检验、分析检验,模拟抽样分布

示例1:http://moderndive.com/7-sim.html

示例2:http://moderndive.com/8-hypo.html

示例3:http://moderndive.com/9-ci.html

课后作业:阅读 http://moderndive.com/B-appendixB.html;https://github.com/andrewpbray/infer

第9讲、建模:线性回归

课前预习:预习回归模型相关的内容

课堂演示:

示例1:http://r4ds.had.co.nz/model-basics.html

示例2:http://moderndive.com/6-regression.html

课后作业:将示例中的命令操作一遍

第10讲、控制:一般化回归

课前预习:预习回归诊断、模型选择的相关教材

课堂演示 示例1:http://r4ds.had.co.nz/model-building.html

示例2:http://r4ds.had.co.nz/many-models.html 课后作业:将示例联系一遍,并完成其中的作业题。

第11讲、连通:网络分析

课前预习:预习社会网络分析的基本概念和历史

网址:http://note.youdao.com/share/?id=28c7b0a4e947ae29462fb424cf11dd21&type=note#/

课堂演示:

网址:http://note.youdao.com/noteshare?id=253f889e679ee73b33423819e18b6604

课后作业:将相关演示命令操作一遍

第12讲、邻里:空间分析

课前预习:空间分析的基本原理

网址1:http://note.youdao.com/noteshare?id=92cbe89d3e03cc530ac28c4a0eb6449e 网址2:http://note.youdao.com/noteshare?id=4f4180ea28db7fdd238b882b681c5cd2

课堂演示:

网址:http://www.people.fas.harvard.edu/~zhukov/spatial.html

课后作业:将演示中的相关命令和问题操作一遍。

第13讲、异型:文本分析

课前预习:http://note.youdao.com/noteshare?id=f0d94703ba72b57c54ad9318bdf0f274

课堂演示:http://tidytextmining.com/

课后作业:将演示教材中的例子操作一遍。

第14讲、采集:爬虫与数据获取

课前预习:http://note.youdao.com/noteshare?id=57cc2a7d0f893b58d4fbb217f65f167d

课堂演示:http://note.youdao.com/noteshare?id=6d0aab0f55880292730ff9535488b356

课后作业:尝试爬取一个网站。

第15讲、新招:python爬虫

课前预习:

http://note.youdao.com/noteshare?id=8b5797ca96ee80737a6a9048c0423b6f

http://note.youdao.com/noteshare?id=ab8f1f4e84519a6eb3881c8d7ca37841

http://note.youdao.com/noteshare?id=aa3b31703ff6468eb2c884494e11b939

课堂演示:

http://note.youdao.com/noteshare?id=8d72a2741f381b292d40c7583047c891

课后作业: 安装配置好python,尝试爬取一个网页