2017R

这里我试图创建、分享2017年秋季学期的《数据科学与社会研究》的课程资料

课程针对没有编程经验、统计基础的本科生,因此难度不大,理论较少,偏操作化。重点在于让他们对数据科学产生强烈的兴趣,了解数据科学技能累积的学习路径,掌握一些基本的数据获取、数据整理、数据分析和结果呈现的基本方法。尽量当做学习游戏技能一样,玩起来。

课程初步结构如下

第1讲、望远:备战大数据时代

课程介绍:大数据时代对于青年人的要求,如何达到这些要求!(PPT)

课程安排:做好课前预习和课后作业;成绩构成(70%作业;30%考试)。

课后作业:建一个群;安装好相关的软件,不懂则问;速读一本大数据相关的通俗读物,加深对于大数据的理解。

相关资料:http://note.youdao.com/noteshare?id=351a5e712274bd552b70aeb557a9cae5

第2讲、登高:数据、信息、知识与理论

课前预习:社会研究方法教材速读一遍。

课堂演示:对社会研究方法体系进行串讲(PPT)。

课后作业:针对大数据时代和社会研究方法中的某个问题,你如何积累条件并将之解决?短文原创1000字左右。

第3讲、立靶:数据汇总

课前预习:阅读一篇报告,总结它是如何论述自己的观点的(课堂上回答问题)。

课堂演示:基于tidyverse的数据分析过程展示。大纲:http://note.youdao.com/noteshare?id=94c815919f88613d071d2254934ca53e

课后作业:完成大纲中的R基础学习。

第4讲、夯基:关于R的基础

课前预习:将一份练习代码敲进电脑

课堂演示:R的基础性操作示范

示例1:http://r4ds.had.co.nz/workflow-basics.html

示例2:http://r4ds.had.co.nz/workflow-scripts.html

课后作业:用R完成几道简单的题目。

第5讲、备砖:数据管理

课前预习:将一份代码敲进电脑

课堂演示:如果利用dplyr包进行数据管理

示例1:http://r4ds.had.co.nz/transform.html

课后作业:用R完成一个数据处理的任务

第6讲、装修:信息呈现

课前预习:将一份数据图表和可视化的命令敲进电脑。

课堂演示:如何利用ggplot画图

示例1:http://moderndive.com/3-viz.html

课后作业:用R完成一个数据可视化的任务。

第7讲、回炉:综合实例

课前预习:了解实例的数据和问题,分解出任务步骤,尝试寻找方案。

课堂演示:一起完成实例

示例1:http://r4ds.had.co.nz/exploratory-data-analysis.html

课后作业:在实例的基础上完成几个扩展问题

第8讲、推论:统计检验

课前预习:

课堂演示:

示例1:http://moderndive.com/B-appendixB.html

示例2:https://github.com/andrewpbray/infer

课后作业:

第9讲、建模:线性回归

课前预习 课堂演示 课后作业

第10讲、控制:一般化回归

课前预习 课堂演示 课后作业

第11讲、连通:网络分析

课前预习 课堂演示 课后作业

第12讲、邻里:空间分析

课前预习 课堂演示 课后作业

第13讲、异型:文本分析

课前预习 课堂演示 课后作业

第14讲、采集:爬虫与数据获取

课前预习 课堂演示 课后作业

第15讲、新招:python爬虫

课前预习 课堂演示 课后作业