BigData-and-Analysis

文档说明:

  • pymysql_test.ipynb中,是讲了pymysql这个模块的加载及读取方法(很初级,没有深入)
  • pandas-csv--2018积分落户中药结合bj_luohu.csv文档查看,进入如果运行的话,需要修改一下文件夹路径。缺点是没有作图的示例。
  • pandas-csv——阿里巴巴股票数据分析案例 需要对应 BABA_stock.csv。
  • pandas-csv--google应用商店数据分析案例,对应googleplaystore.csv。(偏重数据清洗过程,有一部份解读)
  • pandas-csv——电商交易数据分析,对应order_info_2016.csv文档 。(单据之类的)
  • pandas与excel交互案例的n个*操作配合data中表格,内容涉及了读取数据,编号数据,给行或列改名,index列设置,计算列的值,读取mysql,跨行等
  • 力扣MySQL刷题记录MD--记录了力扣SQL部分的题目,免费版部分大部分都记录了.sql代码不熟,或者需要参考,可阅读.
  • 描述性统计分析概念-2文件(MD文档+ipynb代码示例),包括了描述性统计分析相关概念,及在代码中的实现.代码包括了方差\极差\线性回归\正态分布分析等操作.

分析思路:

  • 确定维度、跑出指标
  • 连续类的——分段 arrange & cut
  • 离散类的——分类 group by

练习题

  • 职位地区分布
  • 工资待遇
  • 工作年限要求
  • 技术能力要求

draw img文件夹

文件夹内是用各类软件绘制的有代表性的图,方便今后使用。

kaggle实战

数据接口调用

  • 数据接口查询疫情数据.py 查询2020新年新型冠状病毒疫情数据

更新日期1:2019.11.19 更新日期2:2019.11.20 更新日期3: 2019.11.28 更新日期4: 2020.02.02