- 主要是一些爬虫代码, 指标分析需要相当的数据量, 所以需要一些测试数据,本系统数据来源是51Job。
- 尽量保证数据完整、一致性的条件下,做数据清洗。
- 去掉重复的数据。
- 将一些String字段,转换成的数字的字段,方便后期做数据分析。
- job_title string 职业标题
- work_city string 工作城市
- work_experience int 工作经验
- education string 教育经历
- company_demand string 招人要求
- other_asks string 公司其他要求
- company_name string 公司名称
- salary float 工资
- position string 职能
- company_type string 公司类型
- company_size string 公司规模
- address string 公司地址
- job_message string 工作简介