/PythonDataScience

Python数据科学系专栏(pandas、Numpy、SKlearn、Matplotlib)、实战项目(代码、讲解、数据集)

Primary LanguageJupyter NotebookMIT LicenseMIT

项目介绍

本项目分享 Python 数据科学 相关技术,包括pandasNumpySklearnMatplotlib等各种基于Python的数据科学计算库的使用技巧。除常规方法以外,还专门收集各种*操作,每个*操作里都有5-8种实用技巧,整理归纳成专题系列,在实战应用中用处很大。我会逐渐完善它,持续输出中

原创文章每周最少一篇,后续最新文章会在微信公众号【Python数据科学 】首发,大家可以加我【微信】进交流群,技术交流或提意见都可以,欢迎Star!

由于整个内容较多,建议使用ctrl+F搜索关键词,快速找到你想要的答案!

1. pandas*操作系列

序号 类别 公众号文字教程 代码和数据 更新状态
1 dtype 变量类型自动转换 文字教程 代码和数据
2 json 格式自动解析 文字教程 代码和数据
3 Numpy 矢量化加速技巧 文字教程 代码和数据
4 accessor 数据处理 文字教程 代码和数据
5 transform 数据转换技巧 文字教程 代码和数据
6 concat 数据拼接技巧 文字教程 代码和数据
7 set_option 全局设置技巧 文字教程 代码和数据
8 index 索引设置方法 文字教程 代码和数据
9 groupby 分组技巧 文字教程 代码和数据
10 explode 列转行技巧 文字教程 代码和数据
11 变量类型转换 文字教程 代码和数据

2. pandas数据清洗系列

序号 类别 公众号文字教程 代码和数据 更新状态
1 缺失值处理 文字教程 代码和数据
2 重复值处理 文字教程 代码和数据
3 文本处理 文字教程 代码和数据
4 分类数据处理 文字教程 代码和数据

3. 数据科学实战项目

序号 实战项目 模型算法 公众号文字教程 代码和数据 更新状态
1 北京二手房房价预测(分析篇) 决策树 文字教程 代码和数据
2 北京二手房房价预测(模型篇) 决策树 文字教程 代码和数据
3 个人信贷违约预测(完整讲解篇) XGBoost分类 文字教程 代码和数据
4 客户细分聚类(理论+代码) 层次聚类 文字教程 代码和数据
5 客户价值识别实现精准营销 K-Means聚类 文字教程 代码和数据

持续更新..