/PythonDataScience

Python数据科学系专栏(pandas、Numpy、SKlearn、Matplotlib)、实战项目(代码、讲解、数据集)

Primary LanguageJupyter NotebookMIT LicenseMIT

📚项目介绍

本项目分享 Python 数据科学 相关技术,包括pandasNumpySklearnMatplotlib等各种基于Python的数据科学计算库的使用技巧。除常规方法以外,还专门收集各种*操作,每个*操作里都有5-8种实用技巧,整理归纳成专题系列,在实战应用中用处很大。我会逐渐完善它,持续输出中

原创文章每周最少一篇,后续最新文章会在微信公众号【Python数据科学 】首发,大家可以加我【微信】进交流群,技术交流或提意见都可以,欢迎Star!

由于整个内容较多,建议使用ctrl+F搜索关键词,快速找到你想要的答案!

一、pandas*操作系列

序号 pandas*操作 公众号 代码和数据
1 dtype 变量类型自动转换 文字教程 代码和数据
2 json 格式自动解析 文字教程 代码和数据
3 Numpy 矢量化加速技巧 文字教程 代码和数据
4 accessor 数据处理 文字教程 代码和数据
5 transform 数据转换技巧 文字教程 代码和数据
6 concat 数据拼接技巧 文字教程 代码和数据
7 set_option 全局设置技巧 文字教程 代码和数据
8 index 索引设置方法 文字教程 代码和数据
9 groupby 分组技巧 文字教程 代码和数据
10 explode 列转行技巧 文字教程 代码和数据

二、pandas数据清洗系列

序号 清洗方法 公众号文字教程 代码和数据 更新状态
1 缺失值处理 文字教程 代码和数据
2 重复值处理 文字教程 代码和数据
3 文本处理 文字教程 代码和数据

三、数据科学实战项目

序号 实战项目 模型 算法 公众号 代码和数据
1 北京二手房房价预测(分析篇) 树模型 CART决策树 文字教程 代码和数据
2 北京二手房房价预测(模型篇) 树模型 CART决策树 文字教程 代码和数据
3 个人信贷违约预测(完整讲解篇) 树模型 XGBoost 文字教程 代码和数据
4 客户细分聚类(理论+代码) 聚类 Hierarchical 文字教程 代码和数据
5 客户价值识别实现精准营销 聚类 K-Means 文字教程 代码和数据

持续更新..