/Data_P

step by step

Primary LanguagePython

Data analysis practice

step by step

1.数据获取

网络爬虫

数据库

数据集网站

2.数据清洗

缺失值,异常值,数据类型转换

3.探索性分析与可视化

3.1 单因子分析

集中趋势:均值,中位数,分位数,众数

离中趋势:方差

异常值分析

对比分析

结构分析

分布分析:直径获得概率分布,假设检验,极大似然

3.2 多因子与复合分析

假设检验

相关系数

线性回归

PCA

3.3 可视化

seaborn

4.特征工程初步

4.1 特征预处理

标注

特征选择:过滤**,包裹**,嵌入**

特征变换:对指化,离散化,归一化,标准化,数值化,正规化

特征降维:PCA,LDA

特征衍生