Some amazing feature engineering knowledge.
-
什么是特征工程
- 特征工程是从冗余复杂的数据中选取更加一般化的、非冗余的特征用于模型训练的工程,其可以减少数据的大小和复杂性,还可以在一定程度上去除数据中的噪音,并且可以减少模型的训练和推理时间,同时其也可以提高模型的可解释性,并可以在很大程度上防止模型出现过拟合
-
特征工程的方法有哪些
- 前向特征选择:先使用一小部分特征来拟合模型,每次往模型训练中添加一部分新的特征,直到新加入的特征对于模型的效果没有影响
- 后向特征选择:与前向相反,先使用所有的特征进行训练,然后每次从特征集中剔除一部分特征,直到模型效果保持不变即可
-
参考资料