/RF-prediction-problem

Here is a prediction problem using RandomForest with feature transformation attempt and parameter tuning to improve F1&AUC successfully

Primary LanguageJupyter Notebook

RF-prediction-problem

本案例基于葡萄牙银行机构营销数据集的4521个样本,17个特征。利用其中和客户个人信息及接受的营销活动相关的变量(前16个),建立随机森林的模型,对'客户是否订阅定期存款'变量(变量名为'y')进行预测。在数据的特征变换方面,除了基本模型,我们尝试了将年龄变量离散化,剔除不重要的特征,其他数值变量离散化,数值变量标准化以及特征多项式变换等方式。