2024-04
把数据放在 data
文件夹下,或使用软链接
ln -s /path/to/data data
此文件夹内含有所需的 csv
文件。
此环境经过测试能用
# (可选)新建并激活
conda create -n xgb python=3.11.5
conda activate xgb
# 安装所需库
pip install -U matplotlib pandas scikit-learn xgboost
# 或
pip install -r requirements.txt
直接运行代码即可
python main.py
代码会自动在 metrics
文件夹记录评价指标,在 models
文件夹存储训练好的模型。
Method | AUC |
---|---|
logistic regression | 0.698 |
mlp | 0.637 |
random forest | 0.594 |
xgboost | 0.706 |
gradient boosting | 0.623 |
- recall很低,可能需要调阈值
- 在测试数据
data/data_x_202110.csv
预测结果,上传打分 - 计算其他各种针对变量或针对模型的评价指标
- 按要求画图
- ……