/TianChi-Industry4.0-Competition

1st Place Solution for TianChi-Industry4.0-Competition

Primary LanguagePython

工业4.0大数据竞赛 - 制造业质量控制

这是天池众智平台上的一道赛题:链接,本方案取得了第一名的成绩,解决方案和代码现整理开源。

解决方案

工业4.0大数据竞赛-技术方案总结

代码说明

data

存放原始的数据文件,包括:

  • 训练数据,draft_data_train.csv, param_data_train.csv, timevarying_param_train.csv
  • 旧测试数据,draft_data_test.csv, param_data_test.csv, timevarying_param_test.csv
  • 新测试数据,draft_data_test_new.csv, param_data_test_new.csv, timevarying_param_test_new.csv

数据分析与特征提取

  • plot_scatter.py,画散点图

  • feature_extract.py,提取特征,在data目录下生成feature目录,存放特征文件

classification

  • xgb_gt98.py,训练xgboost分类器,判断product_nokey_index是否大于0.98
  • xgb_lt92.py,训练xgboost分类器,判断product_nokey_index是否小于0.92

regression

  • old_testset目录

    • all目录
      • all_xgb.py,使用了所有特征训练的xgboost,做了特征选择
      • all_dart.py,使用了所有特征训练的dart,做了特征选择
    • half目录
      • xgb.py,使用了加工进度50%之前的特征训练的xgboost
    • draft目录
      • dart.py,使用draft_param特征训练的dart
    • gen_submission.py,生成提交文件
  • new_testset目录

    • dp_xgb.py,使用draft_paramparam两种特征训练的xgboost
    • dp_dart.py,使用draft_paramparam两种特征训练的dart
    • dp_rf.py,使用draft_paramparam两种特征训练的rf
    • d_xgb.py,使用draft_param特征训练的xgboost
    • d_rf.py,使用draft_param特征训练的rf
    • gen_submission.py,生成提交文件,融合了旧测试数据的结果。根据题目要求,分drafthalfall三种预测。
  • post_process.py,使用分类模型的预测结果,对回归预测的结果进行后处理

recommend

  • recommend.py,推荐三组工艺可调参数的预设值
  • recommend_every_product.py,针对特定的工艺不可调整参数,对工艺可调参数进行推荐