/AutoX

AutoX is an efficient automl tool, which is mainly aimed at data mining tasks with tabular data.

Primary LanguageJupyter NotebookApache License 2.0Apache-2.0

English | 简体中文 logo

AutoX是什么?

AutoX一个高效的自动化机器学习工具。 它的特点包括:

  • 效果出色: AutoX在多个kaggle数据集上,效果显著优于其他解决方案(见效果对比)。
  • 简单易用: AutoX的接口和sklearn类似,方便上手使用。
  • 通用: 适用于分类和回归问题。
  • 自动化: 无需人工干预,全自动的数据清洗、特征工程、模型调参等步骤。
  • 灵活性: 各组件解耦合,能单独使用,对于自动机器学习效果不满意的地方,可以结合专家知识,AutoX提供灵活的接口。
  • 比赛上分点总结:整理并公开历史比赛的上分点。

AutoX包含什么内容

加入社区

AutoX社区

如何为AutoX贡献

如何为AutoX贡献

目录

安装

github仓库安装

git clone https://github.com/4paradigm/autox.git
## github访问速度较慢时可以通过gitee地址 https://gitee.com/poteman/autox
pip install ./autox

pip安装

## pip安装包可能更新不及时,建议用github安装方式安装最新版本
!pip install automl-x -i https://www.pypi.org/simple/

快速上手

社区案例

汽车销量预测

比赛案例

见demo文件夹

效果对比

不同任务下的效果提升百分比

data_type 对比AutoGluon 对比H2o
binary classification 20.44% 2.98%
regression 37.54% 39.66%
time-series 28.40% 32.46%

详细数据集对比

data_type single-or-multi data_name metric AutoX AutoGluon H2o
binary classification single-table Springleaf auc 0.78865 0.61141 0.78186
binary classification-nlp single-table stumbleupon auc 0.87177 0.81025 0.79039
binary classification single-table santander auc 0.89196 0.64643 0.88775
binary classification multi-table IEEE accuracy 0.920809 0.724925 0.907818
regression single-table ventilator mae 0.755 8.434 4.221
regression single-table Allstate Claims Severity mae 1137.07885 1173.35917 1163.12014
regression single-table zhidemai mse 1.0034 1.9466 1.1927
regression single-table Tabular Playground Series - Aug 2021 rmse 7.87731 10.3944 7.8895
regression single-table House Prices rmse 0.13043 0.13104 0.13161
regression single-table Restaurant Revenue rmse 2133204.32146 31913829.59876 28958013.69639
regression multi-table Elo Merchant Category Recommendation rmse 3.72228 3.80801 22.88899
regression-ts single-table Demand Forecasting smape 13.79241 25.39182 18.89678
regression-ts multi-table Walmart Recruiting wmae 4660.99174 5024.16179 5128.31622
regression-ts multi-table Rossmann Store Sales RMSPE 0.13850 0.20453 0.35757
regression-cv single-table PetFinder rmse 20.1327 23.1732 21.0586

AutoX成就

企业支持

比赛获奖

TODO

功能开发完成后,发布相应的使用demo

  • 多个label预测
  • 多分类任务

若有其他希望AutoX支持的功能,欢迎提issue! 欢迎填写用户调研问卷,让AutoX变得更好!

错误排查

错误信息 解决办法