前期做过的一些机器学习项目整理
这个项目是刚接触机器学习的时候,尝试利用pipline对常用机器学习算法建立统一的流程,实现如下功能:
1、算法参数调节;
2、数据特征选择;
3、结果预测;
前端网站是用jsp写的,向后端传递参数、调用python模型运行的结果。
后端在sklearn的基础上,直接调用相关算法模型,然后利用GridSearchCV搜索最优参数,运行时间稍微长点,也算是最简单的AutoML了哈。
后端模型设置了如下几种算法:MLPC、AdaBoost、LR、RF、SVM、GBDT、Bagging、KNN、DT、GNB等。
常用的工具模块,包括上面FoolAlgorithm中用到的一些数据预处理、分类模型等,还包括:
1、常用文本分析、textRank等;
2、数据库连接;
3、画图;
4、常用回归分析;
5、常用聚类等;