本项目为随机森林的Hadoop实现

算法介绍

}G@~9U6D%VJBYZ`{8}Z4M @32E6N$HB2A(M7HC M@J7I

mapreduce设计

流程图

GI$EF$Y% P629@SF8A`CI6A

1.随机抽样训练集——分裂文件

TXWDHA51WO0Z2HU%Z Y)3

2.得到最佳分裂属性——计算

SA (8%F19L(APAYK7JLIQAN

3.根据最佳分裂属性分裂数据集——分裂文件

{%1S_}{ZDVVT3)OTXIV KF0

编程实现

T{D LBVJ@{W_K74 ADP0U)T

算法效果

运行过程

5(}6B6 LJU14USWQ5W{~C

决策树可视化

image