/machinelearning

机器学习算法笔记

Primary LanguagePython

机器学习的各种算法练习案例

决策树(trees.py)

优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。

缺点:可能会产生过度匹配问题

适用数据类型:数值型和标称型

决策树的一般流程

(1)收集数据:可以适用任何方法(如python的scrapy框架进行爬虫)

(2)准备数据:树构算法只适用于标称型数据,因此数值型数据必须离散化

(3)分析数据:可以适用任何方法,构造树完成之后,检查图形是否符合预期

(4)训练算法:构造树的数据结构

(5)测试算法:适用经验树计算错误率

(6)适用算法:适用于任何监督学习算法