机器学习的各种算法练习案例 决策树(trees.py) 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题 适用数据类型:数值型和标称型 决策树的一般流程 (1)收集数据:可以适用任何方法(如python的scrapy框架进行爬虫) (2)准备数据:树构算法只适用于标称型数据,因此数值型数据必须离散化 (3)分析数据:可以适用任何方法,构造树完成之后,检查图形是否符合预期 (4)训练算法:构造树的数据结构 (5)测试算法:适用经验树计算错误率 (6)适用算法:适用于任何监督学习算法