基本流程
- 决策树是基于树结构对问题进行决策或判定的过程。
- 决策过程中提出的判定问题(内部节点)是对某个属性的“测试”,每个测试的结果可以导出最终结论(叶节点)或导出进一步判定问题(下一层内部节点),其考虑范围是在上次决策结果的限定范围之内。
- 一棵决策树包含一个根节点、若干个内部结点(属性测试)和若干个叶结点(决策结果)
判别西瓜是否是“好瓜”的决策树示例

决策树学习就是为了产生一棵泛化能力强,即处理未见示例能力强的决策树。基本算法如下:

notes:1)若当前结点包含的样本全属于同一类别,无需划分 ;2)若当前的属性集为空或者所有样本在所有属性上取值相同,无法划分;3)若当前结点包含的样本集合为空,不能划分
