基本流程

  • 决策树是基于树结构对问题进行决策或判定的过程。
  • 决策过程中提出的判定问题(内部节点)是对某个属性的“测试”,每个测试的结果可以导出最终结论(叶节点)或导出进一步判定问题(下一层内部节点),其考虑范围是在上次决策结果的限定范围之内。
  • 一棵决策树包含一个根节点、若干个内部结点(属性测试)和若干个叶结点(决策结果)
  • 判别西瓜是否是“好瓜”的决策树示例

    1. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/758052/1626974870790-40b0ec6b-cce1-4f83-a6e2-35a6af0ce4ee.png#align=left&display=inline&height=202&margin=%5Bobject%20Object%5D&name=image.png&originHeight=404&originWidth=397&size=34931&status=done&style=none&width=198.5)
  • 决策树学习就是为了产生一棵泛化能力强,即处理未见示例能力强的决策树。基本算法如下:

image.png
notes:1)若当前结点包含的样本全属于同一类别,无需划分 ;2)若当前的属性集为空或者所有样本在所有属性上取值相同,无法划分;3)若当前结点包含的样本集合为空,不能划分

划分选择

ID3决策树

C4.5决策树

CART决策树