算法描述背景知识信息熵条件熵信息增益计算例子按照年龄划分经验熵按照年龄划分的条件经验熵计算信息增益 算法描述 背景知识 信息熵信息熵用来描述不确定度,参照单位是抛硬币的不确定度。1bit的信息熵相当于抛一个硬币的不确定度,也就是有两种不确定情况。设不确定情况为,则信息熵=。如果用概率来表示,每一种不确定情况发生的概率为,那么宏观的信息熵就是每种情况发生的概率,乘以各自的信息熵,即是 条件熵 信息增益信息增益的意义:引入属性A后,原来数据集D的不确定性减少了多少。相当于带来多少信息量 计算例子 按照年龄划分经验熵 按照年龄划分的条件经验熵 计算信息增益