随机森林属于Bagging算法的进化版本,每次进行分支的时候,会当前结点的属性集合中随机选择一个包含随机森林 - 图1个属性的子集,然后再从这个子集中选择一个最优属性用于划分。

    对于分类问题,随机森林会让每棵树对输入数据进行决策,最后通过投票确定哪一类。如果有两类投票一样,则可以进行随机选择。

    优点

    1. 可以进行高纬度特征交叉
    2. 可以并行化,训练速度快
    3. 不容易出现过拟合
    4. 实现起来比较简单

    缺点

    1. 在噪声比较大的分类和回归问题上会过拟合。