随机森林属于Bagging算法的进化版本,每次进行分支的时候,会当前结点的属性集合中随机选择一个包含个属性的子集,然后再从这个子集中选择一个最优属性用于划分。 对于分类问题,随机森林会让每棵树对输入数据进行决策,最后通过投票确定哪一类。如果有两类投票一样,则可以进行随机选择。 优点: 可以进行高纬度特征交叉可以并行化,训练速度快不容易出现过拟合实现起来比较简单 缺点: 在噪声比较大的分类和回归问题上会过拟合。