原文链接
在这篇博文中,讲述了RF的一些代码使用方法和下载链接。
因为已经下载下来了,所以把函数文件放这。MATLAB_scripts_functions.zip

使用代码的步骤

在载入数据完成后,即可按照下面的步骤运行RFC(Random Forest Classifiction)

  1. 决定决策树的数量。例如,我们可以设数量为500
  2. 决定投入决策树的X的比例。例如,可以将一组比例可以设为0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8。
  3. 对于每个比例运行决策树分类的代码,预测包外数据的标签。
  4. 计算预测标签和真实标签之间的错误率。
  5. 找到最小错误率对应的最佳X-比率
  6. 使用最佳比率构建随机森林分类模型
  7. 使用最佳比率计算出标签Y值,然后计算每个学习器真实标签和预测标签之间的混淆矩阵。
  8. 计算真实标签Y和使用合适的X-比率计算的包外数据的标签之间的混淆矩阵
  9. 使用第6步的RFC模型计算预测值

    安装要求

    安装Matlab,需要准备统计和机器学习工具箱。

第二种代码

原文链接

介绍

这是一个由Leo Breiman提出的RF算法的一个接口,使用的是R语言,工具包地址:点此链接
另外,作者写的是Matlab版本的randomforest-matlab.zip
关于这部分代码的使用:
使用训练数据构建模型,并且预测,计算MSE

  1. modelClass = classRF_train(X_trn, Y_trn);
  2. yHat = classRF_predict(X_st, model);
  3. errRate = length(find(yHat -= yTst));