原文链接
在这篇博文中,讲述了RF的一些代码使用方法和下载链接。
因为已经下载下来了,所以把函数文件放这。MATLAB_scripts_functions.zip
使用代码的步骤
在载入数据完成后,即可按照下面的步骤运行RFC(Random Forest Classifiction)
- 决定决策树的数量。例如,我们可以设数量为500
- 决定投入决策树的X的比例。例如,可以将一组比例可以设为0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8。
- 对于每个比例运行决策树分类的代码,预测包外数据的标签。
- 计算预测标签和真实标签之间的错误率。
- 找到最小错误率对应的最佳X-比率
- 使用最佳比率构建随机森林分类模型
- 使用最佳比率计算出标签Y值,然后计算每个学习器真实标签和预测标签之间的混淆矩阵。
- 计算真实标签Y和使用合适的X-比率计算的包外数据的标签之间的混淆矩阵
- 使用第6步的RFC模型计算预测值
安装要求
安装Matlab,需要准备统计和机器学习工具箱。
第二种代码
介绍
这是一个由Leo Breiman提出的RF算法的一个接口,使用的是R语言,工具包地址:点此链接
另外,作者写的是Matlab版本的randomforest-matlab.zip
关于这部分代码的使用:
使用训练数据构建模型,并且预测,计算MSE
modelClass = classRF_train(X_trn, Y_trn);
yHat = classRF_predict(X_st, model);
errRate = length(find(yHat -= yTst));