MATLAB实现随机森林回归算法

随机森林回归是一种基于集成学习的机器学习算法,它通过组合多个决策树来进行回归任务。随机森林的基本思想是通过构建多个决策树,并将它们的预测结果进行平均或投票来提高模型的准确性和鲁棒性。

以下是随机森林回归的主要特点和步骤:

  1. 决策树的构建: 随机森林由多个决策树组成。每个决策树都是通过对原始数据进行有放回的随机抽样(bootstrap抽样)来训练的。此外,在每次分裂节点时,算法随机选择一个特征子集进行分裂,以增加模型的多样性。

  2. 预测过程: 对于回归任务,随机森林中的每个决策树都会输出一个预测值。最终的随机森林预测结果是这些预测值的平均值。

  3. 超参数调优: 随机森林有一些重要的超参数,如树的数量、每棵树的最大深度、特征子集的大小等。通过交叉验证等方法,可以调整这些超参数以优化模型性能。

  4. 特征重要性: 随机森林可以提供每个特征对于模型预测的重要性程度。这对于理解模型和特征选择非常有帮助。

  5. 抗过拟合: 随机森林具有较好的抗过拟合能力,因为每个决策树都是在不同的数据子集上训练的,且通过随机选择特征子集来减少相关性。

    Matlab 复制代码
    In=ques2c(:,2:7);
    Out=ques2c(:,1);;
    %此处未进行归一化,切记,使用归一化的数据进行训练,后面要记得反归一化,且数据多处进行归一化,不可遗漏
    nTree = 100;%树的个数
    %训练模型
    Factor = TreeBagger(nTree, In, Out,'Method','regression','OOBpredictorImportance','on','MinLeafSize',5);%
    %性能评估,k-fold交叉验证法
    subplot(121)
    [Predict_label,Scores] = predict(Factor, In);
    plot(Out,Out,'LineWidth',3);
    hold on
    scatter(Out,Predict_label,'filled');
    xlabel('Real temp')
    ylabel('Predict temp')
    hold off
    grid on
    subplot(122)
    plot(Factor.oobError,'LineWidth',2);
    xlabel('Number of grown trees')
    ylabel('Out-of-bag classification error')
    grid on
    %%
    view(Factor.Trees{1},'Mode','graph')
    %变量重要性直方图
    weights=Factor.OOBPermutedVarDeltaError;
    %重要性降序
    
    barh(weights)
    set(gca,'yticklabels',{'CO? emission','NOx emission','SO? emission','VOCs emission','CO? concentration','Population'})
    xlabel('Weights')
    ylabel('Index')
    %误差变化图
    figure
    plot(Factor.oobError,'LineWidth',2);
    xlabel('生长树数量','FontSize',30)
    ylabel('袋外错误率','FontSize',30)
    title('袋外错误率','FontSize',30)
    set(gca,'FontSize',16)
    set(gca,'LineWidth',2);   
    grid on
    % 计算R方值
    SSR = sum((Predict_label - mean(y_test)).^2);
    SST = sum((y_test - mean(y_test)).^2);
    R_squared = 1 - SSR/SST;
    % 打印R方值
    disp(['R方值为: ', num2str(R_squared)]);
相关推荐
简简单单做算法6 小时前
基于PSO粒子群优化的VMD-LSTM时间序列预测算法matlab仿真
算法·matlab·lstm·时间序列预测·pso·vmd-lstm·pso-vmd-lstm
硅谷秋水6 小时前
NORA:一个用于具身任务的小型开源通才视觉-语言-动作模型
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
zzc9218 小时前
无线通信网络拓扑推理采样率实验(数据生成)
python·matlab·拓扑·无线通信网络拓扑推理·wcna·tpi
mwicogito9 小时前
实验复现:应用 RIR 触发器的 TrojanRoom 后门攻击实现
人工智能·python·机器学习·语音识别·后门攻击
灏瀚星空10 小时前
高频交易技术:订单簿分析与低延迟架构——从Level 2数据挖掘到FPGA硬件加速的全链路解决方案
人工智能·python·算法·信息可视化·fpga开发·架构·数据挖掘
诺亚凹凸曼11 小时前
用AI思维重塑人生:像训练神经网络一样优化自己
人工智能·机器学习
淡酒交魂12 小时前
「Flink」Flink项目搭建方法介绍
大数据·数据挖掘·数据分析
HyperAI超神经12 小时前
在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
人工智能·深度学习·机器学习·文本转语音·语音处理·语音生成·在线教程
Shining_Jiang12 小时前
打卡第44天:无人机数据集分类
人工智能·分类·数据挖掘
bubiyoushang88813 小时前
MATLAB实现图像纹理特征提取
人工智能·算法·matlab