基于灰狼算法优化支持向量回归（GWO-SVR）的混合算法

一、算法核心原理

1.1 支持向量回归（SVR）基础

SVR是支持向量机（SVM）的回归版本，核心思想是通过核函数将数据映射到高维空间，寻找一个最优超平面使得预测值与真实值之间的误差小于ε的样本尽可能多，同时最大化间隔。其核心可调节参数直接影响模型精度：

C（惩罚系数）：控制对误差样本的惩罚力度，C越大模型越容易过拟合
ε（不敏感损失函数参数）：定义允许的误差范围，ε越小模型越敏感
核函数参数γ：决定高维空间的复杂度，γ越大模型越容易过拟合

1.2 灰狼优化算法（GWO）原理

GWO是模拟灰狼群体狩猎行为的群智能优化算法，将狼群分为α（头狼，最优解）、β（亚头狼，次优解）、δ（侦察狼，第三优解）、ω（普通狼，其余解）四个等级，通过迭代更新狼群位置逼近全局最优解，具有收敛速度快、全局寻优能力强的特点。

二、GWO-SVR混合算法优势

相比传统SVR的网格搜索、交叉验证调参方法，GWO-SVR具有以下优势：

对比维度	传统SVR调参	GWO-SVR调参
寻优效率	高维参数下呈指数级增长，计算量大	群智能并行搜索，复杂度低
寻优能力	容易陷入局部最优	全局搜索能力强，避免局部最优
调参适应性	依赖人工经验设置搜索范围	自适应搜索全局最优参数组合
预测精度	一般	通常提升10%-30%

三、完整MATLAB实现代码

3.1 主程序（main_GWO_SVR.m）

matlab 复制代码

%% GWO优化SVR完整实现
clc; clear; close all;

% ==================== 1. 数据准备 =====================
% 生成示例数据：非线性正弦函数加噪声
rng(42); % 固定随机种子保证可复现
X_train = linspace(0, 10, 100)'; % 100个训练样本
Y_train = sin(X_train) + 0.1*randn(100,1); % 带噪声的训练标签

X_test = linspace(0.5, 9.5, 50)'; % 50个测试样本
Y_test = sin(X_test) + 0.1*randn(50,1); % 带噪声的测试标签

% 数据归一化（SVR对尺度敏感，必须做）
X_train_norm = normalize(X_train); Y_train_norm = normalize(Y_train);
X_test_norm = normalize(X_test); Y_test_norm = normalize(Y_test);

% ==================== 2. GWO参数设置 =====================
gwo_params.swarm_size = 30;   % 狼群大小
gwo_params.max_iter = 100;    % 最大迭代次数
gwo_params.param_bounds = [0.1, 1000; 0.001, 1; 0.001, 10]; % [C下限, C上限; ε下限, ε上限; γ下限, γ上限]

% ==================== 3. 运行GWO优化SVR =====================
tic;
[c_opt, epsilon_opt, gamma_opt, best_mse, convergence] = gwo_svr_optimization(...
    X_train_norm, Y_train_norm, gwo_params);
optim_time = toc;
fprintf('优化完成！用时: %.2f秒\n', optim_time);
fprintf('最优参数: C=%.2f, ε=%.4f, γ=%.4f\n', c_opt, epsilon_opt, gamma_opt);
fprintf('训练集最优MSE: %.6f\n', best_mse);

% ==================== 4. 训练最优SVR模型 =====================
svr_model = fitrsvm(X_train_norm, Y_train_norm, ...
    'KernelFunction', 'rbf', ...
    'BoxConstraint', c_opt, ...
    'Epsilon', epsilon_opt, ...
    'KernelScale', gamma_opt, ...
    'Standardize', false); % 已经做过归一化

% ==================== 5. 预测与评估 =====================
Y_pred_norm = predict(svr_model, X_test_norm);
Y_pred = Y_pred_norm * (max(Y_test)-min(Y_test)) + min(Y_test); % 反归一化

% 计算评价指标
mse = mean((Y_test - Y_pred).^2);
rmse = sqrt(mse);
mae = mean(abs(Y_test - Y_pred));
r2 = 1 - sum((Y_test-Y_pred).^2)/sum((Y_test-mean(Y_test)).^2);

fprintf('\n=== 测试集预测结果 ===\n');
fprintf('MSE: %.6f\nRMSE: %.6f\nMAE: %.6f\nR²: %.4f\n', mse, rmse, mae, r2);

% ==================== 6. 可视化结果 =====================
analyze_results(X_train, Y_train, X_test, Y_test, Y_pred, convergence);

3.2 GWO优化核函数（gwo_svr_optimization.m）

matlab 复制代码

function [c_opt, epsilon_opt, gamma_opt, best_mse, convergence] = gwo_svr_optimization(...
    X_train, Y_train, gwo_params)
    % GWO优化SVR参数函数
    
    swarm_size = gwo_params.swarm_size;
    max_iter = gwo_params.max_iter;
    bounds = gwo_params.param_bounds;
    
    % 初始化狼群位置
    wolves = zeros(swarm_size, 3);
    for i = 1:swarm_size
        wolves(i,1) = bounds(1,1) + (bounds(1,2)-bounds(1,1))*rand(); % C
        wolves(i,2) = bounds(2,1) + (bounds(2,2)-bounds(2,1))*rand(); % ε
        wolves(i,3) = bounds(3,1) + (bounds(3,2)-bounds(3,1))*rand(); % γ
    end
    
    % 初始化α、β、δ狼位置
    alpha_pos = zeros(1,3); beta_pos = zeros(1,3); delta_pos = zeros(1,3);
    alpha_score = inf; beta_score = inf; delta_score = inf;
    
    convergence = zeros(max_iter, 1);
    
    for iter = 1:max_iter
        % 更新a参数（线性递减，从2降到0）
        a = 2 - iter * (2/max_iter);
        
        for i = 1:swarm_size
            % 计算每个狼的适应度（训练集交叉验证MSE）
            current_mse = cross_val_mse(X_train, Y_train, wolves(i,:));
            
            % 更新α、β、δ狼
            if current_mse < alpha_score
                alpha_score = current_mse; alpha_pos = wolves(i,:);
            elseif current_mse < beta_score
                beta_score = current_mse; beta_pos = wolves(i,:);
            elseif current_mse < delta_score
                delta_score = current_mse; delta_pos = wolves(i,:);
            end
        end
        
        % 更新每只狼的位置
        for i = 1:swarm_size
            for j = 1:3
                % 计算三个领导者到当前狼的距离
                r1 = abs(alpha_pos(j) - wolves(i,j));
                r2 = abs(beta_pos(j) - wolves(i,j));
                r3 = abs(delta_pos(j) - wolves(i,j));
                
                % 计算三个领导者的吸引系数
                A1 = 2*a*r1 - a;
                A2 = 2*a*r2 - a;
                A3 = 2*a*r3 - a;
                C1 = 2*r1; C2 = 2*r2; C3 = 2*r3;
                
                % 计算三个领导者的虚拟位置
                D_alpha = abs(C1*alpha_pos(j) - wolves(i,j));
                D_beta = abs(C2*beta_pos(j) - wolves(i,j));
                D_delta = abs(C3*delta_pos(j) - wolves(i,j));
                
                % 更新位置
                X1 = alpha_pos(j) - A1*D_alpha;
                X2 = beta_pos(j) - A2*D_beta;
                X3 = delta_pos(j) - A3*D_delta;
                
                wolves(i,j) = (X1 + X2 + X3)/3;
                
                % 边界约束
                wolves(i,j) = max(bounds(j,1), min(bounds(j,2), wolves(i,j)));
            end
        end
        
        % 记录收敛历史
        convergence(iter) = alpha_score;
        
        if mod(iter, 10) == 0
            fprintf('迭代 %d: 最优MSE = %.6f\n', iter, alpha_score);
        end
    end
    
    % 返回最优参数
    c_opt = alpha_pos(1);
    epsilon_opt = alpha_pos(2);
    gamma_opt = alpha_pos(3);
    best_mse = alpha_score;
end

function mse = cross_val_mse(X, Y, params)
    % 5折交叉验证计算MSE
    c = params(1); epsilon = params(2); gamma = params(3);
    K = 5;
    fold_size = floor(length(Y)/K);
    mse_total = 0;
    
    for k = 1:K
        % 划分训练集和验证集
        if k < K
            val_idx = (k-1)*fold_size+1 : k*fold_size;
        else
            val_idx = (k-1)*fold_size+1 : end;
        end
        train_idx = setdiff(1:length(Y), val_idx);
        
        % 训练SVR模型
        model = fitrsvm(X(train_idx,:), Y(train_idx), ...
            'KernelFunction', 'rbf', ...
            'BoxConstraint', c, ...
            'Epsilon', epsilon, ...
            'KernelScale', gamma, ...
            'Standardize', false);
        
        % 预测并计算MSE
        y_pred = predict(model, X(val_idx,:));
        mse_total = mse_total + mean((Y(val_idx) - y_pred).^2);
    end
    mse = mse_total / K;
end

3.3 结果可视化函数（analyze_results.m）

matlab 复制代码

function analyze_results(X_train, Y_train, X_test, Y_test, Y_pred, convergence)
    figure('Position', [100, 100, 1200, 400]);
    
    % 子图1：预测结果对比
    subplot(1,3,1);
    plot(X_train, Y_train, 'bo', 'MarkerSize', 6, 'MarkerFaceColor', 'b'); hold on;
    plot(X_test, Y_test, 'ro', 'MarkerSize', 8, 'MarkerFaceColor', 'r');
    plot(X_test, Y_pred, 'g-', 'LineWidth', 2);
    xlabel('特征 X'); ylabel('目标值 Y');
    legend('训练集', '测试集真实值', '预测值');
    title('GWO-SVR预测结果对比');
    grid on;
    
    % 子图2：预测误差分布
    subplot(1,3,2);
    error = Y_test - Y_pred;
    stem(X_test, error, 'k.', 'MarkerSize', 10); hold on;
    yline(0, 'r--', 'LineWidth', 1.5);
    xlabel('特征 X'); ylabel('预测误差');
    title('预测误差分布');
    grid on;
    
    % 子图3：GWO收敛曲线
    subplot(1,3,3);
    plot(1:length(convergence), convergence, 'b-', 'LineWidth', 2);
    xlabel('迭代次数'); ylabel('最优MSE');
    title('GWO-SVR收敛曲线');
    grid on;
    
    sgtitle('GWO优化SVR性能分析');
end

参考代码基于灰狼算法优化支持向量回归的混合算法 www.youwenfan.com/contentcsu/55124.html

四、算法优化与应用建议

4.1 性能提升技巧

自适应参数调整：将GWO的a参数改为自适应衰减策略，前期大步长全局搜索，后期小步长精细搜索，提升收敛精度
多目标优化：如果同时存在精度和时间要求，可采用多目标灰狼算法（MOGWO），同时优化预测精度和模型训练时间
并行计算：利用MATLAB的parfor并行计算狼群的适应度，可将优化速度提升2-5倍
混合优化：结合粒子群（PSO）的优势，在GWO后期加入PSO的速度更新机制，避免早熟收敛

4.2 适用场景

场景	优势	典型案例
小样本回归预测	避免过拟合，精度优于传统SVR	设备故障预测、材料性能预测
非线性系统建模	核函数适配非线性关系	工业过程建模、能源负荷预测
高维数据回归	降维能力强，处理速度快	金融时间序列预测、环境监测

4.3 常见问题解决

问题	原因	解决方案
预测精度低	参数范围设置不合理	扩大C、γ的搜索范围，或缩小ε的范围
收敛速度慢	狼群大小不足	增加狼群数量到50-100，或优化收敛条件
出现过拟合	惩罚系数C过大	降低C的上限，增大ε的下限
泛化能力差	训练样本不足	增加训练样本数量，或进行数据增强

五、总结

GWO-SVR混合算法充分发挥了SVR在小样本回归中的优势和GWO的全局寻优能力，相比传统SVR调参方法，预测精度通常可提升15%-35%，计算效率提升30%-50%。该算法可直接应用于时间序列预测、工业过程建模、智能故障诊断等多个领域，只需根据实际场景调整参数边界即可快速适配。