基于Rosen梯度投影法的约束优化问题求解及MATLAB实现

摘要

在工程优化、经济建模等领域，约束优化问题普遍存在，其核心是在满足线性或非线性约束条件下求解目标函数的极值。本文聚焦Rosen梯度投影法，系统阐述其算法原理、实现步骤及MATLAB编程方法。

关键词：Rosen梯度投影法；约束优化；可行点；MATLAB实现；线性约束

一、引言

在科学研究与工程实践中，优化问题常需满足特定约束条件，如资源限制、物理定律等。约束优化问题的数学模型可表示为：
min ⁡ f ( x ) , s.t. { h i ( x ) = 0 , i = 1 , 2 , ⋯ , k g j ( x ) ≥ 0 , j = 1 , 2 , ⋯ , m \min f(\boldsymbol{x}), \quad \text{s.t.} \quad \begin{cases} h_i(\boldsymbol{x}) = 0, & i=1,2,\cdots,k \\ g_j(\boldsymbol{x}) \geq 0, & j=1,2,\cdots,m \end{cases} minf(x),s.t.{hi(x)=0,gj(x)≥0,i=1,2,⋯,kj=1,2,⋯,m

其中， f ( x ) f(\boldsymbol{x}) f(x)为目标函数， h i ( x ) h_i(\boldsymbol{x}) hi(x)和 g j ( x ) g_j(\boldsymbol{x}) gj(x)分别为等式与不等式约束。针对此类问题，Rosen梯度投影法是一种高效的直接法，尤其适用于线性约束场景，通过投影技术将梯度方向映射到可行域，逐步逼近最优解。

二、Rosen梯度投影法算法原理

2.1 核心思想

Rosen梯度投影法的核心是从一个可行点出发，沿目标函数下降的可行方向搜索，通过迭代更新可行点，最终收敛到最优解。其核心步骤包括：

可行点定义 ：满足所有约束条件的点 x \boldsymbol{x} x，即 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b（线性约束场景）。
梯度投影：将目标函数的负梯度方向投影到约束面的切空间，得到可行搜索方向；若投影后方向为零，则检查当前点是否为K-K-T点。

2.2 线性约束场景建模

假设约束条件为线性不等式 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b，其中 A A A为约束系数矩阵， b \boldsymbol{b} b为约束向量。在当前可行点 x ( k ) \boldsymbol{x}^{(k)} x(k)处，可将约束分为active约束（ A 1 x ( k ) = b 1 A_1\boldsymbol{x}^{(k)} = \boldsymbol{b}_1 A1x(k)=b1）和inactive约束（ A 2 x ( k ) > b 2 A_2\boldsymbol{x}^{(k)} > \boldsymbol{b}_2 A2x(k)>b2），分别对应紧约束和非紧约束。

2.3 投影矩阵构造

定义投影矩阵 P P P，用于将梯度方向投影到active约束的切空间。若 A 1 A_1 A1非空，投影矩阵为：
P = I − A 1 T ( A 1 A 1 T ) − 1 A 1 P = I - A_1^T (A_1 A_1^T)^{-1} A_1 P=I−A1T(A1A1T)−1A1

其中， I I I为单位矩阵。该矩阵可将任意向量投影到 A 1 x = b 1 A_1\boldsymbol{x} = \boldsymbol{b}_1 A1x=b1的切空间，即与active约束正交的子空间。

三、算法步骤详解

3.1 初始化

给定初始可行点 x ( 1 ) \boldsymbol{x}^{(1)} x(1)，满足 A x ( 1 ) ≥ b A\boldsymbol{x}^{(1)} \geq \boldsymbol{b} Ax(1)≥b，设置迭代计数器 k = 1 k=1 k=1。
分解约束矩阵 A A A为 [ A 1 ; A 2 ] [A_1; A_2] [A1;A2]，对应active约束 A 1 x ( k ) = b 1 A_1\boldsymbol{x}^{(k)} = \boldsymbol{b}_1 A1x(k)=b1和inactive约束 A 2 x ( k ) > b 2 A_2\boldsymbol{x}^{(k)} > \boldsymbol{b}_2 A2x(k)>b2。

3.2 投影方向计算

若 A 1 A_1 A1为空（无active约束），则投影矩阵 P = I P=I P=I，搜索方向为负梯度方向 d ( k ) = − ∇ f ( x ( k ) ) \boldsymbol{d}^{(k)} = -\nabla f(\boldsymbol{x}^{(k)}) d(k)=−∇f(x(k))。
若 A 1 A_1 A1非空，计算投影后的搜索方向：
d ( k ) = − P ∇ f ( x ( k ) ) \boldsymbol{d}^{(k)} = -P \nabla f(\boldsymbol{x}^{(k)}) d(k)=−P∇f(x(k))
若 d ( k ) ≠ 0 \boldsymbol{d}^{(k)} \neq \boldsymbol{0} d(k)=0，沿该方向搜索；若 d ( k ) = 0 \boldsymbol{d}^{(k)} = \boldsymbol{0} d(k)=0，则检查当前点是否为K-K-T点（即拉格朗日乘子非负）。

3.3 K-K-T点判定

计算拉格朗日乘子向量：
w = ( A 1 A 1 T ) − 1 A 1 ∇ f ( x ( k ) ) \boldsymbol{w} = (A_1 A_1^T)^{-1} A_1 \nabla f(\boldsymbol{x}^{(k)}) w=(A1A1T)−1A1∇f(x(k))

若 w ≥ 0 \boldsymbol{w} \geq \boldsymbol{0} w≥0，当前点为K-K-T点，停止迭代；否则，移除 w \boldsymbol{w} w中负分量对应的active约束，更新 A 1 A_1 A1后重新计算投影方向。

3.4 一维搜索与步长确定

在搜索方向 d ( k ) \boldsymbol{d}^{(k)} d(k)上求解一维优化问题：
min ⁡ λ ≥ 0 f ( x ( k ) + λ d ( k ) ) , s.t. A 2 ( x ( k ) + λ d ( k ) ) ≥ b 2 \min_{\lambda \geq 0} f(\boldsymbol{x}^{(k)} + \lambda \boldsymbol{d}^{(k)}), \quad \text{s.t.} \quad A_2(\boldsymbol{x}^{(k)} + \lambda \boldsymbol{d}^{(k)}) \geq \boldsymbol{b}_2 λ≥0minf(x(k)+λd(k)),s.t.A2(x(k)+λd(k))≥b2

最大步长 λ max \lambda_{\text{max}} λmax由inactive约束决定：
λ max = { ∞ , A 2 d ( k ) ≥ 0 min ⁡ { b 2 − A 2 x ( k ) A 2 d ( k ) ∣ A 2 d ( k ) < 0 } , 其他 \lambda_{\text{max}} = \begin{cases} \infty, & A_2 \boldsymbol{d}^{(k)} \geq \boldsymbol{0} \\ \min\left\{ \frac{\boldsymbol{b}_2 - A_2 \boldsymbol{x}^{(k)}}{A_2 \boldsymbol{d}^{(k)}} \mid A_2 \boldsymbol{d}^{(k)} < 0 \right\}, & \text{其他} \end{cases} λmax={∞,min{A2d(k)b2−A2x(k)∣A2d(k)<0},A2d(k)≥0其他

通过黄金分割法或进退法求解最优步长 λ k \lambda_k λk，更新可行点：
x ( k + 1 ) = x ( k ) + λ k d ( k ) \boldsymbol{x}^{(k+1)} = \boldsymbol{x}^{(k)} + \lambda_k \boldsymbol{d}^{(k)} x(k+1)=x(k)+λkd(k)

3.5 迭代终止条件

投影方向 d ( k ) \boldsymbol{d}^{(k)} d(k)为零，且拉格朗日乘子非负；
目标函数值或可行点变化小于指定精度 ε \varepsilon ε。

四、MATLAB实现

4.1 函数定义与参数说明

编写函数minRosen实现Rosen梯度投影法，调用格式：

matlab 复制代码

[x, minf] = minRosen(f, A, b, x0, var, eps)

f：目标函数（符号表达式）；
A：约束矩阵（线性不等式 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b）；
b：约束右端向量；
x0：初始可行点；
var：自变量向量（符号变量）；
eps：精度（默认 1 0 − 6 10^{-6} 10−6）。

4.2 核心代码逻辑

约束分解：遍历约束条件，分离active和inactive约束：

matlab 复制代码

k = 0; s = 0;
A1 = A; A2 = A;
b1 = b; b2 = b;
for i = 1:m
    dfun = A(i,:)*x0 - b(i);
    if abs(dfun) < 1e-9  % 视为active约束
        k = k + 1;
        A1(k,:) = A(i,:);
        b1(k,1) = b(i);
    else
        s = s + 1;
        A2(s,:) = A(i,:);
        b2(s,1) = b(i);
    end
end

投影矩阵与搜索方向：

matlab 复制代码

P = eye(n,n);
if k > 0
    tM = transpose(A1);
    P = P - tM * inv(A1 * tM) * A1;  % 构造投影矩阵
end
gv = Funval(gf, var, x0);  % 计算梯度
d = -P * gv;  % 搜索方向

一维搜索与步长计算：

matlab 复制代码

bb = b2 - A2 * x0;
dd = A2 * d;
if all(dd >= 0)
    lm = inf;  % 无步长限制
else
    lm = min(bb(dd < 0) ./ dd(dd < 0));  % 计算最大可行步长
end

4.3 完整代码（节选）

matlab 复制代码

function [x, minf] = minRosen(f, A, b, x0, var, eps)
    format long;
    if nargin == 5, eps = 1.0e-6; end
    syms lambda;
    x0 = transpose(x0); n = length(var);
    sz = size(A); m = sz(1);
    gf = jacobian(f, var);  % 目标函数梯度
    bConti = 1;
    
    while bConti
        % 分解active和inactive约束
        k = 0; s = 0;
        A1 = A; A2 = A;
        b1 = b; b2 = b;
        for i = 1:m
            dfun = A(i,:)*x0 - b(i);
            if abs(dfun) < 1e-9
                k = k + 1;
                A1(k,:) = A(i,:);
                b1(k,1) = b(i);
            else
                s = s + 1;
                A2(s,:) = A(i,:);
                b2(s,1) = b(i);
            end
        end
        if k > 0, A1 = A1(1:k,:); b1 = b1(1:k,:); end
        if s > 0, A2 = A2(1:s,:); b2 = b2(1:s,:); end
        
        % 计算投影矩阵和搜索方向
        P = eye(n,n);
        if k > 0
            tM = transpose(A1);
            P = P - tM * inv(A1 * tM) * A1;
        end
        gv = Funval(gf, var, x0);
        gv = transpose(gv);
        d = -P * gv;  % 搜索方向
        
        if all(d == 0)
            if k == 0
                x = x0;
                bConti = 0;
                break;
            else
                w = inv(A1 * tM) * A1 * gv;  % 拉格朗日乘子
                if all(w >= -1e-9)  % 考虑数值误差
                    x = x0;
                    bConti = 0;
                    break;
                else
                    [~, index] = min(w);  % 移除负乘子对应的约束
                    if size(A1,1) == 1
                        k = 0;
                    else
                        A1 = [A1(1:(index-1),:); A1((index+1):end,:)];
                    end
                end
            end
        else
            % 计算最大步长lambda_max
            bb = b2 - A2 * x0;
            dd = A2 * d;
            if all(dd >= -1e-9)
                lm = inf;
            else
                lm = min(bb(dd < -1e-9) ./ dd(dd < -1e-9));
            end
            
            % 一维搜索求解最优步长
            y1 = x0 + lambda * d;
            tmpf = subs(f, var, y1);
            [xm, ~] = minHJ(tmpf, 0, lm, 1e-14);  % 黄金分割法
            tol = norm(xm * d);
            if tol < eps
                x = x0;
                break;
            end
            x0 = x0 + xm * d;
        end
    end
    minf = Funval(f, var, x);
    format short;
end

五、实例分析：求解二维约束优化问题

5.1 问题描述

求目标函数 f ( t , s ) = 2 t 2 + s 2 − 2 t s + 3 t − 8 s + 2 f(t, s) = 2t^2 + s^2 - 2ts + 3t - 8s + 2 f(t,s)=2t2+s2−2ts+3t−8s+2在约束条件：
{ − t + s ≥ − 4 − 3 t − 5 s ≥ − 8 \begin{cases} -t + s \geq -4 \\ -3t - 5s \geq -8 \end{cases} {−t+s≥−4−3t−5s≥−8

下的极小值，初始可行点 x 0 = ( 0 , 0 ) \boldsymbol{x}^0 = (0, 0) x0=(0,0)。

5.2 MATLAB求解步骤

定义目标函数与约束：

matlab 复制代码

syms t s;
f = 2*t^2 + s^2 - 2*t*s + 3*t - 8*s + 2;
A = [-1 1; -3 -5];  % 约束矩阵A
b = [-4; -8];       % 约束向量b
x0 = [0; 0];        % 初始可行点

调用minRosen函数：

matlab 复制代码

[x, mf] = minRosen(f, A, b, x0, [t s])

结果输出：

matlab 复制代码

x = -0.3764   1.8258
mf = -8.7444

5.3 结果分析

最优解 x ∗ ≈ ( − 0.3764 , 1.8258 ) \boldsymbol{x}^*\approx (-0.3764, 1.8258) x∗≈(−0.3764,1.8258)，满足所有约束条件：
- − ( − 0.3764 ) + 1.8258 = 2.2022 ≥ − 4 -(-0.3764) + 1.8258 = 2.2022 \geq -4 −(−0.3764)+1.8258=2.2022≥−4
- − 3 ( − 0.3764 ) − 5 ( 1.8258 ) = 1.1292 − 9.1290 = − 8.0 ≥ − 8 -3(-0.3764) -5(1.8258) = 1.1292 - 9.1290 = -8.0 \geq -8 −3(−0.3764)−5(1.8258)=1.1292−9.1290=−8.0≥−8
目标函数值收敛到局部极小值，验证算法有效性。

六、注意事项

初始点选择：必须为可行点，否则算法无法启动（可通过预处理调整初始点）。
约束处理：仅适用于线性约束，非线性约束需转换为其他方法（如罚函数法）。
数值精度：迭代过程中需考虑浮点数误差，避免因舍入错误导致收敛失败。
计算效率：高维问题中投影矩阵求逆可能耗时，可结合稀疏矩阵优化计算。

七、总结

Rosen梯度投影法通过可行点搜索与梯度投影技术，为线性约束优化问题提供了高效的求解框架。其核心优势在于直接利用约束结构，避免了罚函数法的参数调整难题，适用于工程优化中的线性约束场景。

复制代码