摘要
在工程优化、经济建模等领域,约束优化问题普遍存在,其核心是在满足线性或非线性约束条件下求解目标函数的极值。本文聚焦Rosen梯度投影法,系统阐述其算法原理、实现步骤及MATLAB编程方法。
关键词:Rosen梯度投影法;约束优化;可行点;MATLAB实现;线性约束
一、引言
在科学研究与工程实践中,优化问题常需满足特定约束条件,如资源限制、物理定律等。约束优化问题的数学模型可表示为:
min f ( x ) , s.t. { h i ( x ) = 0 , i = 1 , 2 , ⋯ , k g j ( x ) ≥ 0 , j = 1 , 2 , ⋯ , m \min f(\boldsymbol{x}), \quad \text{s.t.} \quad \begin{cases} h_i(\boldsymbol{x}) = 0, & i=1,2,\cdots,k \\ g_j(\boldsymbol{x}) \geq 0, & j=1,2,\cdots,m \end{cases} minf(x),s.t.{hi(x)=0,gj(x)≥0,i=1,2,⋯,kj=1,2,⋯,m
其中, f ( x ) f(\boldsymbol{x}) f(x)为目标函数, h i ( x ) h_i(\boldsymbol{x}) hi(x)和 g j ( x ) g_j(\boldsymbol{x}) gj(x)分别为等式与不等式约束。针对此类问题,Rosen梯度投影法是一种高效的直接法,尤其适用于线性约束场景,通过投影技术将梯度方向映射到可行域,逐步逼近最优解。
二、Rosen梯度投影法算法原理
2.1 核心思想
Rosen梯度投影法的核心是从一个可行点出发,沿目标函数下降的可行方向搜索,通过迭代更新可行点,最终收敛到最优解。其核心步骤包括:
- 可行点定义 :满足所有约束条件的点 x \boldsymbol{x} x,即 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b(线性约束场景)。
- 梯度投影:将目标函数的负梯度方向投影到约束面的切空间,得到可行搜索方向;若投影后方向为零,则检查当前点是否为K-K-T点。
2.2 线性约束场景建模
假设约束条件为线性不等式 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b,其中 A A A为约束系数矩阵, b \boldsymbol{b} b为约束向量。在当前可行点 x ( k ) \boldsymbol{x}^{(k)} x(k)处,可将约束分为active约束( A 1 x ( k ) = b 1 A_1\boldsymbol{x}^{(k)} = \boldsymbol{b}_1 A1x(k)=b1)和inactive约束( A 2 x ( k ) > b 2 A_2\boldsymbol{x}^{(k)} > \boldsymbol{b}_2 A2x(k)>b2),分别对应紧约束和非紧约束。
2.3 投影矩阵构造
定义投影矩阵 P P P,用于将梯度方向投影到active约束的切空间。若 A 1 A_1 A1非空,投影矩阵为:
P = I − A 1 T ( A 1 A 1 T ) − 1 A 1 P = I - A_1^T (A_1 A_1^T)^{-1} A_1 P=I−A1T(A1A1T)−1A1
其中, I I I为单位矩阵。该矩阵可将任意向量投影到 A 1 x = b 1 A_1\boldsymbol{x} = \boldsymbol{b}_1 A1x=b1的切空间,即与active约束正交的子空间。
三、算法步骤详解
3.1 初始化
- 给定初始可行点 x ( 1 ) \boldsymbol{x}^{(1)} x(1),满足 A x ( 1 ) ≥ b A\boldsymbol{x}^{(1)} \geq \boldsymbol{b} Ax(1)≥b,设置迭代计数器 k = 1 k=1 k=1。
- 分解约束矩阵 A A A为 [ A 1 ; A 2 ] [A_1; A_2] [A1;A2],对应active约束 A 1 x ( k ) = b 1 A_1\boldsymbol{x}^{(k)} = \boldsymbol{b}_1 A1x(k)=b1和inactive约束 A 2 x ( k ) > b 2 A_2\boldsymbol{x}^{(k)} > \boldsymbol{b}_2 A2x(k)>b2。
3.2 投影方向计算
- 若 A 1 A_1 A1为空(无active约束),则投影矩阵 P = I P=I P=I,搜索方向为负梯度方向 d ( k ) = − ∇ f ( x ( k ) ) \boldsymbol{d}^{(k)} = -\nabla f(\boldsymbol{x}^{(k)}) d(k)=−∇f(x(k))。
- 若 A 1 A_1 A1非空,计算投影后的搜索方向:
d ( k ) = − P ∇ f ( x ( k ) ) \boldsymbol{d}^{(k)} = -P \nabla f(\boldsymbol{x}^{(k)}) d(k)=−P∇f(x(k))
若 d ( k ) ≠ 0 \boldsymbol{d}^{(k)} \neq \boldsymbol{0} d(k)=0,沿该方向搜索;若 d ( k ) = 0 \boldsymbol{d}^{(k)} = \boldsymbol{0} d(k)=0,则检查当前点是否为K-K-T点(即拉格朗日乘子非负)。
3.3 K-K-T点判定
计算拉格朗日乘子向量:
w = ( A 1 A 1 T ) − 1 A 1 ∇ f ( x ( k ) ) \boldsymbol{w} = (A_1 A_1^T)^{-1} A_1 \nabla f(\boldsymbol{x}^{(k)}) w=(A1A1T)−1A1∇f(x(k))
若 w ≥ 0 \boldsymbol{w} \geq \boldsymbol{0} w≥0,当前点为K-K-T点,停止迭代;否则,移除 w \boldsymbol{w} w中负分量对应的active约束,更新 A 1 A_1 A1后重新计算投影方向。
3.4 一维搜索与步长确定
在搜索方向 d ( k ) \boldsymbol{d}^{(k)} d(k)上求解一维优化问题:
min λ ≥ 0 f ( x ( k ) + λ d ( k ) ) , s.t. A 2 ( x ( k ) + λ d ( k ) ) ≥ b 2 \min_{\lambda \geq 0} f(\boldsymbol{x}^{(k)} + \lambda \boldsymbol{d}^{(k)}), \quad \text{s.t.} \quad A_2(\boldsymbol{x}^{(k)} + \lambda \boldsymbol{d}^{(k)}) \geq \boldsymbol{b}_2 λ≥0minf(x(k)+λd(k)),s.t.A2(x(k)+λd(k))≥b2
最大步长 λ max \lambda_{\text{max}} λmax由inactive约束决定:
λ max = { ∞ , A 2 d ( k ) ≥ 0 min { b 2 − A 2 x ( k ) A 2 d ( k ) ∣ A 2 d ( k ) < 0 } , 其他 \lambda_{\text{max}} = \begin{cases} \infty, & A_2 \boldsymbol{d}^{(k)} \geq \boldsymbol{0} \\ \min\left\{ \frac{\boldsymbol{b}_2 - A_2 \boldsymbol{x}^{(k)}}{A_2 \boldsymbol{d}^{(k)}} \mid A_2 \boldsymbol{d}^{(k)} < 0 \right\}, & \text{其他} \end{cases} λmax={∞,min{A2d(k)b2−A2x(k)∣A2d(k)<0},A2d(k)≥0其他
通过黄金分割法或进退法求解最优步长 λ k \lambda_k λk,更新可行点:
x ( k + 1 ) = x ( k ) + λ k d ( k ) \boldsymbol{x}^{(k+1)} = \boldsymbol{x}^{(k)} + \lambda_k \boldsymbol{d}^{(k)} x(k+1)=x(k)+λkd(k)
3.5 迭代终止条件
- 投影方向 d ( k ) \boldsymbol{d}^{(k)} d(k)为零,且拉格朗日乘子非负;
- 目标函数值或可行点变化小于指定精度 ε \varepsilon ε。
四、MATLAB实现
4.1 函数定义与参数说明
编写函数minRosen
实现Rosen梯度投影法,调用格式:
matlab
[x, minf] = minRosen(f, A, b, x0, var, eps)
f
:目标函数(符号表达式);A
:约束矩阵(线性不等式 A x ≥ b A\boldsymbol{x} \geq \boldsymbol{b} Ax≥b);b
:约束右端向量;x0
:初始可行点;var
:自变量向量(符号变量);eps
:精度(默认 1 0 − 6 10^{-6} 10−6)。
4.2 核心代码逻辑
- 约束分解:遍历约束条件,分离active和inactive约束:
matlab
k = 0; s = 0;
A1 = A; A2 = A;
b1 = b; b2 = b;
for i = 1:m
dfun = A(i,:)*x0 - b(i);
if abs(dfun) < 1e-9 % 视为active约束
k = k + 1;
A1(k,:) = A(i,:);
b1(k,1) = b(i);
else
s = s + 1;
A2(s,:) = A(i,:);
b2(s,1) = b(i);
end
end
- 投影矩阵与搜索方向:
matlab
P = eye(n,n);
if k > 0
tM = transpose(A1);
P = P - tM * inv(A1 * tM) * A1; % 构造投影矩阵
end
gv = Funval(gf, var, x0); % 计算梯度
d = -P * gv; % 搜索方向
- 一维搜索与步长计算:
matlab
bb = b2 - A2 * x0;
dd = A2 * d;
if all(dd >= 0)
lm = inf; % 无步长限制
else
lm = min(bb(dd < 0) ./ dd(dd < 0)); % 计算最大可行步长
end
4.3 完整代码(节选)
matlab
function [x, minf] = minRosen(f, A, b, x0, var, eps)
format long;
if nargin == 5, eps = 1.0e-6; end
syms lambda;
x0 = transpose(x0); n = length(var);
sz = size(A); m = sz(1);
gf = jacobian(f, var); % 目标函数梯度
bConti = 1;
while bConti
% 分解active和inactive约束
k = 0; s = 0;
A1 = A; A2 = A;
b1 = b; b2 = b;
for i = 1:m
dfun = A(i,:)*x0 - b(i);
if abs(dfun) < 1e-9
k = k + 1;
A1(k,:) = A(i,:);
b1(k,1) = b(i);
else
s = s + 1;
A2(s,:) = A(i,:);
b2(s,1) = b(i);
end
end
if k > 0, A1 = A1(1:k,:); b1 = b1(1:k,:); end
if s > 0, A2 = A2(1:s,:); b2 = b2(1:s,:); end
% 计算投影矩阵和搜索方向
P = eye(n,n);
if k > 0
tM = transpose(A1);
P = P - tM * inv(A1 * tM) * A1;
end
gv = Funval(gf, var, x0);
gv = transpose(gv);
d = -P * gv; % 搜索方向
if all(d == 0)
if k == 0
x = x0;
bConti = 0;
break;
else
w = inv(A1 * tM) * A1 * gv; % 拉格朗日乘子
if all(w >= -1e-9) % 考虑数值误差
x = x0;
bConti = 0;
break;
else
[~, index] = min(w); % 移除负乘子对应的约束
if size(A1,1) == 1
k = 0;
else
A1 = [A1(1:(index-1),:); A1((index+1):end,:)];
end
end
end
else
% 计算最大步长lambda_max
bb = b2 - A2 * x0;
dd = A2 * d;
if all(dd >= -1e-9)
lm = inf;
else
lm = min(bb(dd < -1e-9) ./ dd(dd < -1e-9));
end
% 一维搜索求解最优步长
y1 = x0 + lambda * d;
tmpf = subs(f, var, y1);
[xm, ~] = minHJ(tmpf, 0, lm, 1e-14); % 黄金分割法
tol = norm(xm * d);
if tol < eps
x = x0;
break;
end
x0 = x0 + xm * d;
end
end
minf = Funval(f, var, x);
format short;
end
五、实例分析:求解二维约束优化问题
5.1 问题描述
求目标函数 f ( t , s ) = 2 t 2 + s 2 − 2 t s + 3 t − 8 s + 2 f(t, s) = 2t^2 + s^2 - 2ts + 3t - 8s + 2 f(t,s)=2t2+s2−2ts+3t−8s+2在约束条件:
{ − t + s ≥ − 4 − 3 t − 5 s ≥ − 8 \begin{cases} -t + s \geq -4 \\ -3t - 5s \geq -8 \end{cases} {−t+s≥−4−3t−5s≥−8
下的极小值,初始可行点 x 0 = ( 0 , 0 ) \boldsymbol{x}^0 = (0, 0) x0=(0,0)。
5.2 MATLAB求解步骤
- 定义目标函数与约束:
matlab
syms t s;
f = 2*t^2 + s^2 - 2*t*s + 3*t - 8*s + 2;
A = [-1 1; -3 -5]; % 约束矩阵A
b = [-4; -8]; % 约束向量b
x0 = [0; 0]; % 初始可行点
- 调用
minRosen
函数:
matlab
[x, mf] = minRosen(f, A, b, x0, [t s])
- 结果输出:
matlab
x = -0.3764 1.8258
mf = -8.7444
5.3 结果分析
- 最优解 x ∗ ≈ ( − 0.3764 , 1.8258 ) \boldsymbol{x}^*\approx (-0.3764, 1.8258) x∗≈(−0.3764,1.8258),满足所有约束条件:
- − ( − 0.3764 ) + 1.8258 = 2.2022 ≥ − 4 -(-0.3764) + 1.8258 = 2.2022 \geq -4 −(−0.3764)+1.8258=2.2022≥−4
- − 3 ( − 0.3764 ) − 5 ( 1.8258 ) = 1.1292 − 9.1290 = − 8.0 ≥ − 8 -3(-0.3764) -5(1.8258) = 1.1292 - 9.1290 = -8.0 \geq -8 −3(−0.3764)−5(1.8258)=1.1292−9.1290=−8.0≥−8
- 目标函数值收敛到局部极小值,验证算法有效性。
六、注意事项
- 初始点选择:必须为可行点,否则算法无法启动(可通过预处理调整初始点)。
- 约束处理:仅适用于线性约束,非线性约束需转换为其他方法(如罚函数法)。
- 数值精度:迭代过程中需考虑浮点数误差,避免因舍入错误导致收敛失败。
- 计算效率:高维问题中投影矩阵求逆可能耗时,可结合稀疏矩阵优化计算。
七、总结
Rosen梯度投影法通过可行点搜索与梯度投影技术,为线性约束优化问题提供了高效的求解框架。其核心优势在于直接利用约束结构,避免了罚函数法的参数调整难题,适用于工程优化中的线性约束场景。