第8篇：线性二次型调节器

你是否遇到过？

做工控闭环调速、机器人姿态稳控、自动驾驶横向纠偏这类项目时，你大概率都被PID参数调试狠狠折磨过：对着P、I、D三个系数反复盲试，熬夜调出一组参数勉强稳住单工况，一旦负载变动、运行速度切换，系统立马出现超调超标、持续震荡或是响应拖沓的问题，从头再调又是大半天。想接触更稳定的最优控制方案，又被课本上密密麻麻的矩阵运算、黎卡提方程劝退，总觉得线性二次型调节器（LQR）是高校实验室里的"理论玩具"，根本没法落地到嵌入式、PLC这类实际工程场景。这篇文章就是为打破这个误区而来，全程避开枯燥的纯数学推导，只抓物理意义+工程逻辑+实操代码，把晦涩的LQR拆解得通俗易懂。学完本篇，你能彻底绕开PID盲调陷阱，建立LQR全局认知，掌握工业级最优稳定控制的核心方法，还能直接跑通Python仿真，把最优控制真正用进实际项目，彻底告别对现代控制理论的畏难情绪。

一、线性二次型调节器核心概念

先给大家一句直白好记的核心定义：线性二次型调节器（LQR，Linear Quadratic Regulator），是专门面向线性系统设计的最优状态反馈控制器，名字里的"线性"和"二次型"直接点明两大核心前提：控制对象是线性时不变（LTI）系统，控制效果的评价标准采用二次型代价函数；最终控制目标清晰明确------把系统状态平稳、无超调、无震荡地收敛到零点平衡位置，同时兼顾控制能耗最低、控制量不超限，是最优控制领域最基础、工程落地最成熟、兼容性最强的核心算法，也是后续学习MPC模型预测控制的必备基础。

生活化类比：开车稳停到指定车位

拿日常开车入库做类比，瞬间就能懂LQR和PID的核心差距：把系统状态比作车辆与车位的偏差，控制量比作方向盘转角和刹车力度。普通PID控制像是新手开车，全凭经验和感觉修正，要么猛打方向冲过车位（超调过大），要么来回修正反复挪车（持续震荡）；而LQR控制像是老司机提前规划好最优行驶轨迹，全程修正力度适中，既能快速精准停入车位（状态快速收敛到零点），又不猛打方向、不急踩刹车（控制量平滑、执行器无损耗），完美平衡响应速度 与控制平稳性，全程做到"最优"。

1. 线性系统数学描述（先定义所有符号，避免看不懂公式）

LQR的应用前提是控制对象为线性时不变连续/离散系统 ，工程上绝大多数电机、机械臂、传感器稳定系统都满足这个条件。我们先从工程最常用的连续时间状态空间模型入手，先定义所有数学符号，再给公式，彻底杜绝看不懂公式、不知道符号含义的问题，这也是现代控制理论的通用基础语言：

x˙(t)=Ax(t)+Bu(t)\dot{\boldsymbol{x}}(t) = \boldsymbol{A}\boldsymbol{x}(t) + \boldsymbol{B}\boldsymbol{u}(t)x˙(t)=Ax(t)+Bu(t)

x(t)\boldsymbol{x}(t)x(t) ：系统状态向量，n维，代表系统的核心状态（比如电机转速、位置、角速度，机器人俯仰角、角速度等），控制目标是让 x(t)→0\boldsymbol{x}(t) \rightarrow 0x(t)→0 （平衡状态）
x˙(t)\dot{\boldsymbol{x}}(t)x˙(t) ：状态向量的一阶导数，代表状态变化率
A\boldsymbol{A}A ：n×n系统矩阵，描述系统自身的动态特性（固有属性，和控制无关）
B\boldsymbol{B}B ：n×p输入矩阵，描述控制量对系统状态的影响能力
u(t)\boldsymbol{u}(t)u(t) ：p维控制向量，也就是我们要输出的控制量（比如电机电压、执行器驱动力），工程上控制量不能无限大，必须限制幅值

通俗总结：这个状态方程清晰描述了系统动态逻辑------当前系统状态+施加的控制量，共同决定系统下一时刻的状态变化趋势；线性系统满足叠加原理，这也是LQR能够求解出唯一最优控制解的核心前提，非线性系统无法直接套用标准LQR。

2. 二次型性能指标（核心：什么是"最优"）

很多初学者觉得LQR难，本质是没理解"最优"的定义，误以为是复杂的数学概念。其实LQR里的"最优"特别实在，就是通过一个代价函数J给控制效果打分，分数越低，控制效果越好，我们的目标就是找到控制律让这个分数最小。而二次型代价函数，就是专门兼顾"状态收敛速度"和"控制能耗损耗"的评价方式，避免为了追求快响应而滥用控制量，导致执行器过载、系统震荡，完全贴合工程实际需求：

J=12∫0∞[xT(t)Qx(t)+uT(t)Ru(t)]dtJ = \frac{1}{2}\int_{0}^{\infty} \left[ \boldsymbol{x}^T(t)\boldsymbol{Q}\boldsymbol{x}(t) + \boldsymbol{u}^T(t)\boldsymbol{R}\boldsymbol{u}(t) \right] dtJ=21∫0∞[xT(t)Qx(t)+uT(t)Ru(t)]dt

这个公式就是LQR的核心评价准则，积分区间从0到无穷大，代表对整个控制过程的累计打分，每一个符号都对应工程实际，逐一拆解清楚：

JJJ ：性能代价函数，我们的目标是最小化J
Q\boldsymbol{Q}Q ：n×n状态权重矩阵，半正定对角矩阵，工程上直接设为对角阵，数值越大，代表越看重"状态快速收敛"，宁可牺牲一点控制能耗也要让状态尽快回到零点
R\boldsymbol{R}R ：p×p控制权重矩阵，正定对角矩阵，数值越大，代表越看重"控制能耗小、控制量平滑"，宁可慢一点收敛也要避免控制量超限、执行器磨损
第一项 xTQx\boldsymbol{x}^T\boldsymbol{Q}\boldsymbol{x}xTQx ：状态偏差惩罚，状态离零点越远，惩罚越大
第二项 uTRu\boldsymbol{u}^T\boldsymbol{R}\boldsymbol{u}uTRu ：控制量能耗惩罚，控制量越大，惩罚越大

工程关键提醒 ：Q和R是LQR唯一需要调试的参数，直接替代PID的三个超参，调试逻辑极度清晰，完全没有盲试空间，这也是LQR远超PID的核心工程优势！简单记口诀：Q调大=状态收敛快，R调大=控制量更柔和、能耗更低，针对不同工况侧重调整即可，新手也能快速上手。

二、分步公式推导（无跳步，每步讲物理意义）

LQR的核心目标，就是求解出最优状态反馈控制律 ，标准形式为 u(t)=−Kx(t)\boldsymbol{u}(t) = -\boldsymbol{K}\boldsymbol{x}(t)u(t)=−Kx(t) 。式中负号代表负反馈，和PID的负反馈逻辑完全一致：系统状态偏离零点越远，反馈的控制量修正力度越强，且修正方向与偏差方向相反； K\boldsymbol{K}K 就是我们要求解的最优反馈增益矩阵，一旦确定K，整个最优控制器就设计完成。

推导前提

推导前明确两个基础前提，工程场景下基本都能满足：一是系统完全可控（即控制量能够有效影响所有状态变量，常规电机、机械臂、工控系统均满足，可控性判别本篇不展开，聚焦核心求解）；二是权重矩阵Q半正定、R正定，保证代价函数有唯一最小值。

步骤1：引入黎卡提方程（核心方程，不用怕，讲透意义）

想要最小化二次型代价函数J，结合线性系统状态空间方程，通过变分法、哈密顿函数可推导出核心结论（跳过复杂数学证明，工科学习无需纠结纯理论推导，重点掌握结论和用法），最终得到连续时间代数黎卡提方程（CARE），这是求解最优增益K的唯一核心方程：

ATP+PA−PBR−1BTP+Q=0\boldsymbol{A}^T\boldsymbol{P} + \boldsymbol{P}\boldsymbol{A} - \boldsymbol{P}\boldsymbol{B}\boldsymbol{R}^{-1}\boldsymbol{B}^T\boldsymbol{P} + \boldsymbol{Q} = 0ATP+PA−PBR−1BTP+Q=0

P\boldsymbol{P}P ：n×n正定对称矩阵，是黎卡提方程的解，代表系统的最优代价现值
R−1\boldsymbol{R}^{-1}R−1 ：控制权重矩阵的逆矩阵

物理意义通俗解读：黎卡提方程本质是一个"平衡方程"，平衡了系统自身动态特性、状态偏差惩罚和控制能耗惩罚，求解出的矩阵P，代表系统从当前状态到收敛至零点的最优累计代价，找到P就找到了最优控制的平衡点，后续直接套公式即可求出最优增益。

步骤2：求解最优反馈增益矩阵K

黎卡提方程解出最优代价矩阵P后，最优反馈增益矩阵K无需复杂计算，直接通过固定公式一步求解，工程仿真和代码实现均可直接调用库函数完成，完全不用手动解方程：

K=R−1BTP\boldsymbol{K} = \boldsymbol{R}^{-1}\boldsymbol{B}^T\boldsymbol{P}K=R−1BTP

物理意义：K矩阵相当于状态变量到控制量的最优映射桥梁，每一行对应一路控制量，每一列对应一个状态变量，本质是给每个状态变量分配最优的修正权重，确保每一份控制量都用在"刀刃上"，实现最优收敛。

步骤3：最优控制律

将求解出的最优增益K代入，最终得到工程上直接落地使用的LQR最优控制律：

u(t)=−Kx(t)\boldsymbol{u}(t) = -\boldsymbol{K}\boldsymbol{x}(t)u(t)=−Kx(t)

把这个控制律代入原线性系统方程，闭环系统就变成：

x˙(t)=(A−BK)x(t)\dot{\boldsymbol{x}}(t) = (\boldsymbol{A} - \boldsymbol{B}\boldsymbol{K})\boldsymbol{x}(t)x˙(t)=(A−BK)x(t)

将最优控制律代入原开环系统状态方程，即可得到闭环最优控制系统方程。可以证明，该闭环系统一定是渐进稳定的，状态变量会平稳、无超调地收敛至零点，同时全程保证代价函数J最小，完美兼顾稳定性与最优性。

三、Python仿真实操（可直接复制运行，工程落地版）

理论落地最直观的方式就是仿真，本篇选用单自由度弹簧质量阻尼系统作为仿真对象，这是工控领域最经典的线性系统模型，完美对应电机转动、机械臂执行器、伺服平台等实际场景，代码全程标注详细注释，可直接复制运行，无需额外配置环境，新手也能快速跑通。

仿真场景

仿真对象：弹簧质量阻尼系统，定义两个核心状态变量，位移x1、速度x2，控制量u为施加的外力；控制目标：将偏离平衡位置的系统，通过LQR最优控制，快速平稳地将位移和速度收敛至0，直观验证LQR的控制效果。

完整Python代码

python 复制代码

import numpy as np
import matplotlib.pyplot as plt
from scipy.linalg import solve_continuous_are  # 直接调用库求解黎卡提方程，工程落地常用

# ---------------------- 1. 定义线性系统参数（弹簧质量阻尼系统） ----------------------
m = 1.0  # 质量
k = 1.0  # 弹簧刚度
c = 0.5  # 阻尼系数
# 系统矩阵A和输入矩阵B
A = np.array([[0, 1],
              [-k/m, -c/m]])  # 2x2矩阵，状态[位移，速度]
B = np.array([[0],
              [1/m]])  # 2x1矩阵，控制量外力

# ---------------------- 2. 设置LQR权重矩阵Q、R（核心调试参数） ----------------------
Q = np.diag([100, 1])  # 状态权重：位移权重100，速度权重1，优先保证位移快速收敛
R = np.array([[0.1]])   # 控制权重：数值小，允许适度控制量，加快响应

# ---------------------- 3. 求解黎卡提方程和最优增益K ----------------------
P = solve_continuous_are(A, B, Q, R)  # 求解连续代数黎卡提方程
K = np.linalg.inv(R) @ B.T @ P        # 计算最优反馈增益K
print("最优反馈增益矩阵K：", K)

# ---------------------- 4. 仿真闭环系统响应 ----------------------
# 初始状态：位移1，速度0（模拟系统偏离平衡位置）
x0 = np.array([1.0, 0.0])
t = np.linspace(0, 10, 1000)  # 仿真时间10s
x_history = np.zeros((len(t), 2))
x_history[0] = x0

# 闭环系统仿真
A_cl = A - B @ K
for i in range(1, len(t)):
    dx = A_cl @ x_history[i-1]
    x_history[i] = x_history[i-1] + dx * (t[1] - t[0])

# ---------------------- 5. 绘图展示结果 ----------------------
plt.figure(figsize=(10, 6))
plt.subplot(2,1,1)
plt.plot(t, x_history[:,0], label='位移x1')
plt.plot(t, x_history[:,1], label='速度x2')
plt.axhline(y=0, color='r', linestyle='--', label='平衡位置')
plt.title('LQR控制下系统状态收敛曲线')
plt.ylabel('状态值')
plt.legend()
plt.grid(True)

plt.subplot(2,1,2)
u = -K @ x_history.T  # 计算控制量
plt.plot(t, u[0], label='控制量u')
plt.ylabel('控制量')
plt.xlabel('时间(s)')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

仿真结果解读

代码运行后，会直接输出两张核心曲线：状态收敛曲线、控制量变化曲线。从结果中可以清晰看到，位移和速度从初始偏差位置出发，无超调、无震荡、快速平稳收敛至零点，没有传统PID的震荡回调问题；控制量全程平滑变化，无突变、不超限，完全贴合工程执行器的运行要求。后续修改Q和R的数值，能直观观察到收敛速度和控制量幅度的变化，调试逻辑一目了然，彻底摆脱参数盲试。

本篇总结

本篇核心知识点复盘：线性二次型调节器（LQR）是面向线性系统的最优状态反馈控制器，核心依托线性状态空间模型和二次型代价函数，平衡状态收敛与控制能耗两大核心指标。LQR的完整求解逻辑为：设定Q、R权重矩阵→求解代数黎卡提方程得到P矩阵→计算最优反馈增益K→生成最优负反馈控制律。相比传统PID，LQR调试参数更少、逻辑更严谨、无盲试成本，尤其适用于工控、机器人、自动驾驶等高精度状态稳定场景。本篇全程弱化纯数学推导，强化物理意义与工程实操，帮你搭建起LQR的完整知识框架，掌握从理论到仿真的全流程，同时为后续MPC模型预测控制打下坚实基础，吃透LQR，现代控制理论入门就不再有门槛。

思考题

工程实际中，电机控制系统普遍存在执行器饱和限制（比如控制电压上限12V，无法无限增大），如果将本篇仿真中的R矩阵数值调大10倍，系统状态收敛速度、控制量幅度会发生什么变化？结合Q、R权重矩阵的物理意义，分析这种参数调整在电机实际控制场景中的适用性。
动手修改Python仿真代码，将位移对应的Q矩阵权重从100改为10，对比原仿真结果，分析状态收敛曲线、超调量、调节时间的具体差异，总结Q矩阵的工程调试技巧；思考工业场景中，若要求系统绝对无超调、运行平稳，该如何合理搭配Q和R的数值。