什么是半正定 (PSD) 矩阵

sonadorje2026-01-24 17:19

我来完整、通俗地讲解PSD是什么，为什么重要。

1. 通俗定义：PSD矩阵像一个"非负能量泵"

想象一个矩阵A像一个"机器"，你输入一个向量x（任何非零向量），它输出一个"能量值"⟨Ax, x⟩（这是的简写，x的转置乘A乘x）。
如果这个能量值总是 ≥ 0 （对于所有实向量x，包括零向量），那么A就是Positive Semi-Definite (PSD)。
- "Positive"：能量非负。
- "Semi-Definite"：可以等于0（不像严格Positive Definite，PD，要求 > 0 for x ≠ 0）。
比喻：像一个弹簧系统，不会"吸走"能量，只会保持或零（可能有"松弛"方向）。
关键：A必须是对称矩阵 （），因为内积形式要求对称（在实数域）。

图片里的公式正好是这个定义：∀x ∈ ℝⁿ ⟨Ax, x⟩ ≥ 0。其中⟨ , ⟩是内积，等于。

是数学符号，表示"对于所有（for all）属于（in）n维实数空间（）的向量x"。

通俗拆解

∀：读作"for all"或"任意"，表示"所有"或"每一个"。它像一个倒写的A（All的首字母）。
x：一个变量，通常代表向量或点。这里是任意的。
∈：读作"in"或"belongs to"，表示"属于"或"元素属于集合"。像一个变形的E（Element的首字母）。
：是实数集（Real numbers，所有实数如1、π、-2.5），n 表示n维空间。比如：
- n=1：就是实数轴（所有实数）。
- n=2：是平面（坐标(x,y)）。
- n=3：是3D空间（x,y,z）。
- 一般n：高维向量空间（机器学习常见）。

整体：这个短语常用于定义或定理开头，意思是"这个陈述对n维实数空间里的每一个x都成立"。

2. 数学拆解：如何判断一个矩阵是PSD？（步步推理）

核心条件 ：对于n×n对称矩阵A，满足 ≥ 0 ∀x ∈ ℝⁿ。
- 如果严格 > 0 for x ≠ 0，则是Positive Definite (PD)。
等价判定方法 （这些是数学上证明等价的，用于实际检查）：
1. 特征值法 （最常见）：A的所有特征值（对于PD，>0）。因为A可对角化（对称），（是特征向量）。
2. Cholesky分解 ：A可以分解为，其中L是下三角矩阵（对于PD，L唯一且对角正）。
3. 主子式法（Sylvester准则）：所有主子矩阵的行列式 ≥ 0（对于PD，>0）。
4. 二次型 ：A定义的二次型是半正定的。
推理步骤 （为什么这些等价？简单证明思路）：
- 从定义：假设A有负特征值λ < 0，对应特征向量v，则，违反定义。所以所有λ ≥ 0。
- 反之，如果所有λ ≥ 0，用谱分解 A = Q Λ Q^T（Q正交），则（），。
- 对于Gram矩阵：回想Gram ，所有特征值 ≥ 0，因为（范数平方非负）。

用表格比较：

矩阵类型	条件 ()	特征值	示例	是PSD?
PSD	≥0 ∀x	≥0	[[1,0],[0,0]] (零方向)	是
PD	>0 for x≠0	>0	[[1,0],[0,1]] (单位)	是（严格）
非PSD	存在<0	有<0	[[0,1],[1,0]] (旋转)	否

1）先看一句话定义（最核心）

对一个 实对称矩阵 A：

PSD（半正定）：
PD（正定）：

区别只在一个符号：

PSD：允许"等于 0"
PD：除了 x=0，永远严格大于 0

2）到底是什么？（通俗理解）

它叫做 二次型。你可以把它理解成：

向量 x 经过矩阵 A 这个"变形规则"后，算出来的一种"能量 / 长度平方 / 代价"

所以：

PSD 的意思就是：这个"能量值"永远不会变成负数
"半"字表示：它可能为 0（不是永远严格为正）

3）用特征值一句话判断（最常用）

对于 实对称矩阵 A，它有实特征值：

A 是 PSD ⟺ 所有特征值

λi≥0
A 是 PD ⟺ 所有特征值

λi>0

💡所以 PSD = "没有负特征值"。

4）几何直觉：像一个"碗"，但可能是"扁碗"

把函数

想成一个曲面：

PD：像一个"圆润的碗"，中心最低点只有一个（严格往上）
PSD ：像一个"碗，但某些方向是平的"

也就是你沿某些方向走，值可能一直是 0，不会上升也不下降

这就是为什么 PSD 允许。

5）一个最直观的例子（2×2）

✅ PSD 但不是 PD

对任意：

永远不负 ✅（所以 PSD）
但如果你取，那么

不是严格大于 0 ❌（所以不是 PD）

6）PSD 的"分解式理解"更像人话

一个矩阵是 PSD，等价于它可以写成：

或

这非常有直觉：

这种结构"天生不会产生负能量"

因为

✅ 所以 PSD 就是"某种平方形式"。

7）为什么 Gram 矩阵一定是 PSD？

Gram 矩阵（内积矩阵）：

对任意 x：

所以 Gram 矩阵天然 PSD。

这也是机器学习里到处出现 PSD 的原因（核方法、协方差矩阵、最小二乘等）。

8）PSD 常见在哪些地方？

非常常见：

协方差矩阵 Σ 一定 PSD

（方差不可能为负）
**最小二乘**是 PSD（很多优化问题依赖它）
核矩阵 Kernel Matrix 必须 PSD

（否则不是真正的"内积"）

9）一句话总结（最精确+最通俗）

PSD（半正定）就是：对任何向量 x，二次型永远不为负；它允许某些方向的"能量"为 0，所以叫"半"。

下面拿图里的公式

用一个具体数字矩阵 + 代入一个 x 的方式，带你"算出一次能量值"，让 PSD 的感觉更直观。

让你真正感受到：

为什么永远不负

以及"半"到底半在哪里。

1）先把展开一次（最关键的算式）

令

(对称矩阵)

那么：

先算 Ax：

再左乘：

整理：

✅ 所以它本质就是一个二次函数（平方+交叉项）。

2）例子 1：最简单的 PSD（你一眼就能看懂）

那么：

随便挑几个向量试试：

✅ 永远不会负数 → PSD

但注意第二个方向：

说明在"纯 x2 方向"上，它完全 不抬升。

这就是"半"的直观含义：

有些方向能量=0（平坦），但不会掉到负数。

3）例子 2：PD（严格正定）是什么样？

你只要 x≠0，就必然：

✅ 所以它是 PD（严格正）

4）例子 3：带交叉项的 PSD（更像真实情况）

我们来个常见形式：

展开：

注意这非常漂亮：

✅ 永远不负，所以 PSD。

但它也会"半"：

如果取

也就是说：

沿着方向 (1,−1)（一正一负抵消），能量就是 0

这条方向是"平的槽"。

5）例子 4：不是 PSD（出现负数了）

展开：

取：

❌ 出现负数 → 不是 PSD

直觉：

有些方向往下掉（像马鞍形），所以不半正定。

6）PSD 的"平方分解"直觉（超级重要）

你只要记住一句：

PSD = 某种平方

例如：

于是：

你看，"平方"一出现，永远不可能是负的。

7）"半"的本质：为什么会出现 0？

如果 A 是 PSD，但不是 PD，那必然存在非零向量 x≠0，使得：

这说明：

A 有"压扁掉"的方向

也就是某些方向被压到 0 长度（信息丢失）

用特征值语言就是：

PSD：特征值 λ≥0
"半"：至少有一个特征值 λ=0

8）一眼判断：2×2 PSD 的"快速条件"

对称矩阵：

它是 PSD 的充要条件之一（很常用）：

a≥0
c≥0
行列式

为什么？

因为它保证二次型不会被交叉项拖成负数。

9）机器学习里 PSD 为什么特别常见？

因为很多东西都是这种形态：

✅ Gram 矩阵

一定 PSD。

✅ 协方差矩阵

一定 PSD。

✅ 最小二乘的 Hessian

PSD（所以优化是"凸"的，不会乱凹下去）。

10）一句话收尾（你应该抓住的"感觉"）

✅ **PSD（半正定）**就是：

它把任意方向的向量 x，算出来的"能量" 永远 ≥ 0

但允许某些特殊方向能量 = 0（平坦、被压扁），所以叫"半"。

上一篇：ASP.NET Core SignalR 从入门到精通：打造实时 Web 应用的利器

下一篇：【Ubuntu】文件与目录管理命令

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06OpenClaw + 飞书（Feishu）环境搭建指南 07AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 08Window 10部署openclaw报错node.exe : npm error code 128 09AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 10本地部署 OpenClaw + DeepSeek-R1 完全指南