FPGA神经网络数学基础2

正交性

a）大地图

1）全章主线：以正交性为核心线索，从向量正交升级到子空间正交，赋予上章抽象的向量空间可计算的几何结构。以此为基础推导正交投影、最小二乘法，解决无解超定方程组的最优近似问题。再通过标准正交基、正交矩阵大幅简化计算、提升数值稳定性。最后给出正交化构造方法（格拉姆-施密特）与矩阵分解（QR分解），实现理论工具闭环，衔接后续的特征值、SVD等核心内容。

2）节链思路

3）本章重点

正交空间与子空间

a）本节背景：前两章解决了线性结构问题（向量空间、基、四个基本子空间、逆矩阵）。但存在三个核心问题：

1）普通线性无关基对应斜坐标系，坐标求解、矩阵运算复杂度高；

2）无法处理工程中普遍存在的超定无解方程组；

3）未知四个基本子空间的几何位置关系。

b）正交基

1）正交基定义：若一组基中任意两个向量都相互垂直，则称这组基为正交基。

2）标准正交基（最优基）定义：正交+单位长度。

3）n维向量长度与矩阵表示

c）正交向量

1）勾股定理向向量模长推广

2）内积（点积）定义

3）内积符号与向量夹角的关系

4）向量长度与零向量特性

5）正交非零向量组的线性无关性

6）标准正交积

d）正交子空间

1）本小节背景：本节是正交向量向子空间的推广，解决两个子空间整体垂直的判定与性质问题。通过引入R3中直线、平面的直观几何，纠正了垂直平面即正交子空间的直觉错误，最终建立正交性的基本定理。

2）正交子空间的定义

3）正交性基本定理

4）正交补的定义和性质

5）维数互补公式

6）线性方程组可解性的正交条件

7）总结

e）矩阵和子空间

1）本小节背景：本节是正交子空间与线性代数基本定理的深化，理清了正交子空间与正交补的本质区别，揭示了矩阵乘法的真正数学作用，并引出不可逆矩阵的替代-伪逆矩阵。本内容是投影理论、最小二乘、寄异值分解的前置知识，同时也是FPGA设计网络中权重稀疏化、前向传播加速、反向传播伪逆计算的核心数学依据。

2）正交子空间和正交补的本质区别

3）空间的正交分解定理

4）矩阵乘法的本质

5）行空间到列空间的可逆性

6）转置与伪逆矩阵

7）总结

f）习题补充

1）

2）

3）

4）

5）

6）

7）

8）

9）

10）

夹角余弦和直线上的投影

a）本节背景：本节是欧式内积空间从正交性判定到正交投影应用的关键节点。之前我们讨论了用内积刻画向量夹角、判定正交性，也讨论了正交矩阵的旋转变换性质。本节是利用正交约束解决欧式空间最优逼近问题，即给定向量b与子空间S，求解S中离b距离最近的点（正交投影点）。这直接推导出最小二乘法，是测绘数据拟合、神经网络特征处理的底层数学基础。

b）内积与夹角余弦

1）本小节背景：内积是线性代数中连接代数运算与几何直观的核心桥梁。在低维空间中，我们可以通过几何观察直接得到向量的夹角，但在高维空间中，不存在直观的几何夹角，必须通过代数定义的内积来量化两个向量的方向相似性。本节从二维的几何直观出发，推导出n维空间通用的夹角余弦公式，为后续正交投影、最小二乘、特征分解等核心内容打基础。

2）二维情形的三角函数推导

3）余弦定理代数推导

c）直线上的投影

1）本小节背景：本节是内积的第一个核心应用，解决线性代数中最基础的最优近似问题。用给定直线上的向量p去逼近任意向量b，如何让误差最小？这个问题是最小二乘法、正交分解、降维算法的基础。在高维空间中，无法直观判断最近点，但正交投影给出了唯一且通用的代数解法。

2）投影的几何约束与公式推导

3）施瓦茨不等式本质证明

4）总结

d）秩为1的投影矩阵

1）本小节背景：上面我们得到了向量在直线上投影的向量表达式，但线性代数的核心是线性变换的矩阵表示。将投影到某条直线这个线性操作封装为一个矩阵P，使得对任意向量b的投影都能统一写成p=Pb。这是单个向量运算到批量线性变换的飞跃。将几何直观转换为代数运算，为后续子空间投影、最小二乘法、PCA降维提供了矩阵框架。

2）从向量投影到矩阵投影

3）投影矩阵的两个核心性质（充要条件）

4）投影矩阵的子空间结构

5）缩放不变性与单位向量简化

6）总结

e）内积的转置

1）本小节背景：之前我们对转置的理解停留在元素层面的操作定义，但这并没有揭示其本质。本小节通过内积给出转置的抽象代数定义，将转置与线性变换的伴随算子联系起来。这一定义是转置更本质的刻画。是后续正交矩阵、最小二乘法、神经网络反向传播等核心内容的数学基础。

2）转置的表层定义

3）转置的本质定义（内积伴随）

4）转置和逆

f）补充

1）

投影与最小二乘法

a）本节背景：传统高斯消元求解Ax=b的前提是b落在矩阵A的列空间C(A)内，仅当方程数量≤未知数、观测无噪声时大概率能满足该条件。但实际场景中存在大量超定方程组（观测方程数m远大于待求参数数n），测量噪声会让b偏离C(A)，系统不相容无精确解。最小二乘法跳出求精确解的框架，寻找使整体偏差最小的近似解，是数据拟合、机器学习参数求解的基础方法。

b）

c）多变量的最小二乘问题

1）本小节背景：单变量最小二乘是将向量投影到1维直线，而工程中绝大多数问题是多参数拟合。

2）核心本质：正交投影

3）正规方程组推导

4）

5）投影矩阵与投影运算

6）四个核心结论

d）向量积矩阵和投影矩阵

1）本小节背景

2）向量积矩阵

①

②

③

3）投影矩阵

①定义与几何意义

②两个基本性质（投影矩阵的身份证）

③可逆方阵投影

e）数据的最小二乘拟合

1）本小节背景：工业场景经常出现单自变量线性观测任务，自变量t可精准测量且无明显噪声，因变量b受测量干扰，会采集m组(ti,bi)数据，形成超定方程组，传统高斯消元无精确解。最小二乘直线拟合通过最小化因变量方向的残差平方和，得到最优直线b=C+Dt，是一元线性回归的基础形式，也可扩展适配可线性化的非线性模型。

2）线性建模与超定方程组构建

3）优化准则、矩阵求解、几何本质

4）通用正规方程与模型拓展

5）方法适用边界

6）总结

f）加权最小二乘法

1）本小节背景：普通最小二乘法默认所有观测测量精度一致，对残差赋予均等权重。实际工程中不同观测可信度存在差异，高精度传感器数据应该占有更高话语权、噪声波动大的观测需降低权重。观测还可能存在互相关性，此时普通最小二乘结果会出现偏差、方差偏大的问题。加权最小二乘通过权重矩阵量化观测可靠性，改造误差度量与投影规则，得到统计更优的拟合结果，是广义最小二乘的理论基础。

2）普通最小二乘基准