在矩阵的定义引入后,马上引入初等行变换的定义,因为行最简形是通过初等行变换进行的。而行最简形唯一指的是,无论进行怎样的顺序的初等行变换,得到的行最简形总是同一个结果。
初等行变换,包含三种,每一种行变换都会得到新的矩阵。可以将矩阵的每行看作行向量,这样整个矩阵就是行向量组。下面证明:行变换前后的两组行向量组可以互相线性表示。
- 交换矩阵的两行
交换前后显然可以互相线性表示。
- 将第iii行乘以不为零的k (k≠0)k\ (k \neq 0)k (k=0)
任取一个行向量,无论它来自变换前还是变换后的行向量组,都可以用另一个行向量组线性表示。
- 将矩阵第jjj行的kkk倍加至第iii行
由于只是第iii行发生了变化,只需要考虑第iii行向量。对于变换后的行向量组,每一个行向量显然可以用变换前的行向量组线性表示;对于变换前的行向量组,由于初等行变换的可逆性,
变换前的第iii行向量===变换后的第iii行向量−-−第jjj行向量×k\times k×k
所以,行变换前后的两组行向量组可以互相线性表示 。经过一系列变换后,矩阵最后变成了行最简形。若通过不同的初等行变换,得到了两个不含全零向量的行向量组{α1、α2...αn}、{β1、β2...βm}\left\{ \alpha_{1}、\alpha_{2}\ldots\alpha_{n} \right\} 、\left\{ \beta_{1}、\beta_{2}\ldots\beta_{m} \right\}{α1、α2...αn}、{β1、β2...βm},则
- {α1、α2...αn}、{β1、β2...βm}\left\{ \alpha_{1}、\alpha_{2}\ldots\alpha_{n} \right\} 、\left\{ \beta_{1}、\beta_{2}\ldots\beta_{m} \right\}{α1、α2...αn}、{β1、β2...βm}可以互相线性表示
这是因为它们都可以与最初的矩阵行向量组互相线性表示
- α1、α2...αn\alpha_{1}、\alpha_{2}\ldots\alpha_{n}α1、α2...αn是线性无关的,β1、β2...βm\beta_{1}、\beta_{2}\ldots\beta_{m}β1、β2...βm是线性无关的
这是行最简形的特点决定的,主要是因为,非零行的首非零元为111、首非零元所在的列的其他元均为000。
- αn=βm\alpha_{n} = \beta_{m}αn=βm
考虑它们各自最后一个行向量αn、βm\alpha_{n}、\beta_{m}αn、βm,由于βm\beta_{m}βm可以用{α1、α2...αn}\left\{ \alpha_{1}、\alpha_{2}\ldots\alpha_{n} \right\}{α1、α2...αn}线性表示,即
βm=k1α1+k2α2+...+knαn\beta_{m} = k_{1}\alpha_{1} + k_{2}\alpha_{2} + \ldots + k_{n}\alpha_{n}βm=k1α1+k2α2+...+knαn
其中k1、k2...knk_{1}、k_{2}\ldots k_{n}k1、k2...kn不全为000。
若αn\alpha_{n}αn第一个非零元素所在列序号小于βm\beta_{m}βm,那么α1、α2...αn\alpha_{1}、\alpha_{2}\ldots\alpha_{n}α1、α2...αn第一个非零元素所在列序号小于βm\beta_{m}βm,从而k1α1+k2α2+...+knαnk_{1}\alpha_{1} + k_{2}\alpha_{2} + \ldots + k_{n}\alpha_{n}k1α1+k2α2+...+knαn的结果的第一个非零元素所在列序号小于βm\beta_{m}βm,等式不可能成立。所以αn\alpha_{n}αn第一个非零元素所在列序号大于等于βm\beta_{m}βm,同理βm\beta_{m}βm第一个非零元素所在列序号小于αn\alpha_{n}αn,从而αn\alpha_{n}αn第一个非零元素所在列序号等于βm\beta_{m}βm。
于是,α1...αn−1\alpha_{1}\ldots\alpha_{n - 1}α1...αn−1第一个非零元素所在列序号小于βm\beta_{m}βm,所以
k1=k2=...kn−1=0k_{1} = k_{2} = \ldots k_{n - 1} = 0k1=k2=...kn−1=0
βm=knαn\beta_{m} = k_{n}\alpha_{n}βm=knαn
由于第一个非零元素一定是111,所以
βm=αn\beta_{m} = \alpha_{n}βm=αn
- αn−i=βm−i\alpha_{n - i} = \beta_{m - i}αn−i=βm−i,其中0≤i<min{n,m}0 \leq i < \min\left\{ n,m \right\}0≤i<min{n,m}
由于βm−i\beta_{m - i}βm−i可以用{α1、α2...αn}\left\{ \alpha_{1}、\alpha_{2}\ldots\alpha_{n} \right\}{α1、α2...αn}线性表示,所以
βm−i=k1α1+k2α2+...+knαn\beta_{m - i} = k_{1}\alpha_{1} + k_{2}\alpha_{2} + \ldots + k_{n}\alpha_{n}βm−i=k1α1+k2α2+...+knαn
由于αn−j=βm−j\alpha_{n - j} = \beta_{m - j}αn−j=βm−j,其中j<ij < ij<i。根据最简形的定义,βm−i\beta_{m - i}βm−i在β1、β2...βm、αn、αn−1...αn−(i−1)\beta_{1}、\beta_{2}\ldots\beta_{m}、\alpha_{n}、\alpha_{n - 1}\ldots\alpha_{n - (i - 1)}β1、β2...βm、αn、αn−1...αn−(i−1)的首个非零元素所在列位置元素为000,所以
kn−j=0k_{n - j} = 0kn−j=0 其中j<ij < ij<i
βm−i=k1α1+k2α2+...+kn−iαn−i\beta_{m - i} = k_{1}\alpha_{1} + k_{2}\alpha_{2} + \ldots + k_{n - i}\alpha_{n - i}βm−i=k1α1+k2α2+...+kn−iαn−i
与(3)同样的分析过程,可以得到αn−i\alpha_{n - i}αn−i第一个非零元素所在列序号等于βm−i\beta_{m - i}βm−i,从而
βm−i=αn−i\beta_{m - i} = \alpha_{n - i}βm−i=αn−i
- n=mn = mn=m
若n>mn > mn>m,则α1\alpha_{1}α1无法用{β1、β2...βm}\left\{ \beta_{1}、\beta_{2}\ldots\beta_{m} \right\}{β1、β2...βm}线性表示,所以n≤mn \leq mn≤m,同理可得n≥mn \geq mn≥m,于是n=mn = mn=m
综合(3)(4)(5),可知若通过不同的初等行变换,得到的两个行向量组{α1、α2...αn}、{β1、β2...βm}\left\{ \alpha_{1}、\alpha_{2}\ldots\alpha_{n} \right\} 、\left\{ \beta_{1}、\beta_{2}\ldots\beta_{m} \right\}{α1、α2...αn}、{β1、β2...βm}是完全一样的,也就是行最简形唯一。
【备忘】
-
初等行变换得到行最简形的过程即线性方程组的求解过程,行最简形唯一直接奠定了线性方程组的解存在一个特定的结构这一重要性质。
-
证明过程不能使用矩阵的行秩、列秩、秩、极大线性无关组维度等定义,否则会引起循环论证。