一、二次型基础
(一)定义剖析
二次型是包含 N N N个变量 X 1 , X 2 , ⋯ , X N X_1, X_2, \cdots, X_N X1,X2,⋯,XN的不含常数项的二次齐次多项式。所谓二次齐次,即每一项中未知数的次数总和恒为 2 2 2。
例如,当 N = 3 N \ = 3 N =3时, f ( x 1 , x 2 , x 3 ) = 2 x 1 2 + 3 x 1 x 2 − 4 x 2 x 3 + 5 x 3 2 f(x_1, x_2, x_3)\ =2x_1^2 + 3x_1x_2 - 4x_2x_3+5x_3^2 f(x1,x2,x3) =2x12+3x1x2−4x2x3+5x32是二次型。其中 2 x 1 2 2x_1^2 2x12中 x 1 x_1 x1次数为 2 2 2; 3 x 1 x 2 3x_1x_2 3x1x2里 x 1 x_1 x1与 x 2 x_2 x2次数和为 2 2 2; − 4 x 2 x 3 -4x_2x_3 −4x2x3中 x 2 x_2 x2与 x 3 x_3 x3次数和是 2 2 2; 5 x 3 2 5x_3^2 5x32中 x 3 x_3 x3次数为 2 2 2。
(二)与矩阵的紧密联系
任意二次型均可写成 X T A X X^TAX XTAX的形式。其中 X = ( x 1 x 2 ⋮ x N ) X\ =\begin{pmatrix}x_1\\x_2\\\vdots\\x_N\end{pmatrix} X = x1x2⋮xN 是变量构成的列向量, A A A是对称矩阵且具有唯一性。
以 f ( x 1 , x 2 ) = 4 x 1 2 + 6 x 1 x 2 + 8 x 2 2 f(x_1, x_2)\ =4x_1^2 + 6x_1x_2 + 8x_2^2 f(x1,x2) =4x12+6x1x2+8x22为例,可写成 ( x 1 x 2 ) ( 4 3 3 8 ) ( x 1 x 2 ) \begin{pmatrix}x_1&x_2\end{pmatrix}\begin{pmatrix}4&3\\3&8\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix} (x1x2)(4338)(x1x2)。这里的对称矩阵 ( 4 3 3 8 ) \begin{pmatrix}4&3\\3&8\end{pmatrix} (4338)便是该二次型对应的矩阵。
(三)二次型矩阵的生成方法
以含有四个变量 x 1 , x 2 , x 3 , x 4 x_1, x_2, x_3, x_4 x1,x2,x3,x4的二次型 f ( x 1 , x 2 , x 3 , x 4 ) = 3 x 1 2 + 5 x 1 x 2 + 7 x 1 x 3 + 9 x 1 x 4 + 11 x 2 x 1 + 13 x 2 2 + 15 x 2 x 3 + 17 x 2 x 4 + 19 x 3 x 1 + 21 x 3 x 2 + 23 x 3 2 + 25 x 3 x 4 + 27 x 4 x 1 + 29 x 4 x 2 + 31 x 4 x 3 + 33 x 4 2 f(x_1, x_2, x_3, x_4)\ =3x_1^2 + 5x_1x_2+7x_1x_3 + 9x_1x_4+11x_2x_1+13x_2^2+15x_2x_3 + 17x_2x_4+19x_3x_1+21x_3x_2+23x_3^2+25x_3x_4+27x_4x_1+29x_4x_2+31x_4x_3+33x_4^2 f(x1,x2,x3,x4) =3x12+5x1x2+7x1x3+9x1x4+11x2x1+13x22+15x2x3+17x2x4+19x3x1+21x3x2+23x32+25x3x4+27x4x1+29x4x2+31x4x3+33x42为例。
构建一个 4 × 4 4\times4 4×4的表格:
x 1 x_1 x1 | x 2 x_2 x2 | x 3 x_3 x3 | x 4 x_4 x4 | |
---|---|---|---|---|
x 1 x_1 x1 | ||||
x 2 x_2 x2 | ||||
x 3 x_3 x3 | ||||
x 4 x_4 x4 |
对于 x 1 2 x_1^2 x12的系数 3 3 3,填入第一行第一列;对于 x 1 x 2 x_1x_2 x1x2的系数 5 5 5,将其一半 5 2 \frac{5}{2} 25分别填入第一行第二列和第二行第一列;对于 x 1 x 3 x_1x_3 x1x3的系数 7 7 7,把 7 2 \frac{7}{2} 27分别填入第一行第三列和第三行第一列;以此类推。
最终得到二次型矩阵 A = ( 3 5 2 7 2 9 2 5 2 13 15 2 17 2 7 2 15 2 23 25 2 9 2 17 2 25 2 33 ) A \ = \begin{pmatrix}3&\frac{5}{2}&\frac{7}{2}&\frac{9}{2}\\\frac{5}{2}&13&\frac{15}{2}&\frac{17}{2}\\\frac{7}{2}&\frac{15}{2}&23&\frac{25}{2}\\\frac{9}{2}&\frac{17}{2}&\frac{25}{2}&33\end{pmatrix} A = 3252729251321521727215232252921722533 。
二、线性变换与二次型标准型
(一)线性变换的基本认知
线性变换是对向量实施的一种变换操作。若有向量 X = ( x 1 x 2 ) X\ =\begin{pmatrix}x_1\\x_2\end{pmatrix} X =(x1x2),矩阵 C = ( 2 3 4 5 ) C\ =\begin{pmatrix}2&3\\4&5\end{pmatrix} C =(2435),则 Y = C X = ( 2 3 4 5 ) ( x 1 x 2 ) = ( 2 x 1 + 3 x 2 4 x 1 + 5 x 2 ) Y \ = CX\ =\begin{pmatrix}2&3\\4&5\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}2x_1 + 3x_2\\4x_1+5x_2\end{pmatrix} Y =CX =(2435)(x1x2) =(2x1+3x24x1+5x2),实现了向量 X X X到向量 Y Y Y的变换。
(二)可逆线性变换的特性
可逆线性变换存在逆操作,能将变换后的向量还原。如 Y = C X Y \ = CX Y =CX,若存在矩阵 C − 1 C^{-1} C−1使 X = C − 1 Y X \ = C^{-1}Y X =C−1Y,则该线性变换可逆。可逆线性变换不会丢失信息,而不可逆变换因可能导致信息缺失,在二次型研究中通常不被考虑。
(三)借助线性变换实现二次型到标准型的转化
设有二次型 f ( X ) = X T A X f(X)\ =X^TAX f(X) =XTAX,期望通过线性变换化为标准型(仅含平方项,无交叉项,如 f ( y 1 , y 2 ) = k 1 y 1 2 + k 2 y 2 2 f(y_1, y_2)\ =k_1y_1^2 + k_2y_2^2 f(y1,y2) =k1y12+k2y22) 。
采用可逆线性变换 X = C Y X \ = CY X =CY( C C C为可逆矩阵) ,将其代入 f ( X ) f(X) f(X)得 f ( Y ) = Y T ( C T A C ) Y f(Y)\ =Y^T(C^TAC)Y f(Y) =YT(CTAC)Y。若能找出合适的 C C C使 C T A C C^TAC CTAC为对角矩阵, f ( Y ) f(Y) f(Y)即为标准型。
例如,二次型 f ( x 1 , x 2 ) = 2 x 1 2 + 4 x 1 x 2 + 3 x 2 2 f(x_1, x_2)\ =2x_1^2 + 4x_1x_2+3x_2^2 f(x1,x2) =2x12+4x1x2+3x22,其矩阵 A = ( 2 2 2 3 ) A\ =\begin{pmatrix}2&2\\2&3\end{pmatrix} A =(2223)。选取可逆矩阵 C = ( 1 − 1 0 1 ) C\ =\begin{pmatrix}1& - 1\\0&1\end{pmatrix} C =(10−11)。
先计算 C T = ( 1 0 − 1 1 ) C^T\ =\begin{pmatrix}1&0\\ - 1&1\end{pmatrix} CT =(1−101),再算 C T A C = ( 1 0 − 1 1 ) ( 2 2 2 3 ) ( 1 − 1 0 1 ) = ( 2 0 0 1 ) C^TAC\ =\begin{pmatrix}1&0\\ - 1&1\end{pmatrix}\begin{pmatrix}2&2\\2&3\end{pmatrix}\begin{pmatrix}1& - 1\\0&1\end{pmatrix}\ =\begin{pmatrix}2&0\\0&1\end{pmatrix} CTAC =(1−101)(2223)(10−11) =(2001)。
设 X = ( x 1 x 2 ) X\ =\begin{pmatrix}x_1\\x_2\end{pmatrix} X =(x1x2), Y = ( y 1 y 2 ) Y\ =\begin{pmatrix}y_1\\y_2\end{pmatrix} Y =(y1y2),由 X = C Y X \ = CY X =CY即 ( x 1 x 2 ) = ( 1 − 1 0 1 ) ( y 1 y 2 ) = ( y 1 − y 2 y 2 ) \begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}1& - 1\\0&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}\ =\begin{pmatrix}y_1 - y_2\\y_2\end{pmatrix} (x1x2) =(10−11)(y1y2) =(y1−y2y2)。
则 f ( Y ) = Y T ( C T A C ) Y = ( y 1 y 2 ) ( 2 0 0 1 ) ( y 1 y 2 ) = 2 y 1 2 + y 2 2 f(Y)\ =Y^T(C^TAC)Y\ =\begin{pmatrix}y_1&y_2\end{pmatrix}\begin{pmatrix}2&0\\0&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}\ =2y_1^2 + y_2^2 f(Y) =YT(CTAC)Y =(y1y2)(2001)(y1y2) =2y12+y22,成功化为标准型。
三、合同对角化与正交变换化标准型
(一)合同的定义阐释
设 A A A和 B B B为两个 n n n阶矩阵,若存在可逆矩阵 C C C使 B = C T A C B \ = C^TAC B =CTAC,则称 A A A与 B B B合同。即便矩阵非实对称,满足此条件也属合同。
(二)合同对角化实例
对于对称矩阵 A = ( 1 2 2 1 ) A\ =\begin{pmatrix}1&2\\2&1\end{pmatrix} A =(1221),可进行正交相似对角化。
先求其特征值,特征多项式为 ∣ λ E − A ∣ = ∣ λ − 1 − 2 − 2 λ − 1 ∣ = ( λ − 1 ) 2 − 4 = λ 2 − 2 λ − 3 = ( λ − 3 ) ( λ + 1 ) \vert\lambda E - A\vert\ =\begin{vmatrix}\lambda - 1& - 2\\ - 2&\lambda - 1\end{vmatrix}\ =(\lambda - 1)^2 - 4\ =\lambda^2 - 2\lambda - 3 \ = (\lambda - 3)(\lambda + 1) ∣λE−A∣ = λ−1−2−2λ−1 =(λ−1)2−4 =λ2−2λ−3 =(λ−3)(λ+1)。
令 ∣ λ E − A ∣ = 0 \vert\lambda E - A\vert \ = 0 ∣λE−A∣ =0,解得特征值 λ 1 = 3 \lambda_1 \ = 3 λ1 =3, λ 2 = − 1 \lambda_2 \ = - 1 λ2 =−1。
对于 λ 1 = 3 \lambda_1 \ = 3 λ1 =3,解齐次线性方程组 ( 3 E − A ) X = 0 (3E - A)X \ = 0 (3E−A)X =0,即 ( 2 − 2 − 2 2 ) ( x 1 x 2 ) = ( 0 0 ) \begin{pmatrix}2& - 2\\ - 2&2\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}0\\0\end{pmatrix} (2−2−22)(x1x2) =(00),得特征向量 ξ 1 = ( 1 1 ) \xi_1\ =\begin{pmatrix}1\\1\end{pmatrix} ξ1 =(11),单位化后 γ 1 = 1 2 ( 1 1 ) \gamma_1\ =\frac{1}{\sqrt{2}}\begin{pmatrix}1\\1\end{pmatrix} γ1 =2 1(11)。
对于 λ 2 = − 1 \lambda_2 \ = - 1 λ2 =−1,解齐次线性方程组 ( − E − A ) X = 0 ( - E - A)X \ = 0 (−E−A)X =0,即 ( − 2 − 2 − 2 − 2 ) ( x 1 x 2 ) = ( 0 0 ) \begin{pmatrix}-2& - 2\\ - 2&-2\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}0\\0\end{pmatrix} (−2−2−2−2)(x1x2) =(00),得特征向量 ξ 2 = ( 1 − 1 ) \xi_2\ =\begin{pmatrix}1\\ - 1\end{pmatrix} ξ2 =(1−1),单位化后 γ 2 = 1 2 ( 1 − 1 ) \gamma_2\ =\frac{1}{\sqrt{2}}\begin{pmatrix}1\\ - 1\end{pmatrix} γ2 =2 1(1−1)。
令正交矩阵 Q = ( γ 1 , γ 2 ) = ( 1 2 1 2 1 2 − 1 2 ) Q \ = (\gamma_1,\gamma_2)\ =\begin{pmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\end{pmatrix} Q =(γ1,γ2) =(2 12 12 1−2 1),则 Q T A Q = ( 3 0 0 − 1 ) Q^TAQ\ =\begin{pmatrix}3&0\\0& - 1\end{pmatrix} QTAQ =(300−1),实现了合同对角化,这里 Q Q Q是可逆矩阵 C C C的特殊形式。
(三)正交变换化标准型解析
正交变换是借助正交矩阵 Q Q Q进行的线性变换,即 X = Q Y X \ = QY X =QY。将其用于二次型 f ( X ) = X T A X f(X)\ =X^TAX f(X) =XTAX,可得 f ( Y ) = Y T ( Q T A Q ) Y = Y T Λ Y f(Y)\ =Y^T(Q^TAQ)Y \ = Y^T\Lambda Y f(Y) =YT(QTAQ)Y =YTΛY, Λ \Lambda Λ为对角矩阵,对角元素是矩阵 A A A的特征值。
此外,配方法也是可逆线性变换的一种。比如二次型 f ( x 1 , x 2 ) = x 1 2 + 6 x 1 x 2 + 10 x 2 2 f(x_1, x_2)\ =x_1^2 + 6x_1x_2+10x_2^2 f(x1,x2) =x12+6x1x2+10x22,配方如下:
f ( x 1 , x 2 ) = x 1 2 + 6 x 1 x 2 + 10 x 2 2 = ( x 1 2 + 6 x 1 x 2 + 9 x 2 2 ) + x 2 2 = ( x 1 + 3 x 2 ) 2 + x 2 2 \begin{align*} f(x_1, x_2)&\ =x_1^2 + 6x_1x_2+10x_2^2\\ &\ =(x_1^2 + 6x_1x_2 + 9x_2^2)+x_2^2\\ &\ =(x_1 + 3x_2)^2+x_2^2 \end{align*} f(x1,x2) =x12+6x1x2+10x22 =(x12+6x1x2+9x22)+x22 =(x1+3x2)2+x22
设 y 1 = x 1 + 3 x 2 y_1\ =x_1 + 3x_2 y1 =x1+3x2, y 2 = x 2 y_2\ =x_2 y2 =x2,即 x 1 = y 1 − 3 y 2 x_1\ =y_1 - 3y_2 x1 =y1−3y2, x 2 = y 2 x_2\ =y_2 x2 =y2,这是可逆线性变换,将原二次型化为标准型 f ( y 1 , y 2 ) = y 1 2 + y 2 2 f(y_1, y_2)\ =y_1^2 + y_2^2 f(y1,y2) =y12+y22。
四、二次型的其他核心概念
(一)规范形系数为一的个数解读
二次型的规范型是标准型的特殊形式,系数仅为 1 1 1、 − 1 -1 −1或 0 0 0。规范形中系数为 1 1 1的个数是关键特征。
例如规范型 f ( y 1 , y 2 , y 3 ) = y 1 2 − y 2 2 + 0 y 3 2 f(y_1, y_2, y_3)\ =y_1^2 - y_2^2+0y_3^2 f(y1,y2,y3) =y12−y22+0y32,系数为 1 1 1的个数是 1 1 1。
(二)二次型矩阵的秩与正负惯性指数的关系解读
二次型矩阵 A A A的秩 r ( A ) r(A) r(A)等于其规范形中系数不为 0 0 0的项数。正惯性指数是规范形中系数为 1 1 1的项数,负惯性指数是规范形中系数为 − 1 -1 −1的项数,满足 r ( A ) = r(A)\ = r(A) =正惯性指数 + + +负惯性指数。
如规范型 f ( y 1 , y 2 , y 3 ) = y 1 2 − y 2 2 + 0 y 3 2 f(y_1, y_2, y_3)\ =y_1^2 - y_2^2+0y_3^2 f(y1,y2,y3) =y12−y22+0y32,正惯性指数为 1 1 1,负惯性指数为 1 1 1,矩阵的秩 r ( A ) = 1 + 1 = 2 r(A)\ =1 + 1 \ = 2 r(A) =1+1 =2。
(三)惯性定理解读
惯性定理表明,二次型的正、负惯性指数由二次型自身唯一确定,与化为规范型所采用的可逆线性变换无关。
例如二次型 f ( x 1 , x 2 ) = 2 x 1 2 − 3 x 2 2 f(x_1, x_2)\ =2x_1^2 - 3x_2^2 f(x1,x2) =2x12−3x22,无论通过何种可逆线性变换化为规范型,正惯性指数始终为 1 1 1(对应 x 1 2 x_1^2 x12项) ,负惯性指数始终为 1 1 1(对应 x 2 2 x_2^2 x22项前面的负号) 。
以下是对线性代数中二次型相关内容的进一步拓展和详细讲解:
五、用正交变换化二次型为标准型的详细步骤及案例
(一)步骤详述
- 求二次型矩阵的特征值 :对于二次型 f ( X ) = X T A X f(X)\ =X^TAX f(X) =XTAX,先确定其对称矩阵 A A A,然后计算特征多项式 ∣ λ E − A ∣ \vert\lambda E - A\vert ∣λE−A∣,令 ∣ λ E − A ∣ = 0 \vert\lambda E - A\vert \ = 0 ∣λE−A∣ =0,求解得到矩阵 A A A的特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,⋯,λn。这些特征值将构成最终标准型中平方项的系数。
- 求对应特征值的特征向量 :针对每个特征值 λ i \lambda_i λi,解齐次线性方程组 ( λ i E − A ) X = 0 (\lambda_i E - A)X \ = 0 (λiE−A)X =0,得到的基础解系就是 λ i \lambda_i λi对应的特征向量。这些特征向量是后续操作的基础。
- 特征向量的正交化 :如果不同特征值对应的特征向量已经正交(实对称矩阵不同特征值对应的特征向量必定正交),则无需对它们进行正交化。但对于重特征值对应的特征向量,需要使用施密特正交化方法将其正交化。设重特征值 λ \lambda λ对应的特征向量为 ξ 1 , ξ 2 , ⋯ , ξ s \xi_1,\xi_2,\cdots,\xi_s ξ1,ξ2,⋯,ξs( s s s为重数),施密特正交化过程如下:
- 令 β 1 = ξ 1 \beta_1 \ = \xi_1 β1 =ξ1;
- β 2 = ξ 2 − ( ξ 2 , β 1 ) ( β 1 , β 1 ) β 1 \beta_2 \ = \xi_2 - \frac{(\xi_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1 β2 =ξ2−(β1,β1)(ξ2,β1)β1;
- β 3 = ξ 3 − ( ξ 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( ξ 3 , β 2 ) ( β 2 , β 2 ) β 2 \beta_3 \ = \xi_3 - \frac{(\xi_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1 - \frac{(\xi_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2 β3 =ξ3−(β1,β1)(ξ3,β1)β1−(β2,β2)(ξ3,β2)β2;
- 以此类推, β s = ξ s − ∑ i = 1 s − 1 ( ξ s , β i ) ( β i , β i ) β i \beta_s \ = \xi_s - \sum_{i \ = 1}^{s - 1}\frac{(\xi_s,\beta_i)}{(\beta_i,\beta_i)}\beta_i βs =ξs−∑i =1s−1(βi,βi)(ξs,βi)βi。
- 令 β 1 = ξ 1 \beta_1 \ = \xi_1 β1 =ξ1;
- 特征向量的单位化 :将正交化后的特征向量(或者原本就正交的特征向量)进行单位化。对于向量 β \beta β,其单位向量 γ = β ∣ β ∣ \gamma \ = \frac{\beta}{\vert\beta\vert} γ =∣β∣β,其中 ∣ β ∣ = ( β , β ) \vert\beta\vert \ = \sqrt{(\beta,\beta)} ∣β∣ =(β,β) 是向量 β \beta β的长度。
- 构造正交矩阵 Q Q Q并得到标准型 :把所有单位化后的特征向量按列排列,构成正交矩阵 Q = ( γ 1 , γ 2 , ⋯ , γ n ) Q \ = (\gamma_1,\gamma_2,\cdots,\gamma_n) Q =(γ1,γ2,⋯,γn)。通过正交变换 X = Q Y X \ = QY X =QY,二次型 f ( X ) f(X) f(X)可化为标准型 f ( Y ) = Y T ( Q T A Q ) Y = Y T Λ Y f(Y)\ =Y^T(Q^TAQ)Y \ = Y^T\Lambda Y f(Y) =YT(QTAQ)Y =YTΛY,其中 Λ \Lambda Λ是对角矩阵,对角线上的元素就是前面求得的特征值。
(二)案例演示
设二次型 f ( x 1 , x 2 , x 3 ) = 2 x 1 2 + 5 x 2 2 + 5 x 3 2 + 4 x 1 x 2 − 4 x 1 x 3 − 8 x 2 x 3 f(x_1,x_2,x_3)\ =2x_1^2 + 5x_2^2 + 5x_3^2 + 4x_1x_2 - 4x_1x_3 - 8x_2x_3 f(x1,x2,x3) =2x12+5x22+5x32+4x1x2−4x1x3−8x2x3。
- 确定二次型矩阵 A A A :
根据前面介绍的二次型矩阵的写法,可得 A = ( 2 2 − 2 2 5 − 4 − 2 − 4 5 ) A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix} A = 22−225−4−2−45 。 - 求特征值 :
计算特征多项式 ∣ λ E − A ∣ \vert\lambda E - A\vert ∣λE−A∣:
∣ λ E − A ∣ = ∣ λ − 2 − 2 2 − 2 λ − 5 4 2 4 λ − 5 ∣ = ( λ − 2 ) [ ( λ − 5 ) 2 − 16 ] + 2 [ − 2 ( λ − 5 ) − 8 ] + 2 [ − 8 − 2 ( λ − 5 ) ] = ( λ − 2 ) ( λ 2 − 10 λ + 25 − 16 ) − 4 ( λ − 5 ) − 16 − 16 − 4 ( λ − 5 ) = ( λ − 2 ) ( λ 2 − 10 λ + 9 ) − 8 ( λ − 5 ) − 32 = ( λ − 2 ) ( λ − 1 ) ( λ − 9 ) − 8 λ + 40 − 32 = ( λ − 2 ) ( λ − 1 ) ( λ − 9 ) − 8 λ + 8 = ( λ − 1 ) [ ( λ − 2 ) ( λ − 9 ) − 8 ] = ( λ − 1 ) ( λ 2 − 11 λ + 18 − 8 ) = ( λ − 1 ) ( λ 2 − 11 λ + 10 ) = ( λ − 1 ) 2 ( λ − 10 ) \begin{align*} \vert\lambda E - A\vert&\ =\begin{vmatrix}\lambda - 2& - 2&2\\ - 2&\lambda - 5&4\\2&4&\lambda - 5\end{vmatrix}\\ &\ = (\lambda - 2)[(\lambda - 5)^2 - 16]+2[-2(\lambda - 5) - 8]+2[-8 - 2(\lambda - 5)]\\ &\ = (\lambda - 2)(\lambda^2 - 10\lambda + 25 - 16)-4(\lambda - 5) - 16 - 16 - 4(\lambda - 5)\\ &\ = (\lambda - 2)(\lambda^2 - 10\lambda + 9)-8(\lambda - 5) - 32\\ &\ = (\lambda - 2)(\lambda - 1)(\lambda - 9)-8\lambda + 40 - 32\\ &\ = (\lambda - 2)(\lambda - 1)(\lambda - 9)-8\lambda + 8\\ &\ = (\lambda - 1)[(\lambda - 2)(\lambda - 9) - 8]\\ &\ = (\lambda - 1)(\lambda^2 - 11\lambda + 18 - 8)\\ &\ = (\lambda - 1)(\lambda^2 - 11\lambda + 10)\\ &\ = (\lambda - 1)^2(\lambda - 10) \end{align*} ∣λE−A∣ = λ−2−22−2λ−5424λ−5 =(λ−2)[(λ−5)2−16]+2[−2(λ−5)−8]+2[−8−2(λ−5)] =(λ−2)(λ2−10λ+25−16)−4(λ−5)−16−16−4(λ−5) =(λ−2)(λ2−10λ+9)−8(λ−5)−32 =(λ−2)(λ−1)(λ−9)−8λ+40−32 =(λ−2)(λ−1)(λ−9)−8λ+8 =(λ−1)[(λ−2)(λ−9)−8] =(λ−1)(λ2−11λ+18−8) =(λ−1)(λ2−11λ+10) =(λ−1)2(λ−10)
令 ∣ λ E − A ∣ = 0 \vert\lambda E - A\vert \ = 0 ∣λE−A∣ =0,解得特征值 λ 1 = λ 2 = 1 \lambda_1 \ = \lambda_2 \ = 1 λ1 =λ2 =1, λ 3 = 10 \lambda_3 \ = 10 λ3 =10。 - 求特征向量 :
- 当 λ 1 = λ 2 = 1 \lambda_1 \ = \lambda_2 \ = 1 λ1 =λ2 =1时,解齐次线性方程组 ( E − A ) X = 0 (E - A)X \ = 0 (E−A)X =0, E − A = ( − 1 − 2 2 − 2 − 4 4 2 4 − 4 ) E - A \ = \begin{pmatrix}-1& - 2&2\\ - 2& - 4&4\\2&4& - 4\end{pmatrix} E−A = −1−22−2−4424−4 ,通过初等行变换化为行最简形 ( 1 2 − 2 0 0 0 0 0 0 ) \begin{pmatrix}1&2& - 2\\0&0&0\\0&0&0\end{pmatrix} 100200−200 。
令 x 3 = t x_3 \ = t x3 =t, x 2 = s x_2 \ = s x2 =s,则 x 1 = 2 t − 2 s x_1 \ = 2t - 2s x1 =2t−2s,得到基础解系 ξ 1 = ( 2 − 1 0 ) \xi_1 \ = \begin{pmatrix}2\\ - 1\\0\end{pmatrix} ξ1 = 2−10 , ξ 2 = ( 2 0 1 ) \xi_2 \ = \begin{pmatrix}2\\0\\1\end{pmatrix} ξ2 = 201 。 - 当 λ 3 = 10 \lambda_3 \ = 10 λ3 =10时,解齐次线性方程组 ( 10 E − A ) X = 0 (10E - A)X \ = 0 (10E−A)X =0, 10 E − A = ( 8 − 2 2 − 2 5 4 2 4 5 ) 10E - A \ = \begin{pmatrix}8& - 2&2\\ - 2&5&4\\2&4&5\end{pmatrix} 10E−A = 8−22−254245 ,通过初等行变换化为行最简形 ( 1 0 1 2 0 1 1 0 0 0 ) \begin{pmatrix}1&0&\frac{1}{2}\\0&1&1\\0&0&0\end{pmatrix} 1000102110 。
令 x 3 = 2 t x_3 \ = 2t x3 =2t,则 x 1 = − t x_1 \ = - t x1 =−t, x 2 = − 2 t x_2 \ = - 2t x2 =−2t,得到基础解系 ξ 3 = ( − 1 − 2 2 ) \xi_3 \ = \begin{pmatrix}-1\\ - 2\\2\end{pmatrix} ξ3 = −1−22 。
- 当 λ 1 = λ 2 = 1 \lambda_1 \ = \lambda_2 \ = 1 λ1 =λ2 =1时,解齐次线性方程组 ( E − A ) X = 0 (E - A)X \ = 0 (E−A)X =0, E − A = ( − 1 − 2 2 − 2 − 4 4 2 4 − 4 ) E - A \ = \begin{pmatrix}-1& - 2&2\\ - 2& - 4&4\\2&4& - 4\end{pmatrix} E−A = −1−22−2−4424−4 ,通过初等行变换化为行最简形 ( 1 2 − 2 0 0 0 0 0 0 ) \begin{pmatrix}1&2& - 2\\0&0&0\\0&0&0\end{pmatrix} 100200−200 。
- 特征向量的正交化 :
对于 ξ 1 \xi_1 ξ1和 ξ 2 \xi_2 ξ2(对应重特征值 λ = 1 \lambda \ = 1 λ =1),使用施密特正交化方法:- β 1 = ξ 1 = ( 2 − 1 0 ) \beta_1 \ = \xi_1 \ = \begin{pmatrix}2\\ - 1\\0\end{pmatrix} β1 =ξ1 = 2−10 ;
- β 2 = ξ 2 − ( ξ 2 , β 1 ) ( β 1 , β 1 ) β 1 \beta_2 \ = \xi_2 - \frac{(\xi_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1 β2 =ξ2−(β1,β1)(ξ2,β1)β1
( ξ 2 , β 1 ) = 2 × 2 + 0 × ( − 1 ) + 1 × 0 = 4 (\xi_2,\beta_1)\ =2\times2 + 0\times(-1)+1\times0 \ = 4 (ξ2,β1) =2×2+0×(−1)+1×0 =4, ( β 1 , β 1 ) = 2 2 + ( − 1 ) 2 + 0 2 = 5 (\beta_1,\beta_1)\ =2^2 + (-1)^2 + 0^2 \ = 5 (β1,β1) =22+(−1)2+02 =5,
则 β 2 = ( 2 0 1 ) − 4 5 ( 2 − 1 0 ) = ( 2 5 4 5 1 ) \beta_2 \ = \begin{pmatrix}2\\0\\1\end{pmatrix}-\frac{4}{5}\begin{pmatrix}2\\ - 1\\0\end{pmatrix}\ =\begin{pmatrix}\frac{2}{5}\\\frac{4}{5}\\1\end{pmatrix} β2 = 201 −54 2−10 = 52541 。
ξ 3 \xi_3 ξ3与 ξ 1 , ξ 2 \xi_1,\xi_2 ξ1,ξ2(对应不同特征值)本身正交,无需正交化。
- 特征向量的单位化 :
- ∣ β 1 ∣ = 2 2 + ( − 1 ) 2 + 0 2 = 5 \vert\beta_1\vert \ = \sqrt{2^2 + (-1)^2 + 0^2}\ =\sqrt{5} ∣β1∣ =22+(−1)2+02 =5 , γ 1 = β 1 ∣ β 1 ∣ = ( 2 5 − 1 5 0 ) \gamma_1 \ = \frac{\beta_1}{\vert\beta_1\vert}\ =\begin{pmatrix}\frac{2}{\sqrt{5}}\\-\frac{1}{\sqrt{5}}\\0\end{pmatrix} γ1 =∣β1∣β1 = 5 2−5 10 ;
- ∣ β 2 ∣ = ( 2 5 ) 2 + ( 4 5 ) 2 + 1 2 = 3 5 \vert\beta_2\vert \ = \sqrt{(\frac{2}{5})^2 + (\frac{4}{5})^2 + 1^2}\ =\frac{3}{\sqrt{5}} ∣β2∣ =(52)2+(54)2+12 =5 3, γ 2 = β 2 ∣ β 2 ∣ = ( 2 3 5 4 3 5 5 3 5 ) \gamma_2 \ = \frac{\beta_2}{\vert\beta_2\vert}\ =\begin{pmatrix}\frac{2}{3\sqrt{5}}\\\frac{4}{3\sqrt{5}}\\\frac{5}{3\sqrt{5}}\end{pmatrix} γ2 =∣β2∣β2 = 35 235 435 5 ;
- ∣ ξ 3 ∣ = ( − 1 ) 2 + ( − 2 ) 2 + 2 2 = 3 \vert\xi_3\vert \ = \sqrt{(-1)^2 + (-2)^2 + 2^2}\ =3 ∣ξ3∣ =(−1)2+(−2)2+22 =3, γ 3 = ξ 3 ∣ ξ 3 ∣ = ( − 1 3 − 2 3 2 3 ) \gamma_3 \ = \frac{\xi_3}{\vert\xi_3\vert}\ =\begin{pmatrix}-\frac{1}{3}\\-\frac{2}{3}\\\frac{2}{3}\end{pmatrix} γ3 =∣ξ3∣ξ3 = −31−3232 。
- 构造正交矩阵 Q Q Q并得到标准型 :
令 Q = ( γ 1 , γ 2 , γ 3 ) = ( 2 5 2 3 5 − 1 3 − 1 5 4 3 5 − 2 3 0 5 3 5 2 3 ) Q \ = (\gamma_1,\gamma_2,\gamma_3)\ =\begin{pmatrix}\frac{2}{\sqrt{5}}&\frac{2}{3\sqrt{5}}&-\frac{1}{3}\\-\frac{1}{\sqrt{5}}&\frac{4}{3\sqrt{5}}&-\frac{2}{3}\\0&\frac{5}{3\sqrt{5}}&\frac{2}{3}\end{pmatrix} Q =(γ1,γ2,γ3) = 5 2−5 1035 235 435 5−31−3232 ,通过正交变换 X = Q Y X \ = QY X =QY,二次型 f ( X ) f(X) f(X)化为标准型 f ( Y ) = Y T ( Q T A Q ) Y = y 1 2 + y 2 2 + 10 y 3 2 f(Y)\ =Y^T(Q^TAQ)Y \ = y_1^2 + y_2^2 + 10y_3^2 f(Y) =YT(QTAQ)Y =y12+y22+10y32。
六、二次型正定性的判定
(一)正定性的定义
设 f ( X ) = X T A X f(X)\ =X^TAX f(X) =XTAX是实二次型,如果对于任意非零向量 X X X,都有 f ( X ) > 0 f(X)>0 f(X)>0,则称二次型 f ( X ) f(X) f(X)为正定二次型,此时矩阵 A A A称为正定矩阵;如果对于任意非零向量 X X X,都有 f ( X ) ≥ 0 f(X)\geq0 f(X)≥0,则称二次型 f ( X ) f(X) f(X)为半正定二次型,矩阵 A A A称为半正定矩阵;如果对于任意非零向量 X X X,都有 f ( X ) < 0 f(X)<0 f(X)<0,则称二次型 f ( X ) f(X) f(X)为负定二次型,矩阵 A A A称为负定矩阵;如果对于任意非零向量 X X X,都有 f ( X ) ≤ 0 f(X)\leq0 f(X)≤0,则称二次型 f ( X ) f(X) f(X)为半负定二次型,矩阵 A A A称为半负定矩阵;如果 f ( X ) f(X) f(X)的值有正有负,则称二次型 f ( X ) f(X) f(X)为不定二次型。
(二)判定方法
- 特征值法 :实对称矩阵 A A A正定的充分必要条件是 A A A的特征值全大于 0 0 0;实对称矩阵 A A A半正定的充分必要条件是 A A A的特征值全大于等于 0 0 0;实对称矩阵 A A A负定的充分必要条件是 A A A的特征值全小于 0 0 0;实对称矩阵 A A A半负定的充分必要条件是 A A A的特征值全小于等于 0 0 0;实对称矩阵 A A A不定的充分必要条件是 A A A的特征值有正有负。
例如,对于前面提到的矩阵 A = ( 2 2 − 2 2 5 − 4 − 2 − 4 5 ) A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix} A = 22−225−4−2−45 ,其特征值为 1 , 1 , 10 1,1,10 1,1,10,全大于 0 0 0,所以对应的二次型 f ( x 1 , x 2 , x 3 ) f(x_1,x_2,x_3) f(x1,x2,x3)是正定二次型,矩阵 A A A是正定矩阵。 - 顺序主子式法 :实对称矩阵 A = ( a i j ) n × n A\ =(a_{ij})_{n\times n} A =(aij)n×n的各阶顺序主子式全大于 0 0 0,则 A A A是正定矩阵。 A A A的 k k k阶顺序主子式是指 A A A的左上角 k × k k\times k k×k阶子矩阵的行列式,记为 P k P_k Pk, k = 1 , 2 , ⋯ , n k \ = 1,2,\cdots,n k =1,2,⋯,n。
例如,对于矩阵 A = ( 2 2 − 2 2 5 − 4 − 2 − 4 5 ) A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix} A = 22−225−4−2−45 :- P 1 = ∣ 2 ∣ = 2 > 0 P_1 \ = \vert2\vert \ = 2>0 P1 =∣2∣ =2>0;
- P 2 = ∣ 2 2 2 5 ∣ = 2 × 5 − 2 × 2 = 6 > 0 P_2 \ = \begin{vmatrix}2&2\\2&5\end{vmatrix}\ =2\times5 - 2\times2 \ = 6>0 P2 = 2225 =2×5−2×2 =6>0;
- P 3 = ∣ 2 2 − 2 2 5 − 4 − 2 − 4 5 ∣ = 2 × ∣ 5 − 4 − 4 5 ∣ − 2 × ∣ 2 − 4 − 2 5 ∣ − 2 × ∣ 2 5 − 2 − 4 ∣ = 2 × ( 25 − 16 ) − 2 × ( 10 − 8 ) − 2 × ( − 8 + 10 ) = 18 − 4 − 4 = 10 > 0 P_3 \ = \begin{vmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{vmatrix}\ = 2\times\begin{vmatrix}5& - 4\\ - 4&5\end{vmatrix}-2\times\begin{vmatrix}2& - 4\\ - 2&5\end{vmatrix}-2\times\begin{vmatrix}2&5\\ - 2& - 4\end{vmatrix}\ = 2\times(25 - 16)-2\times(10 - 8)-2\times(-8 + 10)\ = 18 - 4 - 4 \ = 10>0 P3 = 22−225−4−2−45 =2× 5−4−45 −2× 2−2−45 −2× 2−25−4 =2×(25−16)−2×(10−8)−2×(−8+10) =18−4−4 =10>0。
各阶顺序主子式全大于 0 0 0,所以矩阵 A A A是正定矩阵,二次型 f ( x 1 , x 2 , x 3 ) f(x_1,x_2,x_3) f(x1,x2,x3)是正定二次型。