参考瑞利商(Rayleigh Quotient)及瑞利定理(Rayleigh-Ritz theorem)的证明
1 、厄米特矩阵的定义
若矩阵 A A A 满足
A † = A , 也可以记作 A H = A A^\dagger=A,也可以记作A^H=A A†=A,也可以记作AH=A
其中 , † ,\dagger ,†表示共轭转置。 厄米特矩阵的对角线上都是实数
下面是一个厄米特矩阵的例子
1 1 − i 1 + i 2 \] \\left\[ \\begin{matrix} 1 \& 1-i\\\\ 1+i \& 2 \\\\ \\end{matrix}\\right\] \[11+i1−i2
2、厄米特矩阵的特征值都是实数
证明:对于厄米特矩阵 A ∈ C n × n A\in \mathbb{C}^{n\times n} A∈Cn×n,其特征值 λ ∈ C \lambda \in \mathbb{C} λ∈C和特征向量 x ∈ C n x\in \mathbb{C}^n x∈Cn满足
A x = λ x \begin{equation}Ax=\lambda x \end{equation} Ax=λx
对公式(1)两边同时取共轭转置
( A x ) H = ( λ x ) H ⇕ x H A H = λ ˉ x H ⇕ x H A = λ ˉ x H ⇕ x H A x = λ ˉ x H x \begin{equation}\begin{aligned} (Ax)^H&=(\lambda x)^H \\ &\Updownarrow \\ x^HA^H&=\bar{\lambda}x^H\\ &\Updownarrow \\ x^HA&=\bar{\lambda}x^H \\ &\Updownarrow \\ x^HAx&=\bar{\lambda}x^H x \\ \end{aligned}\end{equation} (Ax)HxHAHxHAxHAx=(λx)H⇕=λˉxH⇕=λˉxH⇕=λˉxHx
另一方面,对公式(1)两边同时右乘 x H x^H xH得到
x H A x = λ x H x \begin{equation}x^HAx=\lambda x^Hx \end{equation} xHAx=λxHx
联立公式(2)和(3)可以看出
λ = λ ˉ \begin{equation}\lambda=\bar{\lambda} \end{equation} λ=λˉ
即证厄米特矩阵的特征值都是实数
3、厄米特矩阵的不同特征值对应的特征向量相互酉正交
A x 1 = λ 1 x 1 A x 2 = λ 2 x 2 λ 1 ≠ λ 2 \begin{equation}\begin{aligned} Ax_1 &=\lambda_1 x_1 \\ Ax_2 &=\lambda_2 x_2 \\ \lambda_1 &\neq \lambda_2 \end{aligned}\end{equation} Ax1Ax2λ1=λ1x1=λ2x2=λ2
对公式(5)的第一个取共轭转置
( A x 1 ) H = ( λ 1 x 1 ) H ⇕ x 1 H A H = λ 1 ˉ x 1 H λ 1 为实数 ⇕ A = A H x 1 H A = λ 1 x 1 H ⇕ x 1 H A x 2 = λ 1 x 1 H x 2 ⇕ λ 2 x 1 H x 2 = λ 1 x 1 H x 2 ⇕ x 1 H x 2 = 0 \begin{equation}\begin{aligned} (Ax_1)^H &=(\lambda_1 x_1)^H \\ &\Updownarrow \\ x_1^HA^H&=\bar{\lambda_1}x_1^H \\ \lambda_1为实数&\Updownarrow A=A^H \\ x_1^HA&=\lambda_1 x_1^H \\ &\Updownarrow \\ x_1^HA x_2&=\lambda_1 x_1^H x_2 \\ &\Updownarrow \\ \lambda_2 x_1^H x_2&=\lambda_1 x_1^H x_2 \\ &\Updownarrow \\ x_1^H x_2&=0 \\ \end{aligned}\end{equation} (Ax1)Hx1HAHλ1为实数x1HAx1HAx2λ2x1Hx2x1Hx2=(λ1x1)H⇕=λ1ˉx1H⇕A=AH=λ1x1H⇕=λ1x1Hx2⇕=λ1x1Hx2⇕=0
即证 x 1 , x 2 x_1,x_2 x1,x2酉正交。
4、瑞利定理(Rayleigh theorem)
定义瑞利商(Rayleigh quotient)为
R ( A , x ) = x H A x x H x \begin{equation}\begin{aligned} R(A,x)=\frac{x^HAx}{x^Hx} \end{aligned}\end{equation} R(A,x)=xHxxHAx
其中, x x x为非零向量, A ∈ C n × n A\in \mathbb{C}^{n\times n} A∈Cn×n,且 A A A是厄米特矩阵。 A A A的特征向量即为瑞利商 R ( A , x ) R(A,x) R(A,x)的驻点,对应的特征值即为该驻点的值。由此可知 R ( A , x ) R(A,x) R(A,x)的最大值等于矩阵 A A A的最大特征值,最小值为矩阵 A A A的最小特征值,使用公式表示即为
λ m i n ≤ x H A x x H x ≤ λ m a x \begin{equation}\begin{aligned} \lambda_{min}\leq \frac{x^HAx}{x^Hx}\leq\lambda_{max} \end{aligned}\end{equation} λmin≤xHxxHAx≤λmax
当向量是标准正交基时,即满足 x H x = 1 x^Hx=1 xHx=1时,对应的瑞利商为
R ( A , x ) = x H A x \begin{equation}\begin{aligned} R(A,x)=x^HAx \end{aligned}\end{equation} R(A,x)=xHAx
证明: