数学公式_矩阵

矩阵定义

矩阵X,n是矩阵的行数,D是矩阵的列数。

Xn×D=x11x12...x1Dx21x22...x2D............xn1xn2...xnDX_{n\text{×}D}=\begin{bmatrix} x_{11} & x_{12} &... &x_{1D}\\ x_{21} & x_{22} &... &x_{2D}\\ ... & ... &... &...\\ x_{n1} & x_{n2} &... &x_{nD}\\ \end{bmatrix}Xn×D= x11x21...xn1x12x22...xn2............x1Dx2D...xnD

矩阵分块

矩阵可以看做是,若干列向量左右排列,或者若干行向量上下叠放。

123456\]2×3=\[\[14\]\[25\]\[36\]\]=\[\[123\]\[456\]\]\\begin{bmatrix} 1 \& 2 \& 3 \\\\ 4 \& 5 \& 6 \\\\ \\end{bmatrix}_{2×3}= \\begin{bmatrix} \\begin{bmatrix} 1 \\\\ 4 \\\\ \\end{bmatrix} \& \\begin{bmatrix} 2 \\\\ 5 \\\\ \\end{bmatrix} \& \\begin{bmatrix} 3 \\\\ 6 \\\\ \\end{bmatrix} \\end{bmatrix}=\\begin{bmatrix} \\begin{bmatrix} 1 \& 2 \& 3 \\\\ \\end{bmatrix} \\\\ \\begin{bmatrix} 4 \& 5 \& 6 \\\\ \\end{bmatrix} \\\\ \\end{bmatrix}\[142536\]2×3=\[\[14\]\[25\]\[36\]\]=\[\[123\]\[456\]

形状为n×D的矩阵X,可以写成D个左右排列的列向量

Xn×D=x1x2⋯xDX_{n\text{×}D}=\begin{bmatrix} x_1 & x_2 & \cdots &x_D \end{bmatrix}Xn×D=x1x2⋯xD

形状为n×D的矩阵X,也可以写成N个上下排列的行向量

Xn×D=x(1)x(2)⋮x(n)X_{n\text{×}D}=\begin{bmatrix} x^{(1)} \\ x^{(2)} \\ \vdots \\ x^{(n)} \\ \end{bmatrix}Xn×D= x(1)x(2)⋮x(n)

矩阵转置:每个竖向叠加的行向量单独进行转置为列向量后横向叠加排列

AT=a(1)a(2)⋮a(n)T=a(1)Ta(2)T⋯a(n)TA^\Tau=\begin{bmatrix} a^{(1)} \\ a^{(2)} \\ \vdots \\ a^{(n)} \\ \end{bmatrix}^{\Tau}= \begin{bmatrix} a^{(1)\Tau} & a^{(2)\Tau} & \cdots & a^{(n)\Tau} \end{bmatrix}AT= a(1)a(2)⋮a(n) T=a(1)Ta(2)T⋯a(n)T

矩阵乘法

A和B两个矩阵相乘的前提是矩阵A的列数和矩阵B的行数相同。A和B的乘积一般写作AB或A@B。

矩阵A的第一行元素和矩阵B第一列对应元素分别相乘,再相加,结果为矩阵C的第一行、第一列元素c1,1。

A和B乘积C的第i行第j列的元素ci,j等于矩阵A的第i行的元素与矩阵B的第j列对应元素乘积再求和。

双视角下矩阵乘法:第一视角

Am×p@Bp×n=a(1)a(2)⋮a(m)@b1b2⋯bn=a(1)b1a(1)b2⋯a(1)bna(2)b1a(2)b2⋯a(2)bn⋮⋮⋮⋮a(m)b1a(m)b2⋯a(m)bn=Cm×n\begin{split} A_{m×p}@B_{p×n}&=\begin{bmatrix} a^{(1)} \\ a^{(2)} \\ \vdots \\ a^{(m)} \\ \end{bmatrix}@\begin{bmatrix} b_1 & b_2 & \cdots &b_n \\ \end{bmatrix}\\ &=\begin{bmatrix} a^{(1)}b_1 & a^{(1)}b_2 & \cdots & a^{(1)}b_n\\ a^{(2)}b_1 & a^{(2)}b_2 & \cdots & a^{(2)}b_n\\ \vdots & \vdots & \vdots & \vdots \\ a^{(m)}b_1 & a^{(m)}b_2 & \cdots & a^{(m)}b_n\\ \end{bmatrix}\\ &=C_{m×n} \end{split}Am×p@Bp×n= a(1)a(2)⋮a(m) @b1b2⋯bn= a(1)b1a(2)b1⋮a(m)b1a(1)b2a(2)b2⋮a(m)b2⋯⋯⋮⋯a(1)bna(2)bn⋮a(m)bn =Cm×n

双视角下矩阵乘法:第二视角

Am×p@Bp×n=a1a2⋯ap@b(1)b(2)⋮b(p)=a1b(1)+a2b(2)+⋯+apb(p)=Cm×n\begin{split} A_{m×p}@B_{p×n}&=\begin{bmatrix} a_1 & a_2 & \cdots &a_p \\ \end{bmatrix}@\begin{bmatrix} b^{(1)} \\ b^{(2)} \\ \vdots \\ b^{(p)} \\ \end{bmatrix}\\ &= a_1b^{(1)}+a_2b^{(2)}+\cdots+a_pb^{(p)}\\ &=C_{m×n} \end{split}Am×p@Bp×n=a1a2⋯ap@ b(1)b(2)⋮b(p) =a1b(1)+a2b(2)+⋯+apb(p)=Cm×n