一、向量

L0范数：向量中非零元素的个数，也称为0范数

L1范数：为绝对值之和，也称为范数或者1范数

L2范数：通常意义上的模，也称为2范数

p范数：即向量元素绝对值的 p p p次方和的 1 / p 1/p 1/p次幂

∞ \infty ∞范数：取向量的最大值

− ∞ -\infty −∞范数：取向量的最小值

假设有向量 x = ( x 1 , x 2 , ... , x n ) T x = (x_1,x_2,\dots,x_n)^T x=(x1,x2,...,xn)T，向量的范数有：
∣ ∣ x ∣ ∣ 1 = ∣ x 1 ∣ + ∣ x 2 ∣ + ⋯ + ∣ x n ∣ ||x||_1 = |x_1| + |x_2| + \dots + |x_n| ∣∣x∣∣1=∣x1∣+∣x2∣+⋯+∣xn∣

∣ ∣ x ∣ ∣ 2 = ( ∣ x 1 ∣ + ∣ x 2 ∣ + ⋯ + ∣ x n ∣ ) 1 2 ||x||_2 = (|x_1| + |x_2| + \dots + |x_n|)^{\frac{1}{2}} ∣∣x∣∣2=(∣x1∣+∣x2∣+⋯+∣xn∣)21

∣ ∣ x ∣ ∣ p = ( ∣ x 1 ∣ + ∣ x 2 ∣ + ⋯ + ∣ x n ∣ ) 1 p ||x||_p = (|x_1| + |x_2| + \dots + |x_n|)^{\frac{1}{p}} ∣∣x∣∣p=(∣x1∣+∣x2∣+⋯+∣xn∣)p1

∣ ∣ x ∣ ∣ ∞ = max ⁡ { ∣ x 1 ∣ + ∣ x 2 ∣ + ⋯ + ∣ x n ∣ } ||x||_{\infty} = \max\{|x_1| + |x_2| + \dots + |x_n|\} ∣∣x∣∣∞=max{∣x1∣+∣x2∣+⋯+∣xn∣}

∣ ∣ x ∣ ∣ − ∞ = min ⁡ { ∣ x 1 ∣ + ∣ x 2 ∣ + ⋯ + ∣ x n ∣ } ||x||_{-\infty} = \min\{|x_1| + |x_2| + \dots + |x_n|\} ∣∣x∣∣−∞=min{∣x1∣+∣x2∣+⋯+∣xn∣}

二、矩阵

矩阵范数主要有以下三类，切记，三类范数不一样！！

2.1、诱导范数

又称为算子范数，定义矩阵A位于矩阵空间 R m × n \mathbb{R}^{m\times n} Rm×n 上
∣ ∣ x ∣ ∣ = max ⁡ { ∣ ∣ A x ∣ ∣ ; x ∈ R n , ∣ ∣ x ∣ ∣ = 1 } = m a x { ∣ ∣ A x ∣ ∣ ∣ ∣ x ∣ ∣ , x ∈ R n , x ≠ 0 } ||x||= \max\{||Ax||;x\in \mathbb{R}^n,||x||=1 \} = max\left\{ \frac{||Ax||}{||x||}, x\in \mathbb{R}^n,x\ne 0 \right\} ∣∣x∣∣=max{∣∣Ax∣∣;x∈Rn,∣∣x∣∣=1}=max{∣∣x∣∣∣∣Ax∣∣,x∈Rn,x=0}

常用诱导范数为p范数，也称为 L p L_p Lp 范数
∣ ∣ A ∣ ∣ p = m a x { ∣ ∣ A x ∣ ∣ p ∣ ∣ x ∣ ∣ p , x ≠ 0 } ||A||_p = max\left\{ \frac{||Ax||_p}{||x||_p} ,x\ne 0 \right\} ∣∣A∣∣p=max{∣∣x∣∣p∣∣Ax∣∣p,x=0}

0范数：矩阵中非零元素的个数。

1范数又称为列范数
∣ ∣ A ∣ ∣ 1 = max ⁡ ∑ i = 1 m ∣ a i j ∣ , 1 ≤ j ≤ n ||A||1 = \max \sum{i=1}^m |a_{ij}|,1 \le j \le n ∣∣A∣∣1=maxi=1∑m∣aij∣,1≤j≤n

无穷范数又称为行范数
∣ ∣ A ∣ ∣ ∞ = max ⁡ ∑ j = 1 n ∣ a i j ∣ , 1 ≤ i ≤ n ||A||\infty = \max \sum{j=1}^n |a_{ij}|,1 \le i \le n ∣∣A∣∣∞=maxj=1∑n∣aij∣,1≤i≤n

2范数又称为谱范数，矩阵的谱范数为矩阵的最大奇异值
∣ ∣ A ∣ ∣ s p e c = ∣ ∣ A ∣ ∣ 2 = σ m a x ( A ) = λ m a x ( A T A ) ||A||{spec} = ||A||{2} = \sigma_{max}(A) = \sqrt{\lambda_{max}(A^TA)} ∣∣A∣∣spec=∣∣A∣∣2=σmax(A)=λmax(ATA)
σ m a x \sigma_{max} σmax 表示求矩阵的最大奇异值，spec是谱的意思

2.2、元素范数

将 m × n m \times n m×n 矩阵先按照列堆栈的形式，排列成一个 m n × 1 mn \times 1 mn×1 向量，然后采用向量的范数定义，即得到矩阵的范数
∣ ∣ A ∣ ∣ P = ( ∑ i = 1 m ∑ j = 1 n ∣ a i j ∣ p ) 1 p ||A||P = \left( \sum{i=1}^m\sum_{j=1}^n |a_{ij}|^p \right)^\frac{1}{p} ∣∣A∣∣P=(i=1∑mj=1∑n∣aij∣p)p1

1范数又称为和范数或者L1范数
∣ ∣ A ∣ ∣ 1 = ∑ i = 1 m ∑ j = 1 n ∣ a i j ∣ ||A||1 = \sum{i=1}^m\sum_{j=1}^n |a_{ij}| ∣∣A∣∣1=i=1∑mj=1∑n∣aij∣

2范数又称为Forbenius范数
∣ ∣ A ∣ ∣ F = ∣ ∣ A ∣ ∣ 2 = ( ∑ i = 1 m ∑ j = 1 n ∣ a i j ∣ 2 ) 1 2 = t r ( A H A ) ||A||F = ||A||2 = \left( \sum{i=1}^m\sum{j=1}^n |a_{ij}|^2 \right)^\frac{1}{2} = \sqrt{tr({A^HA})} ∣∣A∣∣F=∣∣A∣∣2=(i=1∑mj=1∑n∣aij∣2)21=tr(AHA)
∞ \infty ∞ 范数又称为最大范数
∣ ∣ A ∣ ∣ p = max ⁡ { ∣ a i j ∣ } ||A||p = \max\{ |a{ij}| \} ∣∣A∣∣p=max{∣aij∣}

2.3、Schatten范数

用矩阵的奇异值定义的范数，令矩阵的奇异值组成一个向量 σ = [ σ 1 σ 2 ... σ k ] \sigma = \begin{bmatrix} \sigma_1 & \sigma_2 & \dots & \sigma_k \end{bmatrix} σ=[σ1σ2...σk] , k = min ⁡ ( m , n ) k=\min(m,n) k=min(m,n)

p范数定义如下
∣ ∣ A ∣ ∣ p = ∣ ∣ σ ∣ ∣ p = ( ∑ i = 1 k σ i p ) 1 p ||A||_p = ||\sigma||p = (\sum{i=1}^k \sigma_i^{p})^\frac{1}{p} ∣∣A∣∣p=∣∣σ∣∣p=(i=1∑kσip)p1

p=1，也称为核范数，为矩阵奇异值之和
∣ ∣ A ∣ ∣ 1 = ∑ i = 1 k σ i = t r ( A H A ) ||A||1 =\sum{i=1}^k \sigma_i = tr(\sqrt{A^HA}) ∣∣A∣∣1=i=1∑kσi=tr(AHA )

p=2，Schattern范数与Frobenius等价

∣ ∣ A ∣ ∣ 1 = ( ∑ i = 1 k σ i 2 ) 1 2 = t r ( A H A ) = ( ∑ i = 1 m ∑ j = 1 n ∣ a i j ∣ 2 ) 1 2 ||A||1 =(\sum{i=1}^k \sigma_i^{2})^\frac{1}{2} = \sqrt{tr(A^HA)} = \left(\sum_{i=1}^m\sum_{j=1}^n |a_{ij}|^2 \right)^\frac{1}{2} ∣∣A∣∣1=(i=1∑kσi2)21=tr(AHA) =(i=1∑mj=1∑n∣aij∣2)21

p= ∞ \infty ∞，Schattern范数与谱范数相同

∣ ∣ A ∣ ∣ ∞ = σ m a x ( A ) ||A||\infty = \sigma{max}(A) ∣∣A∣∣∞=σmax(A)

向量与矩阵范数的详细解读

一、向量

二、矩阵

2.1、诱导范数

2.2、元素范数

2.3、Schatten范数