从矩阵展开逆推矩阵形式简单推导示例

这里写自定义目录标题

    • 问题1
    • 问题1求解
    • 问题2
    • 问题2求解
      • [??????能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:](#??????能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:)
      • 合并所有部分
      • [提取和 \( x n x_n xn \) 相关的系数](#提取和 ( x n x_n xn ) 相关的系数)

问题1

已知矩阵展开形式:
∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ ( x n 2 + x m 2 − 2 x n x m ) (1) \sum_{n=1}^{N}\sum_{m=1}^{N} \left | w_n w_m \right | \left ( x_n^2 + x_m^2 - 2 x_n x_m \right ) \tag{1} n=1∑Nm=1∑N∣wnwm∣(xn2+xm2−2xnxm)(1)

已知
w ˉ ≜ [ ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ] T \bar{\boldsymbol{w}}\triangleq[|w_1|,|w_2|,\ldots,|w_N|]^\mathsf{T} wˉ≜[∣w1∣,∣w2∣,...,∣wN∣]T

并且 x i ≜ [ x 1 i , x 2 i , ... , x N i ] T \boldsymbol{x}^i\triangleq[x_1^i,x_2^i,\ldots,x_N^i]^\mathsf{T} xi≜[x1i,x2i,...,xNi]T

x ≜ [ x 1 , x 2 , ... , x N ] T \boldsymbol{x}\triangleq[x_1,x_2,\ldots,x_N]^\mathsf{T} x≜[x1,x2,...,xN]T

将式(1)表达成 x T A x \boldsymbol{x}^T\mathbf{A}\boldsymbol{x} xTAx的形式。

问题1求解


考虑给定的矩阵展开形式:

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ ( x n 2 + x m 2 − 2 x n x m ) \sum_{n=1}^{N}\sum_{m=1}^{N} |w_n w_m| (x_n^2 + x_m^2 - 2 x_n x_m) n=1∑Nm=1∑N∣wnwm∣(xn2+xm2−2xnxm)

我们可以将其分解为三个部分:

  1. ( ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n 2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n^2 ∑n=1N∑m=1N∣wnwm∣xn2 )
  2. ( ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x m 2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_m^2 ∑n=1N∑m=1N∣wnwm∣xm2 )
  3. ( − 2 ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n x m -2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n x_m −2∑n=1N∑m=1N∣wnwm∣xnxm )

首先看前两项:

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n 2 = ∑ n = 1 N x n 2 ∑ m = 1 N ∣ w n w m ∣ = ∑ n = 1 N ∣ w n ∣ x n 2 ∑ m = 1 N ∣ w m ∣ \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n^2 = \sum_{n=1}^{N} x_n^2 \sum_{m=1}^{N} |w_n w_m| = \sum_{n=1}^{N} |w_n| x_n^2 \sum_{m=1}^{N} |w_m| n=1∑Nm=1∑N∣wnwm∣xn2=n=1∑Nxn2m=1∑N∣wnwm∣=n=1∑N∣wn∣xn2m=1∑N∣wm∣

同理,

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x m 2 = ∑ m = 1 N x m 2 ∑ n = 1 N ∣ w n w m ∣ = ∑ m = 1 N ∣ w m ∣ x m 2 ∑ n = 1 N ∣ w n ∣ \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_m^2 = \sum_{m=1}^{N} x_m^2 \sum_{n=1}^{N} |w_n w_m| = \sum_{m=1}^{N} |w_m| x_m^2 \sum_{n=1}^{N} |w_n| n=1∑Nm=1∑N∣wnwm∣xm2=m=1∑Nxm2n=1∑N∣wnwm∣=m=1∑N∣wm∣xm2n=1∑N∣wn∣

所以,这两项可以合并为:

2 ( ∑ n = 1 N ∣ w n ∣ x n 2 ∑ m = 1 N ∣ w m ∣ ) 2 \left( \sum_{n=1}^{N} |w_n| x_n^2 \sum_{m=1}^{N} |w_m| \right) 2(n=1∑N∣wn∣xn2m=1∑N∣wm∣)

C = ∑ m = 1 N ∣ w m ∣ C = \sum_{m=1}^{N} |w_m| C=m=1∑N∣wm∣

则前两项合并后可以写成:

2 C ∑ n = 1 N ∣ w n ∣ x n 2 2C \sum_{n=1}^{N} |w_n| x_n^2 2Cn=1∑N∣wn∣xn2

这可以表示为:

2 C x T diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) x 2C \boldsymbol{x}^\mathsf{T} \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) \boldsymbol{x} 2CxTdiag(∣w1∣,∣w2∣,...,∣wN∣)x

现在看第三项:

− 2 ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n x m -2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n x_m −2n=1∑Nm=1∑N∣wnwm∣xnxm

我们定义:

W = w ˉ w ˉ T \mathbf{W} = \bar{\boldsymbol{w}} \bar{\boldsymbol{w}}^\mathsf{T} W=wˉwˉT

其中,

w ˉ = [ ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ] T \bar{\boldsymbol{w}} = [|w_1|, |w_2|, \ldots, |w_N|]^\mathsf{T} wˉ=[∣w1∣,∣w2∣,...,∣wN∣]T

则第三项可以写成:

− 2 x T W x -2 \boldsymbol{x}^\mathsf{T} \mathbf{W} \boldsymbol{x} −2xTWx

综上所述,我们将所有项合并起来:

2 C x T diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) x − 2 x T W x 2C \boldsymbol{x}^\mathsf{T} \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) \boldsymbol{x} - 2 \boldsymbol{x}^\mathsf{T} \mathbf{W} \boldsymbol{x} 2CxTdiag(∣w1∣,∣w2∣,...,∣wN∣)x−2xTWx

所以,矩阵 ( A \mathbf{A} A) 可以表示为:

A = 2 C diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) − 2 W \mathbf{A} = 2C \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) - 2 \mathbf{W} A=2Cdiag(∣w1∣,∣w2∣,...,∣wN∣)−2W

这里,( W = w ˉ w ˉ T \mathbf{W} = \bar{\boldsymbol{w}} \bar{\boldsymbol{w}}^\mathsf{T} W=wˉwˉT), ( w ˉ = [ ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ] T \bar{\boldsymbol{w}} = [|w_1|, |w_2|, \ldots, |w_N|]^\mathsf{T} wˉ=[∣w1∣,∣w2∣,...,∣wN∣]T), ( C = ∑ m = 1 N ∣ w m ∣ C = \sum_{m=1}^{N} |w_m| C=∑m=1N∣wm∣)。

问题2

∑ n = 1 N ∑ m = 1 N ( x n − x m ) ( x n i − x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N}\left ( x_n - x_m \right ) \left ( x_n^i - x_m^i \right ) n=1∑Nm=1∑N(xn−xm)(xni−xmi)

提取某个 x i x_i xi前相关的系数

问题2求解

???能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:

我们从原始表达式开始:

∑ n = 1 N ∑ m = 1 N ( x n − x m ) ( x n i − x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N} \left( x_n - x_m \right) \left( x_n^i - x_m^i \right) n=1∑Nm=1∑N(xn−xm)(xni−xmi)

将这个表达式展开:

∑ n = 1 N ∑ m = 1 N ( x n x n i − x n x m i − x m x n i + x m x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N} \left( x_n x_n^i - x_n x_m^i - x_m x_n^i + x_m x_m^i \right) n=1∑Nm=1∑N(xnxni−xnxmi−xmxni+xmxmi)

接下来分解为四个部分:

  1. 第一部分 ( ∑ n = 1 N ∑ m = 1 N x n x n i \sum_{n=1}^{N} \sum_{m=1}^{N} x_n x_n^i ∑n=1N∑m=1Nxnxni ):

    • 由于 ( x n x_n xn ) 和 ( x n i x_n^i xni ) 都与 ( m m m ) 无关,可以直接简化为:
      N ∑ n = 1 N x n x n i N \sum_{n=1}^{N} x_n x_n^i Nn=1∑Nxnxni
  2. 第二部分 ( − ∑ n = 1 N ∑ m = 1 N x n x m i -\sum_{n=1}^{N} \sum_{m=1}^{N} x_n x_m^i −∑n=1N∑m=1Nxnxmi ):

    • 这部分无法简化,因为 ( x n x_n xn ) 和 ( x m i x_m^i xmi ) 分别依赖 ( n n n ) 和 ( m m m ):
      − ∑ n = 1 N x n ∑ m = 1 N x m i -\sum_{n=1}^{N} x_n \sum_{m=1}^{N} x_m^i −n=1∑Nxnm=1∑Nxmi
  3. 第三部分 ( − ∑ n = 1 N ∑ m = 1 N x m x n i -\sum_{n=1}^{N} \sum_{m=1}^{N} x_m x_n^i −∑n=1N∑m=1Nxmxni ):

    • 这部分与第二部分对称,结果应该是相同的:
      − ∑ n = 1 N x n i ∑ m = 1 N x m -\sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m −n=1∑Nxnim=1∑Nxm
  4. 第四部分 ( ∑ n = 1 N ∑ m = 1 N x m x m i \sum_{n=1}^{N} \sum_{m=1}^{N} x_m x_m^i ∑n=1N∑m=1Nxmxmi ):

    • 同样可以简化为:
      N ∑ m = 1 N x m x m i N \sum_{m=1}^{N} x_m x_m^i Nm=1∑Nxmxmi

合并所有部分

将这些部分合并:

N ∑ n = 1 N x n x n i − ∑ n = 1 N x n ∑ m = 1 N x m i − ∑ n = 1 N x n i ∑ m = 1 N x m + N ∑ m = 1 N x m x m i N \sum_{n=1}^{N} x_n x_n^i - \sum_{n=1}^{N} x_n \sum_{m=1}^{N} x_m^i - \sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m + N \sum_{m=1}^{N} x_m x_m^i Nn=1∑Nxnxni−n=1∑Nxnm=1∑Nxmi−n=1∑Nxnim=1∑Nxm+Nm=1∑Nxmxmi

提取和 ( x n x_n xn ) 相关的系数

我们接下来提取与 ( x n x_n xn ) 相关的系数:

  • 第一部分 ( N x n x n i N x_n x_n^i Nxnxni ):
    N x n x n i N x_n x_n^i Nxnxni

  • 第二部分 ( − ∑ m = 1 N x m i -\sum_{m=1}^{N} x_m^i −∑m=1Nxmi ) 乘以 ( x n x_n xn ):
    − x n ∑ m = 1 N x m i -x_n \sum_{m=1}^{N} x_m^i −xnm=1∑Nxmi

  • 第三部分 ( − ∑ n = 1 N x n i ∑ m = 1 N x m -\sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m −∑n=1Nxni∑m=1Nxm ) 中不涉及 ( x n x_n xn ),因此与 ( x n x_n xn ) 无关。

  • 第四部分 ( N ∑ m = 1 N x m x m i N \sum_{m=1}^{N} x_m x_m^i N∑m=1Nxmxmi ) 也不涉及 ( x n x_n xn ),因此与 ( x n x_n xn ) 无关。

所以,最终与 ( x n x_n xn ) 相关的项的系数是:

N x n i − ∑ m = 1 N x m i N x_n^i - \sum_{m=1}^{N} x_m^i Nxni−m=1∑Nxmi

这个表达式正确地捕捉了与第 ( n n n ) 个元素 ( x n x_n xn ) 相关的部分。再次感谢你的指正,最终与 ( x n x_n xn ) 相关的系数确实应该是:

N x n i − ∑ m = 1 N x m i N x_n^i - \sum_{m=1}^{N} x_m^i Nxni−m=1∑Nxmi


∑ m = 1 N ( x n i − x m i ) = N ⋅ x n i − ∑ m = 1 N x m i \sum_{m=1}^{N} \left( x_n^i - x_m^i \right) = N \cdot x_n^i - \sum_{m=1}^{N} x_m^i m=1∑N(xni−xmi)=N⋅xni−m=1∑Nxmi

得到与 x n x_n xn 相关的系数 b [ n ] \mathbf{b}[n] b[n],即可重新将问题表示为 b T x \mathbf{b}^{\text{T}}\mathbf{x} bTx

相关推荐
DARLING Zero two♡20 分钟前
【优选算法】Pointer-Slice:双指针的算法切片(下)
java·数据结构·c++·算法·leetcode
游是水里的游1 小时前
【算法day19】回溯:分割与子集问题
算法
不想当程序猿_1 小时前
【蓝桥杯每日一题】分糖果——DFS
c++·算法·蓝桥杯·深度优先
南城花随雪。2 小时前
单片机:实现FFT快速傅里叶变换算法(附带源码)
单片机·嵌入式硬件·算法
dundunmm2 小时前
机器学习之scikit-learn(简称 sklearn)
python·算法·机器学习·scikit-learn·sklearn·分类算法
古希腊掌管学习的神2 小时前
[机器学习]sklearn入门指南(1)
人工智能·python·算法·机器学习·sklearn
波音彬要多做2 小时前
41 stack类与queue类
开发语言·数据结构·c++·学习·算法
程序员老冯头4 小时前
第十五章 C++ 数组
开发语言·c++·算法
AC使者8 小时前
5820 丰富的周日生活
数据结构·算法
cwj&xyp9 小时前
Python(二)str、list、tuple、dict、set
前端·python·算法