从矩阵展开逆推矩阵形式简单推导示例

这里写自定义目录标题

    • 问题1
    • 问题1求解
    • 问题2
    • 问题2求解
      • [??????能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:](#??????能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:)
      • 合并所有部分
      • [提取和 \( x n x_n xn \) 相关的系数](#提取和 x n x_n xn 相关的系数)

问题1

已知矩阵展开形式:
∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ ( x n 2 + x m 2 − 2 x n x m ) (1) \sum_{n=1}^{N}\sum_{m=1}^{N} \left | w_n w_m \right | \left ( x_n^2 + x_m^2 - 2 x_n x_m \right ) \tag{1} n=1∑Nm=1∑N∣wnwm∣(xn2+xm2−2xnxm)(1)

已知
w ˉ ≜ ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ T \bar{\boldsymbol{w}}\triangleq\|w_1\|,\|w_2\|,\\ldots,\|w_N\|^\mathsf{T} wˉ≜∣w1∣,∣w2∣,...,∣wN∣T

并且 x i ≜ x 1 i , x 2 i , ... , x N i T \boldsymbol{x}^i\triangleqx_1\^i,x_2\^i,\\ldots,x_N\^i^\mathsf{T} xi≜x1i,x2i,...,xNiT

x ≜ x 1 , x 2 , ... , x N T \boldsymbol{x}\triangleqx_1,x_2,\\ldots,x_N^\mathsf{T} x≜x1,x2,...,xNT

将式(1)表达成 x T A x \boldsymbol{x}^T\mathbf{A}\boldsymbol{x} xTAx的形式。

问题1求解


考虑给定的矩阵展开形式:

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ ( x n 2 + x m 2 − 2 x n x m ) \sum_{n=1}^{N}\sum_{m=1}^{N} |w_n w_m| (x_n^2 + x_m^2 - 2 x_n x_m) n=1∑Nm=1∑N∣wnwm∣(xn2+xm2−2xnxm)

我们可以将其分解为三个部分:

  1. ( ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n 2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n^2 ∑n=1N∑m=1N∣wnwm∣xn2 )
  2. ( ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x m 2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_m^2 ∑n=1N∑m=1N∣wnwm∣xm2 )
  3. ( − 2 ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n x m -2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n x_m −2∑n=1N∑m=1N∣wnwm∣xnxm )

首先看前两项:

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n 2 = ∑ n = 1 N x n 2 ∑ m = 1 N ∣ w n w m ∣ = ∑ n = 1 N ∣ w n ∣ x n 2 ∑ m = 1 N ∣ w m ∣ \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n^2 = \sum_{n=1}^{N} x_n^2 \sum_{m=1}^{N} |w_n w_m| = \sum_{n=1}^{N} |w_n| x_n^2 \sum_{m=1}^{N} |w_m| n=1∑Nm=1∑N∣wnwm∣xn2=n=1∑Nxn2m=1∑N∣wnwm∣=n=1∑N∣wn∣xn2m=1∑N∣wm∣

同理,

∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x m 2 = ∑ m = 1 N x m 2 ∑ n = 1 N ∣ w n w m ∣ = ∑ m = 1 N ∣ w m ∣ x m 2 ∑ n = 1 N ∣ w n ∣ \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_m^2 = \sum_{m=1}^{N} x_m^2 \sum_{n=1}^{N} |w_n w_m| = \sum_{m=1}^{N} |w_m| x_m^2 \sum_{n=1}^{N} |w_n| n=1∑Nm=1∑N∣wnwm∣xm2=m=1∑Nxm2n=1∑N∣wnwm∣=m=1∑N∣wm∣xm2n=1∑N∣wn∣

所以,这两项可以合并为:

2 ( ∑ n = 1 N ∣ w n ∣ x n 2 ∑ m = 1 N ∣ w m ∣ ) 2 \left( \sum_{n=1}^{N} |w_n| x_n^2 \sum_{m=1}^{N} |w_m| \right) 2(n=1∑N∣wn∣xn2m=1∑N∣wm∣)

C = ∑ m = 1 N ∣ w m ∣ C = \sum_{m=1}^{N} |w_m| C=m=1∑N∣wm∣

则前两项合并后可以写成:

2 C ∑ n = 1 N ∣ w n ∣ x n 2 2C \sum_{n=1}^{N} |w_n| x_n^2 2Cn=1∑N∣wn∣xn2

这可以表示为:

2 C x T diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) x 2C \boldsymbol{x}^\mathsf{T} \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) \boldsymbol{x} 2CxTdiag(∣w1∣,∣w2∣,...,∣wN∣)x

现在看第三项:

− 2 ∑ n = 1 N ∑ m = 1 N ∣ w n w m ∣ x n x m -2 \sum_{n=1}^{N} \sum_{m=1}^{N} |w_n w_m| x_n x_m −2n=1∑Nm=1∑N∣wnwm∣xnxm

我们定义:

W = w ˉ w ˉ T \mathbf{W} = \bar{\boldsymbol{w}} \bar{\boldsymbol{w}}^\mathsf{T} W=wˉwˉT

其中,

w ˉ = ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ T \bar{\boldsymbol{w}} = \|w_1\|, \|w_2\|, \\ldots, \|w_N\|^\mathsf{T} wˉ=∣w1∣,∣w2∣,...,∣wN∣T

则第三项可以写成:

− 2 x T W x -2 \boldsymbol{x}^\mathsf{T} \mathbf{W} \boldsymbol{x} −2xTWx

综上所述,我们将所有项合并起来:

2 C x T diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) x − 2 x T W x 2C \boldsymbol{x}^\mathsf{T} \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) \boldsymbol{x} - 2 \boldsymbol{x}^\mathsf{T} \mathbf{W} \boldsymbol{x} 2CxTdiag(∣w1∣,∣w2∣,...,∣wN∣)x−2xTWx

所以,矩阵 ( A \mathbf{A} A) 可以表示为:

A = 2 C diag ( ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ ) − 2 W \mathbf{A} = 2C \text{diag}(|w_1|, |w_2|, \ldots, |w_N|) - 2 \mathbf{W} A=2Cdiag(∣w1∣,∣w2∣,...,∣wN∣)−2W

这里,( W = w ˉ w ˉ T \mathbf{W} = \bar{\boldsymbol{w}} \bar{\boldsymbol{w}}^\mathsf{T} W=wˉwˉT), ( w ˉ = ∣ w 1 ∣ , ∣ w 2 ∣ , ... , ∣ w N ∣ T \bar{\boldsymbol{w}} = \|w_1\|, \|w_2\|, \\ldots, \|w_N\|^\mathsf{T} wˉ=∣w1∣,∣w2∣,...,∣wN∣T), ( C = ∑ m = 1 N ∣ w m ∣ C = \sum_{m=1}^{N} |w_m| C=∑m=1N∣wm∣)。

问题2

∑ n = 1 N ∑ m = 1 N ( x n − x m ) ( x n i − x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N}\left ( x_n - x_m \right ) \left ( x_n^i - x_m^i \right ) n=1∑Nm=1∑N(xn−xm)(xni−xmi)

提取某个 x i x_i xi前相关的系数

问题2求解

???能不能把 x \mathbf{x} x中的第 n n n个元素前面的系数凑成 ∑ m = 1 N ( x n i − x m i ) \sum_{m=1}^{N} \left ( x_n^i - x_m^i \right ) ∑m=1N(xni−xmi)的形式:

我们从原始表达式开始:

∑ n = 1 N ∑ m = 1 N ( x n − x m ) ( x n i − x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N} \left( x_n - x_m \right) \left( x_n^i - x_m^i \right) n=1∑Nm=1∑N(xn−xm)(xni−xmi)

将这个表达式展开:

∑ n = 1 N ∑ m = 1 N ( x n x n i − x n x m i − x m x n i + x m x m i ) \sum_{n=1}^{N} \sum_{m=1}^{N} \left( x_n x_n^i - x_n x_m^i - x_m x_n^i + x_m x_m^i \right) n=1∑Nm=1∑N(xnxni−xnxmi−xmxni+xmxmi)

接下来分解为四个部分:

  1. 第一部分 ( ∑ n = 1 N ∑ m = 1 N x n x n i \sum_{n=1}^{N} \sum_{m=1}^{N} x_n x_n^i ∑n=1N∑m=1Nxnxni ):

    • 由于 ( x n x_n xn ) 和 ( x n i x_n^i xni ) 都与 ( m m m ) 无关,可以直接简化为:
      N ∑ n = 1 N x n x n i N \sum_{n=1}^{N} x_n x_n^i Nn=1∑Nxnxni
  2. 第二部分 ( − ∑ n = 1 N ∑ m = 1 N x n x m i -\sum_{n=1}^{N} \sum_{m=1}^{N} x_n x_m^i −∑n=1N∑m=1Nxnxmi ):

    • 这部分无法简化,因为 ( x n x_n xn ) 和 ( x m i x_m^i xmi ) 分别依赖 ( n n n ) 和 ( m m m ):
      − ∑ n = 1 N x n ∑ m = 1 N x m i -\sum_{n=1}^{N} x_n \sum_{m=1}^{N} x_m^i −n=1∑Nxnm=1∑Nxmi
  3. 第三部分 ( − ∑ n = 1 N ∑ m = 1 N x m x n i -\sum_{n=1}^{N} \sum_{m=1}^{N} x_m x_n^i −∑n=1N∑m=1Nxmxni ):

    • 这部分与第二部分对称,结果应该是相同的:
      − ∑ n = 1 N x n i ∑ m = 1 N x m -\sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m −n=1∑Nxnim=1∑Nxm
  4. 第四部分 ( ∑ n = 1 N ∑ m = 1 N x m x m i \sum_{n=1}^{N} \sum_{m=1}^{N} x_m x_m^i ∑n=1N∑m=1Nxmxmi ):

    • 同样可以简化为:
      N ∑ m = 1 N x m x m i N \sum_{m=1}^{N} x_m x_m^i Nm=1∑Nxmxmi

合并所有部分

将这些部分合并:

N ∑ n = 1 N x n x n i − ∑ n = 1 N x n ∑ m = 1 N x m i − ∑ n = 1 N x n i ∑ m = 1 N x m + N ∑ m = 1 N x m x m i N \sum_{n=1}^{N} x_n x_n^i - \sum_{n=1}^{N} x_n \sum_{m=1}^{N} x_m^i - \sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m + N \sum_{m=1}^{N} x_m x_m^i Nn=1∑Nxnxni−n=1∑Nxnm=1∑Nxmi−n=1∑Nxnim=1∑Nxm+Nm=1∑Nxmxmi

提取和 ( x n x_n xn ) 相关的系数

我们接下来提取与 ( x n x_n xn ) 相关的系数:

  • 第一部分 ( N x n x n i N x_n x_n^i Nxnxni ):
    N x n x n i N x_n x_n^i Nxnxni

  • 第二部分 ( − ∑ m = 1 N x m i -\sum_{m=1}^{N} x_m^i −∑m=1Nxmi ) 乘以 ( x n x_n xn ):
    − x n ∑ m = 1 N x m i -x_n \sum_{m=1}^{N} x_m^i −xnm=1∑Nxmi

  • 第三部分 ( − ∑ n = 1 N x n i ∑ m = 1 N x m -\sum_{n=1}^{N} x_n^i \sum_{m=1}^{N} x_m −∑n=1Nxni∑m=1Nxm ) 中不涉及 ( x n x_n xn ),因此与 ( x n x_n xn ) 无关。

  • 第四部分 ( N ∑ m = 1 N x m x m i N \sum_{m=1}^{N} x_m x_m^i N∑m=1Nxmxmi ) 也不涉及 ( x n x_n xn ),因此与 ( x n x_n xn ) 无关。

所以,最终与 ( x n x_n xn ) 相关的项的系数是:

N x n i − ∑ m = 1 N x m i N x_n^i - \sum_{m=1}^{N} x_m^i Nxni−m=1∑Nxmi

这个表达式正确地捕捉了与第 ( n n n ) 个元素 ( x n x_n xn ) 相关的部分。再次感谢你的指正,最终与 ( x n x_n xn ) 相关的系数确实应该是:

N x n i − ∑ m = 1 N x m i N x_n^i - \sum_{m=1}^{N} x_m^i Nxni−m=1∑Nxmi


∑ m = 1 N ( x n i − x m i ) = N ⋅ x n i − ∑ m = 1 N x m i \sum_{m=1}^{N} \left( x_n^i - x_m^i \right) = N \cdot x_n^i - \sum_{m=1}^{N} x_m^i m=1∑N(xni−xmi)=N⋅xni−m=1∑Nxmi

得到与 x n x_n xn 相关的系数 b n \mathbf{b}n bn,即可重新将问题表示为 b T x \mathbf{b}^{\text{T}}\mathbf{x} bTx

相关推荐
lqqjuly4 分钟前
前沿算法深度解析(二)
人工智能·算法·机器学习
徐小夕1 小时前
万字长文!千万级文档 RAG 知识库系统落地实践
前端·算法·github
akunkuntaimei2 小时前
2026年高考数学各省真题及答案(完整版)
算法·高考
Hello:CodeWorld2 小时前
C 风格变参 vs C++ 变参模板:核心区别与选型指南
c语言·c++·算法
8Qi84 小时前
LeetCode 516:最长回文子序列
算法·leetcode·职场和发展·动态规划
youngerwang5 小时前
【从搬运工到协处理器:网卡芯片架构、算法、验证与边缘演进深度剖析】
网络·算法·架构·芯片
KaMeidebaby5 小时前
卡梅德生物技术快报|纯化重组蛋白实操详解
人工智能·python·tcp/ip·算法·机器学习
dingzd956 小时前
跨境社媒运营越到后面 越比拼账号的表达稳定性
大数据·人工智能·矩阵·内容营销
手写码匠6 小时前
从零实现 Prompt 工程引擎:结构化提示、自动优化与多轮自省体系
人工智能·深度学习·算法·aigc
无限码力6 小时前
阿里算法岗 0530笔试真题 - 多约束条件下的元素匹配统计
算法·阿里笔试真题·阿里机试真题·阿里算法岗笔试