矩阵相乘torch.einsum()

einsumEinstein summation 的缩写,来源于爱因斯坦求和约定(Einstein summation convention)。这是物理学家阿尔伯特·爱因斯坦引入的一种简便记号,用于描述张量运算,特别是涉及多维数组的运算。

示例1:矩阵乘法

矩阵乘法 C=AB

python 复制代码
A = torch.randn(2, 3)
B = torch.randn(3, 4)
C = torch.einsum('ik,kj->ij', A, B)
print(C.size())  # 输出: torch.Size([2, 4])

这里,'ik,kj->ij' 的含义是:

  • A 的形状为 (2, 3),对应 ikik 分别表示第一个和第二个维度。
  • B 的形状为 (3, 4),对应 kjkj 分别表示第一个和第二个维度。
  • ->ij 表示输出张量的模式,结果为 (2, 4)
示例2:向量点积

向量点积 c=a⋅b

python 复制代码
a = torch.randn(3)
b = torch.randn(3)
c = torch.einsum('i,i->', a, b)
print(c.size())  # 输出: torch.Size([])

这里,'i,i->' 的含义是:

  • ab 都是向量,对应模式 i
  • -> 后面为空,表示结果是一个标量。
示例3:批量矩阵乘法

批量矩阵乘法

python 复制代码
A = torch.randn(10, 2, 3)
B = torch.randn(10, 3, 4)
C = torch.einsum('bij,bjk->bik', A, B)
print(C.size())  # 输出: torch.Size([10, 2, 4])

这里,'bij,bjk->bik' 的含义是:

  • A 的形状为 (10, 2, 3),对应 bijb 表示批次维度,ij 分别表示矩阵的行和列。
  • B 的形状为 (10, 3, 4),对应 bjkb 表示批次维度,jk 分别表示矩阵的行和列。
  • ->bik 表示输出张量的模式,结果为 (10, 2, 4)

示例4:逐元素相乘(哈达玛积)A.B或A × B

python 复制代码
A = torch.randn(3, 4)
B = torch.randn(3, 4)

C = torch.einsum('ij,ij->ij', A, B)
print(C.size())  # 输出: torch.Size([3, 4])

'ij,ij->ij' 表示:

  • AB 都是形状为 [3, 4] 的矩阵,用 ij 表示。
  • 结果 C 也是形状为 [3, 4] 的矩阵。
  • 没有重复索引,所以不进行求和。
相关推荐
梦云澜2 小时前
论文阅读(十二):全基因组关联研究中生物通路的图形建模
论文阅读·人工智能·深度学习
远洋录3 小时前
构建一个数据分析Agent:提升分析效率的实践
人工智能·ai·ai agent
IT古董4 小时前
【深度学习】常见模型-Transformer模型
人工智能·深度学习·transformer
沐雪架构师5 小时前
AI大模型开发原理篇-2:语言模型雏形之词袋模型
人工智能·语言模型·自然语言处理
摸鱼仙人~5 小时前
Attention Free Transformer (AFT)-2020论文笔记
论文阅读·深度学习·transformer
python算法(魔法师版)5 小时前
深度学习深度解析:从基础到前沿
人工智能·深度学习
kakaZhui6 小时前
【llm对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
人工智能·深度学习·chatgpt·aigc·llama
struggle20257 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥7 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
云空8 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析