矩阵相乘torch.einsum()

einsumEinstein summation 的缩写,来源于爱因斯坦求和约定(Einstein summation convention)。这是物理学家阿尔伯特·爱因斯坦引入的一种简便记号,用于描述张量运算,特别是涉及多维数组的运算。

示例1:矩阵乘法

矩阵乘法 C=AB

python 复制代码
A = torch.randn(2, 3)
B = torch.randn(3, 4)
C = torch.einsum('ik,kj->ij', A, B)
print(C.size())  # 输出: torch.Size([2, 4])

这里,'ik,kj->ij' 的含义是:

  • A 的形状为 (2, 3),对应 ikik 分别表示第一个和第二个维度。
  • B 的形状为 (3, 4),对应 kjkj 分别表示第一个和第二个维度。
  • ->ij 表示输出张量的模式,结果为 (2, 4)
示例2:向量点积

向量点积 c=a⋅b

python 复制代码
a = torch.randn(3)
b = torch.randn(3)
c = torch.einsum('i,i->', a, b)
print(c.size())  # 输出: torch.Size([])

这里,'i,i->' 的含义是:

  • ab 都是向量,对应模式 i
  • -> 后面为空,表示结果是一个标量。
示例3:批量矩阵乘法

批量矩阵乘法

python 复制代码
A = torch.randn(10, 2, 3)
B = torch.randn(10, 3, 4)
C = torch.einsum('bij,bjk->bik', A, B)
print(C.size())  # 输出: torch.Size([10, 2, 4])

这里,'bij,bjk->bik' 的含义是:

  • A 的形状为 (10, 2, 3),对应 bijb 表示批次维度,ij 分别表示矩阵的行和列。
  • B 的形状为 (10, 3, 4),对应 bjkb 表示批次维度,jk 分别表示矩阵的行和列。
  • ->bik 表示输出张量的模式,结果为 (10, 2, 4)

示例4:逐元素相乘(哈达玛积)A.B或A × B

python 复制代码
A = torch.randn(3, 4)
B = torch.randn(3, 4)

C = torch.einsum('ij,ij->ij', A, B)
print(C.size())  # 输出: torch.Size([3, 4])

'ij,ij->ij' 表示:

  • AB 都是形状为 [3, 4] 的矩阵,用 ij 表示。
  • 结果 C 也是形状为 [3, 4] 的矩阵。
  • 没有重复索引,所以不进行求和。
相关推荐
让学习成为一种生活方式几秒前
海洋类胡萝卜素生物合成的乙酰转移酶--文献精读217
人工智能
QQ676580083 分钟前
服装计算机视觉数据集 连衣裙数据集 衣服类别识别 毛衣数据集 夹克衫AI识别 衬衫识别 裤子 数据集 yolo格式数据集
人工智能·yolo·计算机视觉·连衣裙·衣服类别·毛衣数据集·夹克衫ai
冰糖葫芦三剑客4 分钟前
人工智能生成合成内容文件元数据隐式标识说明函要怎么填写
人工智能
CV-杨帆25 分钟前
ICLR 2026 LLM安全相关论文整理
人工智能·深度学习·安全
田八32 分钟前
聊聊AI的发展史,AI的爆发并不是偶然
前端·人工智能·程序员
zandy101133 分钟前
全链路可控+极致性能,衡石HENGSHI CLI重新定义企业级BI工具的AI协作能力
大数据·人工智能·ai analytics·ai native·agent-first
广州灵眸科技有限公司33 分钟前
为RK3588注入澎湃算力:RK1820 AI加速卡完整适配与评测指南
linux·网络·人工智能·物联网·算法
小程故事多_8035 分钟前
从零吃透Transformer核心,多头注意力、残差连接与前馈网络(大白话完整版)
人工智能·深度学习·架构·aigc·transformer
xiejava101837 分钟前
写了一个WebDAV的Skill解决OpenClaw AI助手跨平台协作难题
人工智能·ai编程·智能体·openclaw
zhanghongbin0143 分钟前
AI 采集器:Claude Code、OpenAI、LiteLLM 监控
java·前端·人工智能