【python深度学习】——torch.einsum|torch.bmm

【python深度学习】------torch.einsum|torch.bmm

  • [1. 基本用法与示例](#1. 基本用法与示例)
  • [2. torch.bmm](#2. torch.bmm)

1. 基本用法与示例

基本用法:

python 复制代码
torch.einsum(equation, *operands)
  • equation: 一个字符串,定义了张量操作的模式。
    使用逗号来分隔输入张量的索引,然后是一个箭头(->),接着是输出张量的索引。
  • operands: 要操作的张量。
    示例代码:
python 复制代码
import torch
A = torch.randn(2, 3)

B = torch.einsum('ij->ji', A)
# 等价于 B = A.transpose(0, 1)

C = torch.einsum('ik,kj->ij', A, B)
# 等价于 C = torch.matmul(A, B)

a = torch.randn(3)
b = torch.randn(3)
c = torch.einsum('i,i->', a, b)
# 等价于 c = torch.dot(a, b)


A = torch.randn(5, 2, 3)
B = torch.randn(5, 3, 4)
C = torch.einsum('bij,bjk->bik', A, B)
# 等价于 C = torch.bmm(A, B)


a = torch.randn(3)
b = torch.randn(4)
c = torch.einsum('i,j->ij', a, b)
# 结果是一个3x4的矩阵,等价于 c = a.unsqueeze(1) * b.unsqueeze(0)


A = torch.randn(3, 3)
trace = torch.einsum('ii->', A)
# 等价于 trace = torch.trace(A)

2. torch.bmm

全称为: batch matrix-matrix product, 批量矩阵乘法, 适用于三维张量,其中第一维表示批量大小,第二维和第三维表示矩阵的行和列

python 复制代码
torch.bmm(input, mat2, *, out=None) -> Tensor
  • input: 一个形状为 (b, n, m) 的三维张量,表示一批矩阵。
  • mat2: 一个形状为 (b, m, p) 的三维张量,表示另一批矩阵。
  • out (可选): 存储输出结果的张量。
    输出是一个形状为 (b, n, p) 的张量,其中每个矩阵是对应批次的矩阵乘法结果。

例如:

python 复制代码
import torch

# 定义两个形状为 (b, n, m) 和 (b, m, p) 的三维张量
batch_size = 10
n, m, p = 3, 4, 5

A = torch.randn(batch_size, n, m)
B = torch.randn(batch_size, m, p)

# 进行批量矩阵乘法
C = torch.bmm(A, B)

print(C.shape)  # 输出: torch.Size([10, 3, 5])

再具体的:

python 复制代码
A = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
B = torch.tensor([[[9, 10], [11, 12]], [[13, 14], [15, 16]]])

# A.shape = (2, 2, 2)
# B.shape = (2, 2, 2)
C = torch.bmm(A, B)

print(C)
# 输出:
# tensor([[[ 31,  34],
#          [ 73,  80]],
#
#         [[155, 166],
#          [211, 226]]])

其数学计算为:

相关推荐
科大饭桶14 分钟前
C++入门自学Day11-- String, Vector, List 复习
c语言·开发语言·数据结构·c++·容器
范范之交18 分钟前
JavaScript基础语法two
开发语言·前端·javascript
Felven19 分钟前
C. Game of Mathletes
c语言·开发语言
lxmyzzs38 分钟前
【图像算法 - 16】庖丁解牛:基于YOLO12与OpenCV的车辆部件级实例分割实战(附完整代码)
人工智能·深度学习·opencv·算法·yolo·计算机视觉·实例分割
点云SLAM41 分钟前
C++中内存池(Memory Pool)详解和完整示例
开发语言·c++·内存管理·内存池·new/delete·malloc/free
明心知43 分钟前
DAY 45 Tensorboard使用介绍
人工智能·深度学习
R-G-B1 小时前
OpenCV Python——Numpy基本操作(Numpy 矩阵操作、Numpy 矩阵的检索与赋值、Numpy 操作ROI)
python·opencv·numpy·numpy基本操作·numpy 矩阵操作·numpy 矩阵的检索与赋值·numpy 操作roi
细节处有神明1 小时前
Jupyter 中实现交互式图表:ipywidgets 从入门到部署
ide·python·jupyter
小小码农一只1 小时前
Python 爬虫实战:玩转 Playwright 跨浏览器自动化(Chromium/Firefox/WebKit 全支持)
爬虫·python·自动化
程高兴1 小时前
遗传算法求解冷链路径优化问题matlab代码
开发语言·人工智能·matlab