使用torch普通算子组合替代torch.einsum爱因斯坦求和

1. torch.einsum('bnd, bmd->bnm', x, y)

torch.einsum('bnd, bmd->bnm', x, y) 表示的是对张量 x 和 y 进行特定的求和和维度变换。

具体来说,这个操作的输入是两个形状为 b, n, db, m, d 的张量 x 和 y,输出是一个形状为 b, n, m 的张量 z。其计算过程可以理解为:对于每个 b,zb, n, m 等于 xb, n, : 和 yb, m, : 之间的点积。

为了用普通的 torch 操作符来替代 einsum,我们可以通过 torch.matmul 函数实现。这个函数可以用来执行批量矩阵乘法,并且能够很好地替代这个 einsum 操作。

具体实现如下:

python 复制代码
import torch

# 假设 x 和 y 的形状分别为 (b, n, d) 和 (b, m, d)
x = torch.randn(10, 20, 30)  # 举例
y = torch.randn(10, 15, 30)  # 举例

# einsum: z = torch.einsum('bnd, bmd->bnm', x, y)
# 可以转换为以下操作:
z = torch.matmul(x, y.transpose(-1, -2))  # z 的形状为 (b, n, m)

# 检查 z 的形状是否正确
print(z.shape)

2. torch.einsum('ij,jk->ik', A, B)

可以用普通的矩阵乘法 torch.matmul 替代

具体实现如下:

python 复制代码
import torch

A = torch.rand(3, 4)
B = torch.rand(4, 5)

# 使用 einsum
result_einsum = torch.einsum('ij,jk->ik', A, B)

# 使用 matmul
result_matmul = torch.matmul(A, B)

# 验证结果相同
print(torch.allclose(result_einsum, result_matmul))

3. torch.einsum('bij,bjk->bik', A, B)

可以用 torch.bmm 来替代

具体实现如下:

python 复制代码
import torch

A = torch.rand(10, 3, 4)
B = torch.rand(10, 4, 5)

# 使用 einsum
result_einsum = torch.einsum('bij,bjk->bik', A, B)

# 使用 bmm
result_bmm = torch.bmm(A, B)

# 验证结果相同
print(torch.allclose(result_einsum, result_bmm))

4. torch.einsum('i,i->', A, B)

向量内积,可以用 torch.dot 来替代

具体实现如下:

python 复制代码
import torch

A = torch.rand(4)
B = torch.rand(4)

# 使用 einsum
result_einsum = torch.einsum('i,i->', A, B)

# 使用 dot
result_dot = torch.dot(A, B)

# 验证结果相同
print(torch.allclose(result_einsum, result_dot))

5. torch.einsum('i,j->ij', A, B)

向量外积,可以用 torch.outer 来替代

具体实现如下:

python 复制代码
import torch

A = torch.rand(4)
B = torch.rand(5)

# 使用 einsum
result_einsum = torch.einsum('i,j->ij', A, B)

# 使用 outer
result_outer = torch.outer(A, B)

# 验证结果相同
print(torch.allclose(result_einsum, result_outer))

不同的 einsum 表达式会对应不同的替代操作,有时可能需要组合多个普通操作来达到相同的效果。如果某些 einsum 表达式太复杂,使用普通算子替代时会比较繁琐,此时建议继续使用 einsum,因为它不仅更简洁,而且通常性能优化得很好。
后续遇到其余需替换的 op 再进行更新

相关推荐
火星校尉5 分钟前
一场数据基建与消费场景的跨界实验
java·前端·数据库·python·php
Sam09279 分钟前
【AI 算法精讲 14】TF-IDF:词频与逆文档频率
人工智能·python·算法·ai
2601_9516599910 分钟前
YOLOv11 改进 - 主干网络 EfficientRep:一种旨在提高硬件效率的RepVGG风格卷积神经网络架构
深度学习·yolo·计算机视觉
直接冲冲冲21 分钟前
65-批量归一化
人工智能·深度学习·计算机视觉
FL162386312929 分钟前
养猪场耳标检测数据集VOC+YOLO格式744张1类别有增强
深度学习·yolo·机器学习
m0_5648768430 分钟前
claude agent 使用及存放位置查询
深度学习
xyz_CDragon40 分钟前
OpenAI发布首款自研芯片Jalapeño:9个月流片,AI设计芯片的时代来了
人工智能·单片机·深度学习·神经网络·芯片设计
内蒙深海大鲨鱼40 分钟前
数据操作+数据预处理
python
ai生成式引擎优化技术1 小时前
从参数驱动到认知行为驱动:SAI范式的理论转向与WSaiOS认知内核架构
python·架构·django·virtualenv·pygame
想你依然心痛1 小时前
AtomCode在Python数据科学项目中的使用体验:从数据分析到可视化
开发语言·python·数据分析