torch.bmm功能解读

bmmbatched matrix multiple 的简写,即批量矩阵乘法,矩阵是二维的,加上batch一个维度,因此该函数的输入必须是两个三维的 tensor,三个维度代表的含义分别是:(批量,行,列)。

对于 torch.bmm(tensor_a, tensor_b) 而言,

tensor_ashape为 (a, b, c)

tensor_bshape为 (d, e, f)

要求 a = d, c = e,即批量数相同,在计算时tensor_a 的第 i 个矩阵与 tensor_b 的第 i 个矩阵作乘法,i = 1, 2, 3, ..., a。因此为了矩阵乘法能够进行,c 和 e 必须相同。计算过程如图1所示。
图1. bmm计算过程

测试代码如下:

python 复制代码
import torch

BatchMatrix1 = torch.randn((3,4,3))
BatchMatrix2 = torch.randn((3,3,4))

BatchMatrixMultiple = torch.bmm(BatchMatrix1, BatchMatrix2)

print(BatchMatrixMultiple.shape)

输出为,与图1中绿色矩阵对应。

相关推荐
free_73几秒前
超越“回答”,AI Agent迎来全链路安全治理挑战
人工智能·python·网络安全
召田最帅boy2 分钟前
SpringBoot实现AI智能评论审核与自动回复
人工智能·spring boot·后端·架构
德育处主任2 分钟前
『n8n』If组件的用法
人工智能·aigc·工作流引擎
qq_417695056 分钟前
内存对齐与缓存友好设计
开发语言·c++·算法
2301_816651227 分钟前
实时系统下的C++编程
开发语言·c++·算法
2401_831824968 分钟前
C++与Python混合编程实战
开发语言·c++·算法
菩提树下的凡夫13 分钟前
激光应用1---影响激光光斑大小和功率密度的因素
人工智能
2301_8166512215 分钟前
C++中的策略模式高级应用
开发语言·c++·算法
AI-Ming17 分钟前
注意力机制拓展-大模型知识点(程序员转行AI大模型学习)
人工智能·学习