torch.bmm功能解读

bmmbatched matrix multiple 的简写,即批量矩阵乘法,矩阵是二维的,加上batch一个维度,因此该函数的输入必须是两个三维的 tensor,三个维度代表的含义分别是:(批量,行,列)。

对于 torch.bmm(tensor_a, tensor_b) 而言,

tensor_ashape为 (a, b, c)

tensor_bshape为 (d, e, f)

要求 a = d, c = e,即批量数相同,在计算时tensor_a 的第 i 个矩阵与 tensor_b 的第 i 个矩阵作乘法,i = 1, 2, 3, ..., a。因此为了矩阵乘法能够进行,c 和 e 必须相同。计算过程如图1所示。
图1. bmm计算过程

测试代码如下:

python 复制代码
import torch

BatchMatrix1 = torch.randn((3,4,3))
BatchMatrix2 = torch.randn((3,3,4))

BatchMatrixMultiple = torch.bmm(BatchMatrix1, BatchMatrix2)

print(BatchMatrixMultiple.shape)

输出为,与图1中绿色矩阵对应。

相关推荐
potato_may4 分钟前
C++ 发展简史与核心语法入门
开发语言·c++·算法
Liangwei Lin6 分钟前
洛谷 P1443 马的遍历
数据结构·算法
老鱼说AI8 分钟前
算法基础教学第二步:数组(超级详细原理级别讲解)
数据结构·神经网络·算法·链表
问知AI13 分钟前
InsightMatrix:问知AI的核心基座大模型
人工智能·科技·ai写作·内容运营
深圳佛手22 分钟前
实例说明大模型参数到底是什么
人工智能
青云交22 分钟前
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的跨语言信息检索与知识融合
机器学习·自然语言处理·java 大数据·知识融合·跨语言信息检索·多语言知识图谱·低资源语言处理
OpenCSG25 分钟前
智源Emu3.5发布:34B参数的世界模型基座,以“下一状态预测”重塑多模态Scaling范式
人工智能·开源
leo_23225 分钟前
SMP(软件制作平台)到底是什么?--小视频番外篇之一
人工智能·科技创新·smp(软件制作平台)·中国语言
youcans_26 分钟前
【DeepSeek 论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
论文阅读·人工智能·语言模型·智能体·deepseek
_Twink1e28 分钟前
【HCIA-AIV4.0】2025题库+解析(二)
人工智能·深度学习·机器学习