torch.bmm功能解读

bmmbatched matrix multiple 的简写,即批量矩阵乘法,矩阵是二维的,加上batch一个维度,因此该函数的输入必须是两个三维的 tensor,三个维度代表的含义分别是:(批量,行,列)。

对于 torch.bmm(tensor_a, tensor_b) 而言,

tensor_ashape为 (a, b, c)

tensor_bshape为 (d, e, f)

要求 a = d, c = e,即批量数相同,在计算时tensor_a 的第 i 个矩阵与 tensor_b 的第 i 个矩阵作乘法,i = 1, 2, 3, ..., a。因此为了矩阵乘法能够进行,c 和 e 必须相同。计算过程如图1所示。
图1. bmm计算过程

测试代码如下:

python 复制代码
import torch

BatchMatrix1 = torch.randn((3,4,3))
BatchMatrix2 = torch.randn((3,3,4))

BatchMatrixMultiple = torch.bmm(BatchMatrix1, BatchMatrix2)

print(BatchMatrixMultiple.shape)

输出为,与图1中绿色矩阵对应。

相关推荐
TG:@yunlaoda360 云老大2 分钟前
AI 电影制作迈入新阶段:谷歌云Veo 3.1模型发布,实现音频全覆盖与精细化创意剪辑
人工智能·云计算·音视频·googlecloud
木头左6 分钟前
机器学习用于股票预测的策略
人工智能·机器学习
陈天伟教授7 分钟前
人工智能技术-人工智能与科学-04 预测蛋白质结构
人工智能
智算菩萨13 分钟前
GPT-5.1:在 GPT-5 能力基线之上的体验升级、自适应推理与安全新范式
人工智能·机器学习·chatgpt
t1987512839 分钟前
基于盲源分离与贝叶斯非局部均值(BM3D)的图像降噪算法实现
算法·计算机视觉·均值算法
2501_9411118443 分钟前
分布式日志系统实现
开发语言·c++·算法
小oo呆43 分钟前
【自然语言处理与大模型】主题建模 Topic Modeling
人工智能·自然语言处理
KKKlucifer1 小时前
从被动合规到主动免疫:AI 破解数据智能安全的四大核心场景
人工智能·安全
权泽谦1 小时前
脑肿瘤分割与分类的人工智能研究报告
人工智能·分类·数据挖掘
余俊晖1 小时前
文档图像旋转对VLM OCR的影响及基于Phi-3.5-Vision+分类头的文档方向分类器、及数据构建思路
人工智能·分类·ocr