Pytorch中的广播机制

一、广播(broadcast)机制概述

在PyTorch中,广播机制(Broadcast)允许对不同形状的张量执行逐元素操作,而无需显式地复制数据。这一机制使得编写代码更加简洁和高效。广播机制遵循一定的规则来扩展较小的张量,使其与较大的张量具有相同的形状

二、广播机制规则:

如果遵守以下规则,则两个张量tensor是可广播的:

(1)每个张量tensor至少有一个维度;

(2)遍历两个张量的所有维度时,从末尾随开始遍历。两个tensor张量如果维度(维度的数目)相等或两个tensor张量的维度不等且其中一个维度为1或不存在,那么这两个张量是可以广播的;如果两个tensor张量的维度不等且其中一个维度不为1则不能进行广播

如果两个张量是"可广播的",则计算过程遵循下列规则:

(1)如果两个张量tensor的维度不同则在维度较小的tensor的前面增加维度使它们维度相等;

(2)对于每个维度计算结果的维度值取两个张量tensor中较大的那个值;

(3)两个张量tensor扩展维度的过程是将数值进行复制

相关推荐
牛奶9 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶9 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考12 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab13 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab13 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
孟健14 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
格砸14 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云14 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny86514 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔15 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能