解释PyTorch中的广播机制

子燕若水2025-04-27 13:30

广播（Broadcasting）是PyTorch和其他数值计算库中的一个重要机制，它允许不同形状的张量进行算术运算。在您提供的例子中：

广播机制的工作原理

当两个形状不同的张量进行算术运算时，PyTorch会尝试将它们扩展到兼容的形状，而不需要实际复制数据。广播遵循以下规则：

从尾部维度开始比较两个张量的形状
如果对应维度相等或其中一个维度为1，则兼容
如果一个张量的维度更少，则在前面添加尺寸为1的维度

您例子中的广播过程

在您的例子中：

img_size 形状为 (1, 1, 2)
landmarks 形状为 (1, 478, 2)

广播时发生的变化：

第一个维度：1 = 1（兼容）
第二个维度：1 < 478（img_size被广播到478）
第三个维度：2 = 2（兼容）

实际执行时，PyTorch会"假装"img_size的形状是(1, 478, 2)，将单个(1, 1, 2)值复制到所有478个关键点位置，而不实际分配更多内存。

计算效果

对于每个关键点坐标landmarks[0, i, :]（归一化到[0,1]范围）
乘以对应的图像尺寸img_size[0, 0, :]（像素值，如[256, 256]）
结果：所有坐标从归一化值转换为实际像素坐标

这比手动循环每个坐标点进行缩放要高效得多，充分利用了PyTorch的向量化计算能力。

上一篇：C++23中if consteval / if not consteval (P1938R3) 详解

下一篇：分布式事务在点赞功能中的实现

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05OpenClaw优化飞书API 额度已耗尽问题 06Window 10部署openclaw报错node.exe : npm error code 128 07小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09OpenClaw大龙虾机器人完整安装教程 10网站改了域名，如何查找？