pytorch张量运算的广播机制

PyTorch 的广播机制(broadcasting)是指在进行张量运算时,自动扩展较小张量的形状以匹配较大张量的形状,使它们能够进行逐元素运算。广播机制避免了手动扩展张量的繁琐过程,并且在不增加内存开销的情况下进行高效计算。

广播规则

  1. 比较张量的形状:从后向前比较两个张量的每个维度(即从最右边的维度开始)。
  2. 维度匹配
    • 如果两个维度相等,则可以进行运算。
    • 如果一个张量在该维度上为 1,另一个张量为任意数值,则形状为 1 的张量会沿着该维度扩展,以匹配另一个张量的形状。
    • 如果两个张量在某个维度上不相等且没有一个是 1,则无法进行广播,运算会抛出错误。

广播机制的示例代码

1. 标量与张量的运算
复制代码
import torch

# 标量和张量相加
scalar = torch.tensor(3)
tensor = torch.tensor([1, 2, 3])

result = scalar + tensor
print(result)  # 输出: tensor([4, 5, 6])
2. 不同形状的张量运算
复制代码
import torch

# 创建两个形状不同的张量
A = torch.tensor([[1, 2, 3], [4, 5, 6]])  # 形状为 [2, 3]
B = torch.tensor([1, 2, 3])              # 形状为 [3]

# B 张量的形状会沿着第一个维度自动扩展为 [2, 3]
result = A + B 
print(result)   # 输出: tensor([[2, 4, 6], [5, 7, 9]])
3. 高维张量的广播
复制代码
import torch

# 形状为 [2, 1, 3]
C = torch.tensor([[[1, 2, 3]], [[4, 5, 6]]])

# 形状为 [3]
D = torch.tensor([1, 2, 3])

# D 张量的形状会沿着第一个和第二个维度扩展为 [2, 1, 3]
result = C + D  
print(result)   # 输出: tensor([[[ 2,  4,  6]], [[ 5,  7,  9]]])
4. 不兼容的张量运算
复制代码
import torch

# 形状为 [2, 3]
E = torch.tensor([[1, 2, 3], [4, 5, 6]])

# 形状为 [2]
F = torch.tensor([1, 2])

# 尝试进行运算将抛出错误,因为 E 和 F 在最后一个维度上不匹配
try:
    result = E + F  # 形状不兼容,会抛出错误
except RuntimeError as e:
    print("Error:", e)

总结

广播机制极大简化了张量运算的代码编写,特别是在处理不同行数和列数的张量时。理解广播机制能够帮助你编写更高效、简洁的代码,并充分利用 PyTorch 的计算能力。

相关推荐
华玥作者3 小时前
[特殊字符] VitePress 对接 Algolia AI 问答(DocSearch + AI Search)完整实战(下)
前端·人工智能·ai
AAD555888993 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
王建文go3 小时前
RAG(宠物健康AI)
人工智能·宠物·rag
ALINX技术博客4 小时前
【202601芯动态】全球 FPGA 异构热潮,ALINX 高性能异构新品预告
人工智能·fpga开发·gpu算力·fpga
易营宝4 小时前
多语言网站建设避坑指南:既要“数据同步”,又能“按市场个性化”,别踩这 5 个坑
大数据·人工智能
春日见4 小时前
vscode代码无法跳转
大数据·人工智能·深度学习·elasticsearch·搜索引擎
Drgfd5 小时前
真智能 vs 伪智能:天选 WE H7 Lite 用 AI 人脸识别 + 呼吸灯带,重新定义智能化充电桩
人工智能·智能充电桩·家用充电桩·充电桩推荐
DeniuHe5 小时前
torch.distribution函数详解
pytorch
好家伙VCC5 小时前
### WebRTC技术:实时通信的革新与实现####webRTC(Web Real-TimeComm
java·前端·python·webrtc
萤丰信息5 小时前
AI 筑基・生态共荣:智慧园区的价值重构与未来新途
大数据·运维·人工智能·科技·智慧城市·智慧园区