Numpy broadcasting规则

Numpy的broadcast操作是为了将两个不同形状的数组,通过一系列规则,变换成形状相同的数组,从而使得它们之间可以进行按元素进行的计算。

Broadcasting的机制并不复杂,只要记住以下几条规则就可以了:

1. 顺序。首先,需要对两个数组的维度进行对其,对齐的顺序是从右向左进行的。也就是说,每个数组的最内侧的维度互相对应,然后依次向外进行匹配。

2. 匹配。两个数组的每一个维度都要匹配。所谓匹配,就是满足下面两个条件之一:

  1. 两个维度的长度相等

  2. 其中一个维度的长度为1

如果两个数组的维度个数不相等,那么维度较少的数组将被扩展到具有相同的维度,新维度的长度均为1。

作为例子,下面两个数组的每个维度都是匹配的

复制代码
A      (4d array):  8 x 1 x 6 x 1
B      (3d array):      7 x 1 x 5

B比A少一个维度,所以在做广播时,它会被扩展出一个长度为1的新维度。

作为反例,下面两个数组是不匹配的

复制代码
A      (2d array):      2 x 1
B      (3d array):  8 x 4 x 3 # second from last dimensions mismatched

可以看到,A的第一个维度和B的第二个维度既不相等,也不为1。

3. 扩展。在进行广播的时候,会将对应维度扩展成同样的长度。因为在匹配检测中已经确保长度要么相同要么其中一个长度是1,所以扩展的过程其实就是将数组在该维度下复制多分,知道两个匹配的维度长度相等。

复制代码
A      (4d array):  8 x 1 x 6 x 1
B      (3d array):      7 x 1 x 5
Result (4d array):  8 x 7 x 6 x 5

4. 结果。如果广播成功,则两个数组的运算结果满足

  1. 维度个数为两个矩阵最多的维度数

  2. 每个维度的长度均为两个数组中对应维度最长的那个

只要记住上面4条原则,就不难理解广播是怎么进行的了。

最后需要指出的是,虽然broadcasting可以减少代码量,使得实现看起来更优雅,但是它也并不是没有代价的。尤其是,在计算过程中产生的中间结果可能会占用大量内存。因此,如果运算的数组规模比较大,那么还是老老实实的用循环好了。

相关推荐
fen_fen6 小时前
numpy学习笔记10:arr *= 2向量化操作性能优化
学习笔记·numpy
杜子腾dd16 小时前
20. Excel 自动化:Excel 对象模型
运维·python·数据挖掘·自动化·excel·numpy·pandas
赛卡4 天前
自动驾驶背后的数学:特征提取中的线性变换与非线性激活
人工智能·python·机器学习·自动驾驶·numpy
杜子腾dd4 天前
17.使用读写包操作Excel文件:pyxlsb 包
python·数据挖掘·excel·numpy·pandas
fen_fen4 天前
numpy学习笔记8:数组属性和基础操作的详细描述
学习笔记·numpy
杜子腾dd5 天前
19.如何使用 pandas 处理大型 Excel 文件:并行读取工作表
大数据·人工智能·数据分析·excel·numpy·pandas
蔗理苦5 天前
2025-03-15 Python&深度学习2——Numpy库
pytorch·python·深度学习·numpy
RedefineLim.5 天前
PyTorch vs NumPy:核心区别与选择指南
人工智能·pytorch·numpy
Mryan20055 天前
NumPy系列 - 创建矩阵
数据结构·python·线性代数·矩阵·numpy