广播
在python中,广播可以简化为"自动扩展匹配"
注意:python中的矩阵运算,都是对应位置的元素之间的运算,即"点运算"。
在神经网络中,主要会用到的两种情况:
-
向量与常数:
n n n 维行向量( 1 × n 1×n 1×n 矩阵)和常数进行运算,python 会自动将该常数复制填充成 1 × n 1×n 1×n 矩阵( n n n 维列向量同理,就不写例子了)。
1 2 3 \] + 100 → \[ 1 2 3 \] + \[ 100 100 100 \] = \[ 101 102 103 \] \\left\[ \\begin{matrix} 1\\\\ 2\\\\ 3\\\\ \\end{matrix} \\right\]+100→\\left\[ \\begin{matrix} 1\\\\ 2\\\\ 3\\\\ \\end{matrix} \\right\]+\\left\[ \\begin{matrix} 100\\\\ 100\\\\ 100\\\\ \\end{matrix} \\right\]=\\left\[ \\begin{matrix} 101\\\\ 102\\\\ 103\\\\ \\end{matrix} \\right\] 123 +100→ 123 + 100100100 = 101102103
m × n m×n m×n 矩阵和 n n n 维行向量( 1 × n 1×n 1×n 矩阵)进行运算。python 会自动将该 1 × n 1×n 1×n 矩阵复制填充成 m × n m×n m×n 矩阵( m m m 维列向量同理)。
举例:
1 2 3 4 5 6 \] + \[ 100 200 300 \] → \[ 1 2 3 4 5 6 \] + \[ 100 200 300 100 200 300 \] = \[ 101 202 303 104 205 306 \] \\left\[ \\begin{matrix} 1 \& 2 \& 3\\\\ 4 \& 5 \& 6 \\\\ \\end{matrix} \\right\]+\\left\[ \\begin{matrix} 100 \& 200 \& 300\\\\ \\end{matrix} \\right\]→\\left\[ \\begin{matrix} 1 \& 2 \& 3\\\\ 4 \& 5 \& 6 \\\\ \\end{matrix} \\right\]+\\left\[ \\begin{matrix} 100 \& 200 \& 300\\\\ 100 \& 200 \& 300\\\\ \\end{matrix} \\right\]=\\left\[ \\begin{matrix} 101 \& 202 \& 303\\\\ 104 \& 205 \& 306\\\\ \\end{matrix} \\right\] \[142536\]+\[100200300\]→\[142536\]+\[100100200200300300\]=\[101104202205303306
1 2 3 4 5 6 \] + \[ 100 200 \] → \[ 1 2 3 4 5 6 \] + \[ 100 100 100 200 200 200 \] = \[ 101 102 103 204 205 206 \] \\left\[ \\begin{matrix} 1 \& 2 \& 3\\\\ 4 \& 5 \& 6 \\\\ \\end{matrix} \\right\]+\\left\[ \\begin{matrix} 100\\\\ 200\\\\ \\end{matrix} \\right\]→\\left\[ \\begin{matrix} 1 \& 2 \& 3\\\\ 4 \& 5 \& 6 \\\\ \\end{matrix} \\right\]+\\left\[ \\begin{matrix} 100 \& 100 \& 100\\\\ 200 \& 200 \& 200\\\\ \\end{matrix} \\right\]=\\left\[ \\begin{matrix} 101 \& 102 \& 103\\\\ 204 \& 205 \& 206\\\\ \\end{matrix} \\right\] \[142536\]+\[100200\]→\[142536\]+\[100200100200100200\]=\[101204102205103206
☆以上两种情况,两个矩阵的行和列必须要有一个维度相同。
实例
python
import numpy as np
# 定义矩阵A
A = np.array([[56.0,0.0,4.4,68.0]
[1.2,104.0,52.0,8.0],
[1.8,135.0,99.0,0.9]])
# 沿着矩阵A的纵轴求和
cal = A.sum(axis=0) # axis=1就是沿着横轴求和
print(cal)
# 进行矩阵广播运算
percentage = 100*A/cal.reshape(1,4)
print(percentage)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 输出结果为:
[59 239 155.4 76.9]
[[94.91525424 0. 2.83140283 88.42652796]
[ 2.03389831 43.51464435 33.46203346 10.40312094]
[ 3.05084746 56.48535565 63.70656371 1.17035111]]
代码编写技巧
-
在创建数组时,数组的维度要交代清楚,行数和列数都要给出:
-
正确的:
pythona = np.random.randn(5,1) # 使用numpy的random模块中的randn函数生成一个5行1列的数组, # 该数组中的元素是从标准正态分布(均值为0,标准差为1的正态分布)中随机抽取的。 # 输出结果为五行一列的数组
-
错误的:
pythona = np.random.randn(5) # 目的和上边代码块一样 # 但是没有指代清楚行数和列数,导致输出结果为一个秩为1的数组,既不是行向量,也不是列向量
-
-
常用附加代码:
pythonassert a.shape == (5,1) # 或者 assert(a.shape == (5,1)) # 或者 assert[a.shape == (5,1)] # 在pycharm中通常使用这一个 # 这是一个断言语句,用于确保变量a的shape属性(即a的维度)等于(5,1)。 # 如果断言的条件为假(即表达式的结果为False),则会引发一个AssertionError异常。
pythona = a.reshape((5,1)) # 将变量a转换成五行一列的数组。