广播
在python中,广播可以简化为"自动扩展匹配"
注意:python中的矩阵运算,都是对应位置的元素之间的运算,即"点运算"。
在神经网络中,主要会用到的两种情况:
-
向量与常数:
n n n 维行向量( 1 × n 1×n 1×n 矩阵)和常数进行运算,python 会自动将该常数复制填充成 1 × n 1×n 1×n 矩阵( n n n 维列向量同理,就不写例子了)。
[ 1 2 3 ] + 100 → [ 1 2 3 ] + [ 100 100 100 ] = [ 101 102 103 ] \left[ \begin{matrix} 1\\ 2\\ 3\\ \end{matrix} \right]+100→\left[ \begin{matrix} 1\\ 2\\ 3\\ \end{matrix} \right]+\left[ \begin{matrix} 100\\ 100\\ 100\\ \end{matrix} \right]=\left[ \begin{matrix} 101\\ 102\\ 103\\ \end{matrix} \right] 123 +100→ 123 + 100100100 = 101102103 -
向量与矩阵:
m × n m×n m×n 矩阵和 n n n 维行向量( 1 × n 1×n 1×n 矩阵)进行运算。python 会自动将该 1 × n 1×n 1×n 矩阵复制填充成 m × n m×n m×n 矩阵( m m m 维列向量同理)。
举例:
[ 1 2 3 4 5 6 ] + [ 100 200 300 ] → [ 1 2 3 4 5 6 ] + [ 100 200 300 100 200 300 ] = [ 101 202 303 104 205 306 ] \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 200 & 300\\ \end{matrix} \right]→\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 200 & 300\\ 100 & 200 & 300\\ \end{matrix} \right]=\left[ \begin{matrix} 101 & 202 & 303\\ 104 & 205 & 306\\ \end{matrix} \right] [142536]+[100200300]→[142536]+[100100200200300300]=[101104202205303306][ 1 2 3 4 5 6 ] + [ 100 200 ] → [ 1 2 3 4 5 6 ] + [ 100 100 100 200 200 200 ] = [ 101 102 103 204 205 206 ] \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100\\ 200\\ \end{matrix} \right]→\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 100 & 100\\ 200 & 200 & 200\\ \end{matrix} \right]=\left[ \begin{matrix} 101 & 102 & 103\\ 204 & 205 & 206\\ \end{matrix} \right] [142536]+[100200]→[142536]+[100200100200100200]=[101204102205103206]
☆以上两种情况,两个矩阵的行和列必须要有一个维度相同。
实例
python
import numpy as np
# 定义矩阵A
A = np.array([[56.0,0.0,4.4,68.0]
[1.2,104.0,52.0,8.0],
[1.8,135.0,99.0,0.9]])
# 沿着矩阵A的纵轴求和
cal = A.sum(axis=0) # axis=1就是沿着横轴求和
print(cal)
# 进行矩阵广播运算
percentage = 100*A/cal.reshape(1,4)
print(percentage)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 输出结果为:
[59 239 155.4 76.9]
[[94.91525424 0. 2.83140283 88.42652796]
[ 2.03389831 43.51464435 33.46203346 10.40312094]
[ 3.05084746 56.48535565 63.70656371 1.17035111]]
代码编写技巧
-
在创建数组时,数组的维度要交代清楚,行数和列数都要给出:
-
正确的:
pythona = np.random.randn(5,1) # 使用numpy的random模块中的randn函数生成一个5行1列的数组, # 该数组中的元素是从标准正态分布(均值为0,标准差为1的正态分布)中随机抽取的。 # 输出结果为五行一列的数组
-
错误的:
pythona = np.random.randn(5) # 目的和上边代码块一样 # 但是没有指代清楚行数和列数,导致输出结果为一个秩为1的数组,既不是行向量,也不是列向量
-
-
常用附加代码:
pythonassert a.shape == (5,1) # 或者 assert(a.shape == (5,1)) # 或者 assert[a.shape == (5,1)] # 在pycharm中通常使用这一个 # 这是一个断言语句,用于确保变量a的shape属性(即a的维度)等于(5,1)。 # 如果断言的条件为假(即表达式的结果为False),则会引发一个AssertionError异常。
pythona = a.reshape((5,1)) # 将变量a转换成五行一列的数组。