深度学习:(四)python中的广播

广播

在python中,广播可以简化为"自动扩展匹配"

注意:python中的矩阵运算,都是对应位置的元素之间的运算,即"点运算"。

在神经网络中,主要会用到的两种情况:

  • 向量与常数:

    n n n 维行向量( 1 × n 1×n 1×n 矩阵)和常数进行运算,python 会自动将该常数复制填充成 1 × n 1×n 1×n 矩阵( n n n 维列向量同理,就不写例子了)。
    [ 1 2 3 ] + 100 → [ 1 2 3 ] + [ 100 100 100 ] = [ 101 102 103 ] \left[ \begin{matrix} 1\\ 2\\ 3\\ \end{matrix} \right]+100→\left[ \begin{matrix} 1\\ 2\\ 3\\ \end{matrix} \right]+\left[ \begin{matrix} 100\\ 100\\ 100\\ \end{matrix} \right]=\left[ \begin{matrix} 101\\ 102\\ 103\\ \end{matrix} \right] 123 +100→ 123 + 100100100 = 101102103

  • 向量与矩阵:

    m × n m×n m×n 矩阵和 n n n 维行向量( 1 × n 1×n 1×n 矩阵)进行运算。python 会自动将该 1 × n 1×n 1×n 矩阵复制填充成 m × n m×n m×n 矩阵( m m m 维列向量同理)。

    举例:
    [ 1 2 3 4 5 6 ] + [ 100 200 300 ] → [ 1 2 3 4 5 6 ] + [ 100 200 300 100 200 300 ] = [ 101 202 303 104 205 306 ] \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 200 & 300\\ \end{matrix} \right]→\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 200 & 300\\ 100 & 200 & 300\\ \end{matrix} \right]=\left[ \begin{matrix} 101 & 202 & 303\\ 104 & 205 & 306\\ \end{matrix} \right] [142536]+[100200300]→[142536]+[100100200200300300]=[101104202205303306]

    [ 1 2 3 4 5 6 ] + [ 100 200 ] → [ 1 2 3 4 5 6 ] + [ 100 100 100 200 200 200 ] = [ 101 102 103 204 205 206 ] \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100\\ 200\\ \end{matrix} \right]→\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ \end{matrix} \right]+\left[ \begin{matrix} 100 & 100 & 100\\ 200 & 200 & 200\\ \end{matrix} \right]=\left[ \begin{matrix} 101 & 102 & 103\\ 204 & 205 & 206\\ \end{matrix} \right] [142536]+[100200]→[142536]+[100200100200100200]=[101204102205103206]

☆以上两种情况,两个矩阵的行和列必须要有一个维度相同。

实例

python 复制代码
import numpy as np
# 定义矩阵A
A = np.array([[56.0,0.0,4.4,68.0]
			  [1.2,104.0,52.0,8.0],
			  [1.8,135.0,99.0,0.9]])
# 沿着矩阵A的纵轴求和
cal = A.sum(axis=0) # axis=1就是沿着横轴求和
print(cal)
# 进行矩阵广播运算
percentage = 100*A/cal.reshape(1,4)
print(percentage)

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 输出结果为:
[59  239  155.4  76.9]

[[94.91525424  0.            2.83140283  88.42652796]
 [ 2.03389831  43.51464435  33.46203346  10.40312094]
 [ 3.05084746  56.48535565  63.70656371   1.17035111]]

代码编写技巧

  • 在创建数组时,数组的维度要交代清楚,行数和列数都要给出:

    • 正确的:

      python 复制代码
      a = np.random.randn(5,1)  
      # 使用numpy的random模块中的randn函数生成一个5行1列的数组,  
      # 该数组中的元素是从标准正态分布(均值为0,标准差为1的正态分布)中随机抽取的。 
      # 输出结果为五行一列的数组
    • 错误的:

      python 复制代码
      a = np.random.randn(5)  
      # 目的和上边代码块一样
      # 但是没有指代清楚行数和列数,导致输出结果为一个秩为1的数组,既不是行向量,也不是列向量
  • 常用附加代码:

    python 复制代码
    assert a.shape == (5,1)    # 或者
    assert(a.shape == (5,1))   # 或者
    assert[a.shape == (5,1)]   # 在pycharm中通常使用这一个
    
    # 这是一个断言语句,用于确保变量a的shape属性(即a的维度)等于(5,1)。
    # 如果断言的条件为假(即表达式的结果为False),则会引发一个AssertionError异常。
    python 复制代码
    a = a.reshape((5,1))
    # 将变量a转换成五行一列的数组。
相关推荐
shiming8879几秒前
Python数据分析与可视化
开发语言·python·数据分析
William数据分析1 分钟前
Python数据分析与可视化实战指南
python·数据
知来者逆9 分钟前
讨论人机交互研究中大语言模型的整合与伦理问题
人工智能·gpt·语言模型·自然语言处理·人机交互
i嗑盐の小F10 分钟前
【IEEE出版,高录用 | EI快检索】第二届人工智能与自动化控制国际学术会议(AIAC 2024,10月25-27)
图像处理·人工智能·深度学习·算法·自然语言处理·自动化
逐梦苍穹12 分钟前
速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读
人工智能·语言模型·llama
Python之栈20 分钟前
Python if 语句优化技巧
python·算法
卡卡大怪兽21 分钟前
深度学习:数据集处理简单记录
人工智能·深度学习
菜就多练_082824 分钟前
《深度学习》深度学习 框架、流程解析、动态展示及推导
人工智能·深度学习
余生H33 分钟前
人工智能时代,我们依旧有无限的选择权!
人工智能
姑苏老陈41 分钟前
【Python基础】Python文件处理
开发语言·python·python文件操作