【机器学习300问】70、向量化技术来计算神经网络时维度如何确保正确?

一、向量化技术在进行神经网络计算时的优势

向量化是一种优化技术,通过使用数组操作代替for循环,可以大大提高代码的性能和效率。在深度学习中尤其明显,可以提高计算效率、简化代码、优化内存使用。

二、如何确保计算时维度是正确的?

(1)先回顾一下神经网络的计算

用简单的逻辑回归来举例,用圆圈表示神经网络的计算单元,逻辑回归的计算有两个步骤:

  1. 首先你按步骤计算出
  2. 然后通过激活函数g计算出a

一个神经网络只是这样子重复做了好多次计算。

以一个两层的神经网络为例:

它的第一层计算公式如下:

(2)权重矩阵的维度

对于权重矩阵的维度而言:

  • 行维度是神经网络第层节点的个数
  • 列维度是前一层节点的个数

举例说明:对于第一层权重矩阵来说,它的前一层是输出层,所以输出层节点的个数是特征的数量。如下图

(3)输入矩阵的维度

如果输入的是一个样本,那么还不能叫做输入矩阵,还只是输入列向量

如果输入的是训练集(个样本),此时就能称为输入矩阵。

对于输入矩阵也写作而言:

  • 行维度是特征的数量;
  • 列维度是样本的数量;

(4)各层输出矩阵的维度

如果只有一个样本,那么各层的输出也只是一个列向量

如果有个样本参与训练,那么此时就能成为输出矩阵

  • 行的维度是第层节点的个数
  • 列的维度是训练样本的个数

(5)偏置列向量的维度

偏置是一个列向量,它在参与计算的时候会通过python的广播机制,变成一个矩阵。

对于第层偏置列向量而言,它的维度是

相关推荐
Tezign_space27 分钟前
AI智能体赋能实践:从提示工程到上下文工程的架构演进
人工智能·架构·agentic ai·上下文工程·大模型智能体·长程任务·模型注意力预算
..过云雨43 分钟前
17-2.【Linux系统编程】线程同步详解 - 条件变量的理解及应用
linux·c++·人工智能·后端
kalvin_y_liu1 小时前
【2026年经济周期关键节点案例分析】
人工智能
Wokoo71 小时前
开发者AI大模型学习与接入指南
java·人工智能·学习·架构
骚戴1 小时前
2025 n1n.ai 全栈国产大模型接入列表与实测报告
人工智能·大模型·llm·api·ai gateway
南山乐只1 小时前
【Spring AI 开发指南】ChatClient 基础、原理与实战案例
人工智能·后端·spring ai
极客小云2 小时前
【突发公共事件智能分析新范式:基于PERSIA框架与大模型的知识图谱构建实践】
大数据·人工智能·知识图谱
Fuly10242 小时前
如何评估LLM和Agent质量
人工智能
weisian1512 小时前
入门篇--知名企业-12-Stability AI:不止于“艺术”,这是一场开源AI的全面起义
人工智能·开源·stablility ai
五月君_2 小时前
Nuxt UI v4.3 发布:原生 AI 富文本编辑器来了,Vue 生态又添一员猛将!
前端·javascript·vue.js·人工智能·ui