深度学习 axis的问题 shape = (axis=0, axis=1)

先记住一句话(万能口诀)

shape = (axis=0, axis=1)

  • axis=0 = 行方向 = 从上到下 = 上下压扁
  • axis=1 = 列方向 = 从左到右 = 左右压扁
  • 对哪个轴操作,就沿着这个轴 "压缩 / 合并",最后这个轴就消失了

一、二维矩阵(最常用):行 & 列

以你之前的矩阵 A(2行, 3列) 为例:

plaintext

复制代码
A = [
  [1, 2, 3],   # 第0行
  [4, 5, 6]    # 第1行
]
shape = (2, 3) → (axis0=2行, axis1=3列)

1. axis=0(上下压扁 → 按行求和)

  • 操作方向:从上往下,把多行压成 1 行
  • 动作:每一列的数字,上下相加
  • 结果:行消失,只剩列

plaintext

复制代码
sum(axis=0) = [1+4, 2+5, 3+6] = [5,7,9]
shape 从 (2,3) → (3)

✅ 你的理解完全对:axis=0 就是把 "行" 给抹去,上下压扁

2. axis=1(左右压扁 → 按列求和)

  • 操作方向:从左往右,把多列压成 1 列
  • 动作:每一行的数字,左右相加
  • 结果:列消失,只剩行

plaintext

复制代码
sum(axis=1) = [1+2+3, 4+5+6] = [6, 15]
shape 从 (2,3) → (2)

✅ 你的理解完全对:axis=1 就是把 "列" 给抹去,左右压扁


二、为什么 keepdims=True 很重要?(解决你之前的报错)

默认 sum 后,被压缩的轴会直接删掉

  • A.sum(axis=1) → shape (2,) (一维,没列了)
  • 没法和原矩阵 (2,3) 做除法 → 广播报错

keepdims=True

  • 压扁,但不删掉轴,保留一个维度占位
  • A.sum(axis=1, keepdims=True) → shape (2, 1)
  • 还是二维矩阵,就能和 (2,3) 正常广播计算

三、延伸到三维张量(你题目里的 (2,3,4))

三维 shape = **(axis0, axis1, axis2)**对应理解:

  • axis=0:前后 / 深度压扁(最外层维度)
  • axis=1:上下 / 行压扁
  • axis=2:左右 / 列压扁

求和后对应形状:

  • X(2,3,4).sum(axis=0) → (3,4)
  • X(2,3,4).sum(axis=1) → (2,4)
  • X(2,3,4).sum(axis=2) → (2,3)

逻辑和二维完全一样:对哪个轴操作,就沿着它合并,这个轴消失


四、终极极简总结

  1. axis=0 方向:从上到下效果:上下压扁,行消失

  2. axis=1 方向:从左到右效果:左右压扁,列消失

  3. 通用规则对哪个 axis 操作,就沿着这个轴 "捏扁",最后这个轴就没了

这个理解方式在深度学习里100% 通用:softmax、归一化、求和、均值、拼接全是这个逻辑。

相关推荐
jr-create(•̀⌄•́)1 天前
正则化和优化算法区别
pytorch·深度学习·神经网络·算法
kishu_iOS&AI1 天前
深度学习 —— 神经网络(1)
人工智能·深度学习·神经网络
纤纡.1 天前
轻松实现多语言文字识别与实时检测:PaddleOCR 实战指南
人工智能·深度学习·opencv·paddlepaddle
【建模先锋】1 天前
精品数据分享 | 锂电池数据集(10)基于阻抗的锂离子电池在不均衡使用情况下的性能预测
人工智能·python·深度学习·锂电池·锂电池寿命预测·锂电池数据集·剩余寿命预测
热爱生活的五柒1 天前
度量学习-Radar Signal Deinterleaving Using Transformer Encoder and HDBSCAN 论文解析
深度学习·学习·transformer
源码之家1 天前
计算机毕业设计:Python城市天气数据挖掘与预测系统 Flask框架 随机森林 K-Means 可视化 数据分析 大数据 机器学习 深度学习(建议收藏)✅
人工智能·爬虫·python·深度学习·机器学习·数据挖掘·课程设计
幻风_huanfeng1 天前
人工智能之数学基础:坐标下降法
人工智能·深度学习·计算机视觉·梯度下降法·坐标下降法
li星野1 天前
Transformer架构梳理
人工智能·深度学习·transformer
思绪无限1 天前
YOLOv5至YOLOv12升级:条形码二维码检测系统的设计与实现(完整代码+界面+数据集项目)
深度学习·yolo·目标检测·条形码二维码检测·yolov12·yolo全家桶
kishu_iOS&AI1 天前
Pytorch —— 自动微分模块
人工智能·pytorch·python·深度学习·算法·线性回归