|--------|--------------|------------------------|
| 名称 | 其实就是... | 生活案例 |
| 标量 | 0维张量 | 温度25℃,质量5kg,价格99元 |
| 向量 | 1维张量(一排数字) | 从你家到肯德基:(300米东, 400米北) |
| 矩阵 | 2维张量(排成一个矩形) | 电影院座位表、Excel表格、黑白照片 |
| 张量 | 3维及以上张量 | 彩色图片 |
张量到底是个啥?一句话版:
张量 = "可以继续往上叠的矩阵" ,或者说 "多维数字魔方"。
我们用颜色图片来秒懂(这个例子几乎所有搞AI的人都是这么入门的):
- 黑白照片 只有明暗 → 512×512 的矩阵(2维张量) 每个像素一个数字(0黑~255白)
- 彩色照片(就是你手机拍的照片) 有红绿蓝三种颜色 → 512×512×3 的三维张量! 可以想象成把红、绿、蓝三张黑白照片叠在一起 位置(100,200)这个像素的颜色就是: [红: 255, 绿: 100, 蓝: 50] 所以整张彩色照片就是一个 512×512×3 的"3维数字魔方"
- 一段视频 就是很多张彩色照片连续放 → 变成 帧数×512×512×3 的4维张量 比如30秒60帧的视频就是 1800×512×512×3 的超级大张量
- ChatGPT整个模型的参数 其实就是一堆巨大的张量(几十亿甚至上千亿个数字排成的多维魔方)
假设你要开奶茶店:
- 今天卖了50杯 → 标量(0维)
- 每种口味卖了多少杯:[珍珠20, 布丁15, 椰果10] → 向量(1维)
- 每个城市每种口味销量(排成表格) → 矩阵(2维)
- 每个城市、每天、每种口味的销量 → 3维张量
- 再加上每家店不同温度(冷热) → 4维张量
"当数据变得很复杂、需要用多维表格才能表达时,我们就懒得一个个叫了,统一叫张量"。