AI 术语通俗词典：矩阵

矩阵是数学、线性代数、数据分析、机器学习和人工智能中非常基础、也非常重要的一个术语。它用来描述一种按行和列排列的二维数值结构。换句话说，矩阵就是把许多数值按照规则排成一个"数字表格"，从而便于统一表示和计算。

如果说标量回答的是"单个量是多少"，向量回答的是"一个对象在多个维度上的数值表示"，那么矩阵回答的就是"多个对象、多个维度的数据如何按二维结构组织起来"。因此，矩阵常被用来表示数据表、图像、线性变换、模型参数和样本集合，在人工智能中同样非常常见。

一、基本概念：什么是矩阵

矩阵（Matrix）可以理解为一种二维数组（Two-dimensional Array），它由若干行（Row）和若干列（Column）组成。

例如，下面这个数表：

就是一个矩阵。

它有 2 行、3 列，因此可以称为一个 2 × 3 矩阵。

一般来说，一个 m × n 矩阵可写为：

其中：

• m 表示矩阵的行数

• n 表示矩阵的列数

• aᵢⱼ 表示第 i 行、第 j 列上的元素

• A 表示这个矩阵整体

这个写法的含义并不复杂：它只是把许多个标量按行和列排列起来，形成一个二维数值结构。

从通俗角度看，矩阵可以理解为：把一批数字按"表格"方式组织起来的结果。

例如，一个班里 3 位学生 2 门课程的成绩，可以写成矩阵：

若约定：

每一行表示一位学生；

每一列表示一门课程；

那么这个矩阵就表示"多个对象在多个维度上的数据集合"。

也就是说，矩阵不是随意摆放的一堆数字，而是有明确行列含义的结构。

在人工智能和数据分析中，矩阵常常有两种很重要的理解方式。

第一种，把矩阵看作"二维数据表"。

例如，若一个数据集里有很多样本，每个样本又有多个特征，那么整份数据就可以写成矩阵：每行一个样本，每列一个特征。

第二种，把矩阵看作"线性变换的表示"。

在数学中，矩阵不仅能存数据，还能表示旋转、缩放、投影等变换。也就是说，矩阵既可以是"数据容器"，也可以是"运算规则"。

在张量（Tensor）的语境中，矩阵还可以看作2 阶张量。

也就是说，矩阵是张量体系中非常重要的一类特殊情况：它比向量多一个维度，但仍然保持二维结构。

二、矩阵的重要性与常见应用场景

1、矩阵的重要性

矩阵之所以重要，是因为现实中的很多数据天然就适合按"行 × 列"的方式组织。

当一个问题中同时存在"多个对象"和"多个特征"时，矩阵往往就是最自然的表示方式。

首先，矩阵可以统一表示二维结构数据。

无论是学生成绩表、销售报表、图像像素表，还是样本特征表，都可以用矩阵表示。这使很多现实问题都能转化为统一的数值形式。

其次，矩阵便于进行批量计算。

若每个样本是一个向量，那么多个样本放在一起就可以组成矩阵。这样一来，很多原本需要逐个处理的计算，就能通过矩阵运算一次完成，从而提高效率。

再次，矩阵是机器学习和深度学习的重要计算基础。

在很多模型中，输入数据、权重参数、中间结果都会以矩阵形式存在。特别是在神经网络中，矩阵乘法几乎是最核心的基础运算之一。

2、常见应用场景

（1）在数据分析中，矩阵常用于表示样本与特征表

在数据分析中，一个数据集通常包含很多样本和很多特征。

这时，最自然的写法就是矩阵：

每一行表示一个样本；

每一列表示一个特征。

例如，一个学生成绩表、用户行为表、商品指标表，本质上都可以看作矩阵。

（2）在图像处理中，灰度图像常可表示为矩阵

一张灰度图像本质上就是由像素值组成的二维网格。

因此，它天然可以看作矩阵：

行表示图像高度方向；

列表示图像宽度方向；

每个元素表示某个像素的亮度值。

（3）在机器学习中，参数和输入常以矩阵形式存在

若一个批次中有多个样本，而每个样本又有多个特征，那么输入数据常常就是一个矩阵。

此外，模型中的权重参数也常以矩阵形式保存，从而便于做批量线性运算。

（4）在神经网络中，矩阵乘法是核心运算之一

神经网络中的一层计算，常常可以写成"输入矩阵 × 权重矩阵 + 偏置"的形式。

也就是说，矩阵不仅用于存数据，还直接参与模型的前向传播和参数更新。

（5）在线性代数中，矩阵可表示线性变换

在数学中，矩阵还能表示旋转、缩放、投影、坐标变换等线性操作。

这使矩阵不仅是数据结构，也是运算工具。

可以概括地说：向量说明"一个对象在多个维度上的表示"；矩阵说明"多个对象、多个维度的数据如何按二维方式统一组织和计算"。

三、使用矩阵时需要注意的问题

矩阵虽然非常常用，但在理解和使用时也要注意几个问题。

1、不要把"矩阵形状"和"矩阵内容"混为一谈

矩阵有两个层面的信息：

一个是矩阵里装了哪些数值；

一个是这些数值按怎样的行列结构组织。

例如，形状为 2 × 3 和 3 × 2 的矩阵，即使包含的数字相同，含义和可参与的运算也可能完全不同。

2、矩阵中的行和列通常具有不同语义

在实际应用中，矩阵的"行"和"列"通常不是对称的。

例如，在样本特征矩阵中：

行通常表示样本；

列通常表示特征。

若把它们随意交换，数据的含义就会改变。因此，理解矩阵不能只看数值，还要看行列各自代表什么。

3、并不是所有矩阵都能直接相乘

矩阵乘法有严格的形状要求。

若矩阵 A 的形状是 m × n，矩阵 B 的形状是 n × p，那么它们才能相乘，结果是一个 m × p 矩阵。

也就是说，前一个矩阵的列数必须等于后一个矩阵的行数。

4、矩阵乘法不是逐元素相乘

初学者常把矩阵乘法误解为"对应位置相乘"。实际上，标准矩阵乘法是"行与列做点积"。

逐元素相乘当然也存在，但那通常是另一种运算，不应与矩阵乘法混淆。

5、矩阵只是更高维结构中的一种特殊情况

矩阵很重要，但它并不是终点。

当数据不再只是二维结构，而是具有更多维度时，就需要进一步使用张量来表示。因此，矩阵可以看作连接"向量"和"张量"的重要桥梁。

四、Python 示例

下面给出两个简单示例，用来说明矩阵的基本表示方式，以及它如何帮助我们组织和计算二维数据。

示例 1：用矩阵表示学生成绩表

bash 复制代码

# 用二维列表表示一个 3×2 的矩阵# 每一行表示一位学生，每一列表示一门课程scores = [    [85, 92],    [78, 88],    [90, 95]]
print("成绩矩阵：")for row in scores:    print(row)
# 访问第 2 位学生的第 1 门成绩print("第 2 位学生的第 1 门成绩：", scores[1][0])

这个例子展示了矩阵最基本的作用：把"多个对象 × 多个特征"的数据按二维表格组织起来。这样，我们既可以整体查看数据，也可以按行、按列或按元素访问。

示例 2：使用 NumPy 进行矩阵乘法

php 复制代码

import numpy as np
# 定义两个矩阵A = np.array([    [1, 2],    [3, 4]])
B = np.array([    [5, 6],    [7, 8]])
# 进行矩阵乘法C = A @ B
print("矩阵 A：")print(A)
print("矩阵 B：")print(B)
print("A 与 B 的矩阵乘积：")print(C)

这个例子展示了矩阵在数值计算中的核心用途。这里的 A @ B 不是逐元素相乘，而是标准的矩阵乘法。它在机器学习、图像处理和神经网络中都非常常见。

📘 小结

矩阵是一种按行和列组织起来的二维数值结构，可以用来表示数据表、图像、样本集合和线性变换。在人工智能中，矩阵不仅是常见的数据表示方式，也是很多核心计算的基础。对初学者而言，可以把它理解为：向量表示"一个对象在多个维度上的数值"，而矩阵表示"多个对象、多个维度的数据如何按二维表格统一组织和运算"。

"点赞有美意，赞赏是鼓励"