机器学习-关于线性回归的表示方式和矩阵的基本运算规则

liruiqiang052025-02-09 11:27

最近在学习机器学习的过程中，发现关于线性回归的表示和矩阵的运算容易费解，而且随着学习的深入容易搞混，因此特意做了一些研究，并且记录下来和大家分享。

一、线性模型有哪些表示方式？

器学习中，线性模型是指模型的输出是输入特征的线性组合。根的不同，线性模型有多种表示方式，主要包括：

1.线性回归（Linear Regression）：

用于回归任务，模型形式为：

2.逻辑回归（istic Regression）：

用于二分类任务，模型形式为：

3.线性判别分析（Linear criminant Analysis, LDA）：

用于分类任务，特别是二分类问题。LDA 寻找一影方向，使得投影后同类样本尽可，异类样本尽可能远离。模型形式为：

4.支持向量机（Support Vector MachinSVM）：

用于分类任务，线性可分情况下，模型形式为：

5.感知机（Perceptron）：

用于二分类任务，模型形式为：

这些线性模型在不同的任务中应用广泛，选择合适的模型取决于具体的应用场景和数据特征。

二、那么线性模型的矩阵表示是什么样的呢？

机器学习中，线性模型通常可以使用矩阵形式表示，这种表示方式在处理多元线性回归等问题时尤为方便。以下是线性模型的矩阵表示：

1.线性模型的矩阵形式：

假设我们有( n ) 个样本，每个样本有 p 个特征。线性模型可以：

其中：

Y 是 n × 1 的向量，表示所有样本的目标值。
X是n × p的特征矩阵，每一行对应一个样本的特征向量。
w是p×1的权重向量。
b是n×1 的偏置向量，通常为常数向量 b⋅1，其中 b 是偏置项。

2. 增广矩阵表示：

为了简化表示，我们可以将偏置项b 合并到权重向量 w 中。具体方法是向特征矩阵 X 加一列全为 1 的列，得到增广特征矩阵 X'，同时将偏置项作为权重向量的一个分量。这样，模型可以表示为：

Y=X′w′

其中：

这种增广矩阵的表示方式简化了模型的表示和计算。

3. 损失函数的矩阵表示

在线性回归中，常用的损失函数是均方误差（M，其矩阵形式为：

通过矩阵形式表示线性模型，可以简化模型的表示和计算，特别是在处理多元线性回归和高维数据时，这种表示方式尤为有效

4.举例说明

为了更直观地理解线性模型的矩阵表示，我们通过一个具体的例子来说明。假设我们有一个包含 3 个样本的数据集，每个样本有 2 个特征。我们的目标是建立一个线性回归模型来预测目标值。

（1）数据表示：

（2）增广特征矩阵：

（3）权重向量：

（4）线性模型表示：

（5）求解权重向量：

三、需要了解的矩阵运算的几个定律：

1.在矩阵运算中，矩阵的加法和乘法遵循以下定律：

矩阵加法的定律：

矩阵乘法的定律：

注意：

矩阵乘法不满足交换律：一般情况下，矩阵乘法不满足交换律，即 AB≠BA。只有在特定情况下（例如 A和 B\ 都是对角矩阵且具有相同的维度）才可能满足交换律。

2.在矩阵运算中，转置操作具有以下常见性质：

四、线性回归，解释一下如何求导得到最优w

1.之前的文章，我曾经提到过正规方程求得最优w的过程：

2、其中求导遵循的规则如下：

标量对向量的求导：

向量内积的求导：

二次型函数的求导：

矩阵求导的链式法则：

在应用这些公式时，需注意矩阵的维度匹配和转置操作。特别是在链式法则中，矩阵 A 的转置 A^T 出现在求导结果中，这是因为在矩阵乘法中，维度需要匹配，转置操作可以调整矩阵的维度以确保运算的合法性。

上一篇：Windows的MySQL数据库升级（解压包方式）

下一篇：使用Docker + Ollama在Ubuntu中部署deepseek

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06OpenClaw优化飞书API 额度已耗尽问题 07小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw大龙虾机器人完整安装教程