使用 PaddlePaddle 实现逻辑回归:从训练到模型保存与加载

在机器学习中,逻辑回归是一种经典的分类算法,广泛应用于二分类问题。今天,我们将通过一个简单的例子,使用 PaddlePaddle 框架实现逻辑回归模型,并展示如何保存和加载模型,以便进行后续的预测。

1. 简介

逻辑回归是一种线性分类模型,通过学习输入特征与输出标签之间的关系,实现对新数据的分类。PaddlePaddle 是一个开源的深度学习框架,提供了丰富的接口和工具,方便开发者快速实现和部署机器学习模型。

2. 数据准备

为了演示逻辑回归,我们生成了两组二维数据点,分别表示两个不同的类别。以下是数据的定义:

python 复制代码
class1_points = np.array([[1.9, 1.2],
                          [1.5, 2.1],
                          [1.9, 0.5],
                          [1.5, 0.9],
                          [0.9, 1.2],
                          [1.1, 1.7],
                          [1.4, 1.1]])

class2_points = np.array([[3.2, 3.2],
                          [3.7, 2.9],
                          [3.2, 2.6],
                          [1.7, 3.3],
                          [3.4, 2.6],
                          [4.1, 2.3],
                          [3.0, 2.9]])

我们将这两组数据合并,并为它们分配标签(0 和 1),表示不同的类别。然后,将数据转换为 Paddle 的 Tensor 格式,以便用于模型训练。

3. 模型定义

逻辑回归模型的核心是一个线性层,后面接一个 Sigmoid 激活函数。Sigmoid 函数将输出值映射到 (0, 1) 区间,表示属于某个类别的概率。以下是模型的定义:

python 复制代码
class LogisticRegression(nn.Layer):
    def __init__(self):
        super(LogisticRegression, self).__init__()
        self.linear = nn.Linear(2, 1)  # 输入特征维度为2,输出为1

    def forward(self, x):
        return nn.functional.sigmoid(self.linear(x))

4. 训练模型

为了训练模型,我们需要定义优化器和损失函数。这里我们使用随机梯度下降(SGD)优化器和二元交叉熵损失函数(BCELoss)。训练过程如下:

python 复制代码
optimizer = optim.SGD(parameters=model.parameters(), learning_rate=0.1)
loss_fn = nn.BCELoss()

epochs = 1000
for epoch in range(epochs):
    y_pred = model(X)
    loss = loss_fn(y_pred, y)
    loss.backward()
    optimizer.step()
    optimizer.clear_grad()
    if epoch % 100 == 0:
        print(f"Epoch {epoch}, Loss: {loss.numpy()}")

在训练过程中,我们每 100 个 epoch 打印一次损失值,以便观察模型的收敛情况。

5. 保存模型

训练完成后,我们需要将模型的参数保存到文件中,以便后续加载和使用。PaddlePaddle 提供了 paddle.save 方法,可以方便地保存模型参数:

python 复制代码
paddle.save(model.state_dict(), 'model2.pdparams')

6. 加载模型

在需要使用模型进行预测时,我们可以通过 paddle.load 方法加载保存的模型参数,并将其加载到模型中:

python 复制代码
model_state_dict = paddle.load('model2.pdparams')
model.load_dict(model_state_dict)

7. 预测新数据

加载模型后,我们可以对新的数据点进行预测。以下是预测新数据的代码:

python 复制代码
new_data = paddle.to_tensor([[2.0, 2.0], [3.5, 3.0]], dtype='float32')
predictions = model(new_data)
print("Predictions:", predictions.numpy())

预测结果是一个概率值,表示数据点属于类别 1 的概率。

8. 完整代码

以下是完整的代码实现:

python 复制代码
import paddle
import paddle.nn as nn
import paddle.optimizer as optim
import numpy as np


"""使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测"""
# 数据准备
class1_points = np.array([[1.9, 1.2],
                          [1.5, 2.1],
                          [1.9, 0.5],
                          [1.5, 0.9],
                          [0.9, 1.2],
                          [1.1, 1.7],
                          [1.4, 1.1]])

class2_points = np.array([[3.2, 3.2],
                          [3.7, 2.9],
                          [3.2, 2.6],
                          [1.7, 3.3],
                          [3.4, 2.6],
                          [4.1, 2.3],
                          [3.0, 2.9]])

# 将数据合并为一个数据集
X = np.vstack((class1_points, class2_points))
y = np.hstack((np.zeros(len(class1_points)), np.ones(len(class2_points))))

# 转换为 Paddle 的 Tensor
X = paddle.to_tensor(X, dtype='float32')
y = paddle.to_tensor(y, dtype='float32').reshape([-1, 1])

# 定义逻辑回归模型
class LogisticRegression(nn.Layer):
    def __init__(self):
        super(LogisticRegression, self).__init__()
        self.linear = nn.Linear(2, 1)  # 输入特征维度为2,输出为1

    def forward(self, x):
        return nn.functional.sigmoid(self.linear(x))

# 实例化模型、优化器和损失函数
model = LogisticRegression()
optimizer = optim.SGD(parameters=model.parameters(), learning_rate=0.1)
loss_fn = nn.BCELoss()

# 训练模型1000次,每100次展示一下loss
epochs = 1000
for epoch in range(epochs):
    y_pred = model(X)
    loss = loss_fn(y_pred, y)
    loss.backward()
    optimizer.step()
    optimizer.clear_grad()
    if epoch % 100 == 0:
        print(f"Epoch {epoch}, Loss: {loss.numpy()}")

# 保存模型
paddle.save(model.state_dict(), 'model2.pdparams')

# 加载模型
model_state_dict = paddle.load('model2.pdparams')
model.load_dict(model_state_dict)

# 预测新数据
new_data = paddle.to_tensor([[2.0, 2.0], [3.5, 3.0]], dtype='float32')
predictions = model(new_data)
print("Predictions:", predictions.numpy())
相关推荐
无风听海12 小时前
神经网络之特征值与特征向量
人工智能·深度学习·神经网络
艾莉丝努力练剑12 小时前
【C++:红黑树】深入理解红黑树的平衡之道:从原理、变色、旋转到完整实现代码
大数据·开发语言·c++·人工智能·红黑树
九章云极AladdinEdu12 小时前
论文分享 | BARD-GS:基于高斯泼溅的模糊感知动态场景重建
人工智能·新视角合成·动态场景重建·运动模糊处理·3d高斯泼溅·模糊感知建模·真实世界数据集
希露菲叶特格雷拉特12 小时前
PyTorch深度学习笔记(二十)(模型验证测试)
人工智能·pytorch·笔记
NewsMash12 小时前
PyTorch之父发离职长文,告别Meta
人工智能·pytorch·python
IT_陈寒12 小时前
Python 3.12新特性实测:10个让你的代码提速30%的隐藏技巧 🚀
前端·人工智能·后端
Ztop12 小时前
GPT-5.1 已确认!OpenAI下一步推理升级?对决 Gemini 3 在即
人工智能·gpt·chatgpt
qq_4369621812 小时前
奥威BI:打破数据分析的桎梏,让决策更自由
人工智能·数据挖掘·数据分析
金融Tech趋势派12 小时前
金融机构如何用企业微信实现客户服务优化?
大数据·人工智能·金融·企业微信·企业微信scrm
大模型真好玩13 小时前
LangChain1.0速通指南(三)——LangChain1.0 create_agent api 高阶功能
人工智能·langchain·mcp