自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测

代码:

复制代码
# 导入必要的库
import numpy as np
import paddle
import paddle.nn as nn

# 设置随机种子,确保实验可重复
seed = 1
paddle.seed(seed)

# 数据集:一组二维数据,包含x和y的对应关系
data = [[-0.5, 7.7], [1.8, 98.5], [0.9, 57.8], [0.4, 39.2],
        [-1.4, -15.7], [-1.4, -37.3], [-1.8, -49.1], [1.5, 75.6],
        [0.4, 34.0], [0.8, 62.3]]

# 将数据转为NumPy数组格式
data = np.array(data)

# 分离特征(x)和标签(y),x是输入,y是输出
x_data = data[:, 0]
y_data = data[:, 1]

# 将数据转为Paddle张量类型,paddle.to_tensor用于转换
x_train = paddle.to_tensor(x_data, dtype=paddle.float32)
y_train = paddle.to_tensor(y_data, dtype=paddle.float32)


# 定义线性回归模型,继承自paddle.nn.Layer
class LinearModel(nn.Layer):
    def __init__(self):
        # 初始化时,定义一个线性层(1个输入特征和1个输出特征)
        super(LinearModel, self).__init__()
        self.linear = nn.Linear(1, 1)

    def forward(self, x):
        # 前向传播,输入x通过线性层计算输出
        x = self.linear(x)
        return x


# 实例化模型对象
model = LinearModel()

# 定义损失函数,这里使用均方误差(MSE)
criterion = paddle.nn.MSELoss()

# 定义优化器,这里使用SGD(随机梯度下降),学习率设置为0.01
optimizer = paddle.optimizer.SGD(learning_rate=0.01, parameters=model.parameters())

# 训练的迭代次数
epochs = 500
final_checkpoint = {}  # 保存最终训练结果

# 训练循环,迭代epochs次
for epoch in range(1, epochs + 1):
    # 通过模型计算预测值,模型输入x_train需要增加一个维度(因为nn.Linear需要二维输入)
    y_prd = model(x_train.unsqueeze(1))

    # 计算损失,y_prd是预测值,y_train是实际值
    loss = criterion(y_prd.squeeze(1), y_train)

    # 清空梯度
    optimizer.clear_grad()

    # 反向传播计算梯度
    loss.backward()

    # 更新模型参数
    optimizer.step()

    # 每10个epoch输出一次损失
    if epoch % 10 == 0 or epoch == 1:
        print(f"epoch:{epoch},loss:{float(loss)}")

    # 在最后一个epoch保存模型的状态
    if epoch == epochs:
        final_checkpoint['epoch'] = epoch
        final_checkpoint['loss'] = loss

# 保存模型参数到文件,方便之后加载
paddle.save(model.state_dict(), './model.params')

# 加载保存的模型参数
model.load_dict(paddle.load('./model.params'))
model.eval()  # 设置为评估模式(例如,关闭Dropout等)

# 使用训练后的模型进行预测
x_test = paddle.to_tensor([[1.8]], dtype=paddle.float32)
y_test = model(x_test)

# 打印预测结果
print(f'y_test:{y_test}')

结果:

相关推荐
大千AI助手2 小时前
直接偏好优化(DPO):原理、演进与大模型对齐新范式
人工智能·神经网络·算法·机器学习·dpo·大模型对齐·直接偏好优化
zzywxc7873 小时前
AI 驱动的软件测试革新:框架、检测与优化实践
人工智能·深度学习·机器学习·数据挖掘·数据分析
Blossom.1184 小时前
基于深度学习的医学图像分析:使用CycleGAN实现图像到图像的转换
人工智能·深度学习·目标检测·机器学习·分类·数据挖掘·语音识别
陈敬雷-充电了么-CEO兼CTO5 小时前
强化学习三巨头PK:PPO、GRPO、DPO谁是大模型训练的「王炸」?
人工智能·python·机器学习·chatgpt·aigc·ppo·grpo
竹子_236 小时前
《零基础入门AI:传统机器学习核心算法解析(KNN、模型调优与朴素贝叶斯)》
人工智能·算法·机器学习
木鱼时刻9 小时前
李宏毅2025《机器学习》-第九讲:大型语言模型评测的困境与“古德哈特定律”**
人工智能·机器学习·语言模型
zzywxc78710 小时前
随着人工智能技术的飞速发展,大语言模型(Large Language Models, LLMs)已经成为当前AI领域最引人注目的技术突破。
人工智能·深度学习·算法·低代码·机器学习·自动化·排序算法
王小王-12310 小时前
基于Catboost的铁路交通数据分析及列车延误预测系统的设计与实现【全国城市可选、欠采样技术】
机器学习·catboost·铁路交通数据·铁路数据分析·延误预测
zylyehuo11 小时前
Transformer 代码框架
机器学习
行然梦实11 小时前
论文阅读:《多目标和多目标优化的回顾与评估:方法和算法》
论文阅读·算法·机器学习·数学建模