自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测

自定义数据集:通过继承 paddle.io.Dataset 类创建自定义数据集,并重写 getitemlen 方法。

定义逻辑回归模型:继承 paddle.nn.Layer 类,定义一个简单的线性层,并在 forward 方法中应用sigmoid激活函数。

训练模型:使用二元交叉熵损失函数 BCELoss 和随机梯度下降优化器 SGD 进行训练。

保存模型:使用 paddle.save 保存模型的参数。

加载模型并预测:加载保存的模型参数,设置模型为评估模式,然后对新数据进行预测。

import paddle

import numpy as np

from paddle.io import Dataset, DataLoader

自定义数据集

class MyDataset(Dataset):

def init(self, data, labels):

self.data = data

self.labels = labels

def getitem(self, idx):

return self.dataidx, self.labelsidx

def len(self):

return len(self.data)

生成一些自定义数据

np.random.seed(0)

data = np.random.randn(100, 10).astype('float32')

labels = np.random.randint(0, 2, size=(100, 1)).astype('float32')

创建数据集和数据加载器

dataset = MyDataset(data, labels)

dataloader = DataLoader(dataset, batch_size=10, shuffle=True)

定义逻辑回归模型

class LogisticRegression(paddle.nn.Layer):

def init(self, input_dim):

super(LogisticRegression, self).init()

self.linear = paddle.nn.Linear(input_dim, 1)

def forward(self, x):

return paddle.nn.functional.sigmoid(self.linear(x))

model = LogisticRegression(input_dim=10)

定义损失函数和优化器

criterion = paddle.nn.BCELoss()

optimizer = paddle.optimizer.SGD(learning_rate=0.01, parameters=model.parameters())

训练模型

num_epochs = 100

for epoch in range(num_epochs):

for batch_data, batch_labels in dataloader:

optimizer.clear_grad()

outputs = model(batch_data)

loss = criterion(outputs, batch_labels)

loss.backward()

optimizer.step()

if (epoch + 1) % 10 == 0:

print(f'Epoch {epoch + 1}/{num_epochs}, Loss: {loss.item():.4f}')

保存模型

paddle.save(model.state_dict(), 'logistic_regression.pdparams')

加载模型进行预测

loaded_model = LogisticRegression(input_dim=10)

loaded_model.set_state_dict(paddle.load('logistic_regression.pdparams'))

loaded_model.eval()

进行预测

new_data = np.random.randn(10, 10).astype('float32')

new_data = paddle.to_tensor(new_data)

predictions = loaded_model(new_data)

print("Predictions:")

print(predictions)

相关推荐
装不满的克莱因瓶12 分钟前
链式法则如何传递参数误差 —— 深入理解神经网络中的梯度传播
人工智能·python·深度学习·神经网络·数学·机器学习·ai
lqqjuly6 小时前
前沿算法深度解析(二)
人工智能·算法·机器学习
马士兵教育11 小时前
Java还有前景吗?Java+AI大模型学习路线及项目?
java·人工智能·python·学习·机器学习
KaMeidebaby11 小时前
卡梅德生物技术快报|纯化重组蛋白实操详解
人工智能·python·tcp/ip·算法·机器学习
嘉子的秃头日记13 小时前
TRO 2026|轮椅也能“猜到”用户想往哪走?
大数据·人工智能·机器学习
Hali_Botebie14 小时前
非共轭先验(Non-conjugate Prior)和共轭先验(Conjugate Prior)
人工智能·机器学习
xrgs_shz14 小时前
基于K-Means聚类分析的鸢尾花分类
人工智能·机器学习
卡梅德生物科技小能手15 小时前
卡梅德生物科普:MAPT(微管相关蛋白Tau)
人工智能·经验分享·机器学习
AI数据皮皮侠15 小时前
全国高考报名、录取数据(1977-2026)
大数据·数据库·人工智能·python·机器学习·高考
码路星球15 小时前
我把 K-Means 的每一步都画了出来:分配、更新、收敛,外加几个工程踩坑
机器学习