使用PaddlePaddle实现逻辑回归:从训练到模型保存与加载

1. 引入必要的库

首先,需要引入必要的库。PaddlePaddle用于构建和训练模型,pandas和numpy用于数据处理,matplotlib用于结果的可视化。

python 复制代码
import paddle
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

2. 加载自定义数据集

假设有一个CSV文件custom_dataset.csv,其中包含特征(自变量)和标签(因变量)。使用pandas来加载数据,并进行预处理。

python 复制代码
# 加载自定义数据集
data = pd.read_csv('custom_dataset.csv')

# 假设数据集中有多列特征和一个二分类标签
X = data.iloc[:, :-1].values.astype(np.float32)  # 特征
y = data.iloc[:, -1].values.astype(np.float32)   # 标签

# 将标签转换为0和1
y = np.where(y == 'positive', 1, 0)

3. 构建逻辑回归模型

使用PaddlePaddle来构建逻辑回归模型。

python 复制代码
# 构建逻辑回归模型
class LogisticRegression(paddle.nn.Layer):
    def __init__(self, num_features):
        super(LogisticRegression, self).__init__()
        self.linear = paddle.nn.Linear(num_features, 1)
    
    def forward(self, x):
        return paddle.sigmoid(self.linear(x))

# 初始化模型
num_features = X.shape[1]
model = LogisticRegression(num_features)

4. 定义损失函数和优化器

使用二元交叉熵损失函数和随机梯度下降(SGD)优化器。

python 复制代码
# 定义损失函数和优化器
criterion = paddle.nn.BCELoss()
optimizer = paddle.optimizer.SGD(learning_rate=0.01, parameters=model.parameters())

5. 训练模型

使用自定义数据集训练模型。

python 复制代码
# 将数据转换为PaddlePaddle的张量
X_tensor = paddle.to_tensor(X)
y_tensor = paddle.to_tensor(y.reshape(-1, 1))

# 训练模型
num_epochs = 100
batch_size = 32
for epoch in range(num_epochs):
    for i in range(0, len(X), batch_size):
        X_batch = X_tensor[i:i+batch_size]
        y_batch = y_tensor[i:i+batch_size]
        
        # 前向传播
        outputs = model(X_batch)
        loss = criterion(outputs, y_batch)
        
        # 反向传播和优化
        loss.backward()
        optimizer.step()
        optimizer.clear_grad()
        
    if (epoch+1) % 10 == 0:
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.numpy()}')

6. 保存模型

训练完成后,可以使用PaddlePaddle的save方法保存模型。

python 复制代码
# 保存模型
paddle.save(model.state_dict(), 'logistic_regression_model.pdparams')

7. 加载模型并进行预测

在需要时,可以使用PaddlePaddle的load方法加载模型,并进行预测。

python 复制代码
# 加载模型
model = LogisticRegression(num_features)
model.set_state_dict(paddle.load('logistic_regression_model.pdparams'))
model.eval()

# 进行预测
X_test = paddle.to_tensor(X[:5])
predictions = model(X_test)
predicted_labels = (predictions > 0.5).astype(int)

print("Predicted Labels:", predicted_labels.numpy().flatten())

8. 结果可视化

如果需要,可以绘制训练过程中的损失变化曲线,以帮助理解模型的性能。

python 复制代码
# 这里假设我们在训练过程中记录了损失值
# plt.plot(loss_values, label='Loss')
# plt.title('Model Loss')
# plt.xlabel('Epochs')
# plt.ylabel('Loss')
# plt.legend()
# plt.show()
相关推荐
king of code porter4 分钟前
百宝箱企业版搭建智能体应用-平台概述
人工智能·大模型·智能体
愚公搬代码8 分钟前
【愚公系列】《AI短视频创作一本通》004-AI短视频的准备工作(创作AI短视频的基本流程)
人工智能·音视频
物联网软硬件开发-轨物科技10 分钟前
【轨物洞见】告别“被动维修”!预测性运维如何重塑老旧电站的资产价值?
运维·人工智能
电商API_1800790524710 分钟前
第三方淘宝商品详情 API 全维度调用指南:从技术对接到生产落地
java·大数据·前端·数据库·人工智能·网络爬虫
梁辰兴24 分钟前
百亿美元赌注变数,AI军备竞赛迎来转折点?
人工智能·ai·大模型·openai·英伟达·梁辰兴·ai军备竞赛
PaperRed ai写作降重助手26 分钟前
智能写作ai论文生成软件推荐
人工智能·aigc·ai写作·智能降重·paperred
龙山云仓29 分钟前
No140:AI世间故事-对话康德——先验哲学与AI理性:范畴、道德律与自主性
大数据·人工智能·深度学习·机器学习·全文检索·lucene
IT·小灰灰1 小时前
30行PHP,利用硅基流动API,网页客服瞬间上线
开发语言·人工智能·aigc·php
新缸中之脑1 小时前
编码代理的未来
人工智能
Anarkh_Lee1 小时前
【小白也能实现智能问数智能体】使用开源的universal-db-mcp在coze中实现问数 AskDB智能体
数据库·人工智能·ai·开源·ai编程