刘二大人第5讲-pytorch实现线性回归-有代码

5. pytorch实现线性回归

用pytorch提供的工具实现一次线性模型

步骤如下:

  1. 准备dataset
  2. 设计模型:继承nn.Module类
  3. 定义Loss和optimizer优化器:用pytorch的api
  4. 训练:forward算Loss,backward算Gradient,用Gradient Descent算法update

5.1 步骤一:准备dataset

采用mini-batch风格

5.2 步骤二:定义模型

将模型定义成一个class,继承nn.Module

继承Module的对象会自动生成计算图实现backward,其中必须实现的方法有__init__()和forward()

  • 其中__init__()构造函数用于初始化对象
    • 调用父类构造函数必写
    • nn.Linear是一个继承自nn.Module的类
      • 构造函数(每个输入样本的维度,每个输出样本的维度,bias=True),其中bias若设为False,将不学bias
      • 有两个成员变量weight和bias
        • w的形状是out_features*in_features
        • b的形状是out_features
  • forward()定义前馈中执行的计算
    • 补充:python中对象()实际是执行他的__call()__方法,而Linear类中__call()__会去调用forward()

5.3 步骤三:实例化Loss和Optimizer

python 复制代码
criterion = torch.nn.MSELoss(reduction="sum")
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

注:model.parameters()能调用这个module中所有成员的parameters()方法拿到parameters,此处拿到module中linear的w和b

Loss这里采用MSELoss,同样是一个继承自nn.Module的类,具体文档见下

注:新版的torch中size_average and reduce 被弃用了,使用reduction='sum'求和,使用reduction='mean'求平均值

Optimizer这里采用SGD,不继承自nn.Module不会构建计算图,lr为learning rate,具体文档见下

5.4 步骤四:训练

python 复制代码
for epoch in range(1000):
    # 1. 求y_hat
    y_pred = model(x_data)
    # 2. 求loss
    loss = criterion(y_pred, y_data)
    # 3. 清空gradient
    optimizer.zero_grad()
    # 4. 反向传播求梯度
    loss.backward()
    # 5. 更新参数
    optimizer.step()
  1. y ^ \hat{y} y^
  2. 求Loss
  3. 梯度归零
  4. backward求梯度
  5. step更新

5.5 完整代码

python 复制代码
import matplotlib
# 使用TkAgg后端以确保在不同环境下都能正常显示图形
matplotlib.use('TkAgg')
from matplotlib import pyplot as plt
import numpy as np
import torch
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

# 设置中文字体以确保中文正常显示
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

# 1. 准备dataset,采用mini-batch风格
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[2.0], [4.0], [6.0]])

# 2. 定义模型
class LinearModel(torch.nn.Module):
    def __init__(self):
        super(LinearModel, self).__init__()
        self.linear = torch.nn.Linear(1, 1)

    def forward(self, x):
        y_pred = self.linear(x)
        return y_pred

# 3. 实例化模型、Loss、Optimizer
model = LinearModel()
criterion = torch.nn.MSELoss(reduction="sum")
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 4. 训练模型1000次
# 记录训练过程
w_list = []
b_list = []
l_list = []

for epoch in range(1000):
    # 1. 求y_hat
    y_pred = model(x_data)
    # 2. 求loss
    loss = criterion(y_pred, y_data)
    # 3. 清空gradient
    optimizer.zero_grad()
    # 4. 反向传播求梯度
    loss.backward()
    # 5. 更新参数
    optimizer.step()
    # 记录训练过程
    w_list.append(model.linear.weight.item())
    b_list.append(model.linear.bias.item())
    l_list.append(loss.item())

# 生成网格数据计算理论损失曲面
w = np.linspace(0, 4, 100)
b = np.linspace(-2, 2, 100)
W, B = np.meshgrid(w, b)
Z = np.zeros_like(W)

# 计算每个网格点的损失
for i in range(len(w)):
    for j in range(len(b)):
        # 计算预测值
        y_pred = W[i, j] * x_data.numpy() + B[i, j]
        # 计算MSE损失
        Z[i, j] = np.sum((y_pred - y_data.numpy())**2)

# 创建3D图形
fig = plt.figure(figsize=(12, 5))

# 绘制损失曲面和训练路径
ax1 = fig.add_subplot(121, projection='3d')
surf = ax1.plot_surface(W, B, Z, cmap=cm.coolwarm, alpha=0.8, linewidth=0)
ax1.plot(w_list, b_list, l_list, 'r-o', markersize=2, linewidth=1, label='训练路径')
ax1.set_xlabel('权重 (w)')
ax1.set_ylabel('偏置 (b)')
ax1.set_zlabel('损失 (Loss)')
ax1.set_title('损失曲面与训练路径')
ax1.view_init(elev=30, azim=45)
fig.colorbar(surf, ax=ax1, shrink=0.5, aspect=5)

# 绘制等高线图和训练路径投影
ax2 = fig.add_subplot(122)
contour = ax2.contour(W, B, Z, 50, cmap=cm.coolwarm)
ax2.plot(w_list, b_list, 'r-o', markersize=2, linewidth=1, label='训练路径')
ax2.set_xlabel('权重 (w)')
ax2.set_ylabel('偏置 (b)')
ax2.set_title('损失函数等高线图')
fig.colorbar(contour, ax=ax2, shrink=0.5, aspect=5)
ax2.grid(True)

plt.tight_layout()
plt.show()

图像如下:

w收敛于2.0,b收敛于0.0

相关推荐
甲维斯2 小时前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件2 小时前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
专注搞钱3 小时前
GPT-4o写设备Recipe:从3小时到10分钟
数据库·人工智能·gpt·半导体
闻道参看3 小时前
贝芯宠AI灵兽 ELFVET 大模型聚焦临床应用,强化宠物诊疗综合能力
人工智能·宠物
MartinYeung53 小时前
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
人工智能·学习·语言模型
财经资讯数据_灵砚智能4 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
m0_380167144 小时前
加密货币价格 API、市场数据 API 与 分析 API 有什么区别?
人工智能·ai·区块链
zyplayer-doc4 小时前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新
后端小肥肠4 小时前
小红书笔记爆了 17 万后,我用 Obsidian + Skill 实现了“一句话选品”
人工智能·aigc·agent
哈哈,柳暗花明4 小时前
人工智能专业术语详解(M)
人工智能·专业术语