PyTorch的基础概念和复杂模型的基本使用

文章目录

一、PyTorch基础概念

  1. 张量(Tensor)操作
    • 张量是PyTorch中的基本数据结构,类似于NumPy的数组,但支持GPU加速
    • 常见操作包括创建张量、张量运算、索引、切片等
python 复制代码
import torch

# 创建张量
x = torch.randn(3, 4)
y = torch.zeros(3, 4)

# 张量运算
z = x + y
  1. 自动求导(Autograd)
    • PyTorch的自动求导系统可以自动计算梯度
    • 通过requires_grad=True启用梯度计算
python 复制代码
# 启用自动求导
x = torch.randn(3, 4, requires_grad=True)

# 计算损失
y = x * 2
loss = y.sum()

# 反向传播
loss.backward()
  1. 计算图
    • PyTorch使用动态计算图(Define-by-Run)的方式
    • 每次前向传播都会构建一个新的计算图

二、复杂模型的学习使用

  1. 神经网络模块(torch.nn)
    • torch.nn提供了构建神经网络所需的各种组件
    • 主要包括各种层(如线性层、卷积层)、激活函数、损失函数等
python 复制代码
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x
  1. 卷积神经网络(CNN)
    • 适用于图像处理任务
    • 包含卷积层、池化层等
python 复制代码
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3)
        self.fc1 = nn.Linear(12*12*64, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.max_pool2d(x, 2)
        x = F.relu(self.conv2(x))
        x = F.max_pool2d(x, 2)
        x = x.view(-1, 12*12*64)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x
  1. 循环神经网络(RNN)
    • 适用于序列数据处理任务
    • 包括RNN、LSTM、GRU等变体
python 复制代码
class RNNModel(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, num_classes):
        super(RNNModel, self).__init__()
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        out, _ = self.lstm(x)
        out = self.fc(out[:, -1, :])
        return out
  1. 训练流程
    • 数据加载:使用DataLoaderDataset加载数据
    • 模型定义:定义神经网络结构
    • 损失函数:选择合适的损失函数(如交叉熵损失)
    • 优化器:选择优化器(如Adam)并传入模型参数
    • 训练循环:执行前向传播、计算损失、反向传播和参数更新
python 复制代码
from torch.utils.data import DataLoader, TensorDataset

# 创建数据集
x_train = torch.randn(1000, 784)
y_train = torch.randint(0, 10, (1000,))
dataset = TensorDataset(x_train, y_train)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

# 创建模型、损失函数和优化器
model = Net()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 训练循环
for epoch in range(10):
    for inputs, targets in dataloader:
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
  1. 模型保存与加载
    • 使用torch.save()torch.load()保存和加载模型
python 复制代码
# 保存模型
torch.save(model.state_dict(), "model.pth")

# 加载模型
model = Net()
model.load_state_dict(torch.load("model.pth"))
相关推荐
言之。几秒前
时间轮(Time Wheel)数据结构入门指南
开发语言·数据结构·python
带娃的IT创业者3 分钟前
可选依赖的优雅降级:从思维导图双引擎到语音识别三级容错的实战设计
人工智能·语音识别·xcode
郝学胜-神的一滴5 分钟前
深度拆解Python迭代协议:从底层原理到核心实践,解锁异步编程的基石
java·网络·python
八月瓜科技10 分钟前
擎策·知海全球专利数据库 专业专利检索赋能 规避无效研发提效创新
大数据·数据库·人工智能·科技·aigc
2401_8331977313 分钟前
更优雅的测试:Pytest框架入门
jvm·数据库·python
百胜软件@百胜软件16 分钟前
社区生鲜零售革命:8万亿赛道的效率突围与生态重构
人工智能·重构·零售
jinanwuhuaguo21 分钟前
OpenClaw v2026.3.22-beta.1 深度技术分析报告:从单智能体操作系统到多智能体协作平台的范式跃迁
运维·人工智能·语言模型·自然语言处理·visual studio code·openclaw
天辛大师21 分钟前
天辛大师也谈大模型GEO技术,虚构与误导的重读
大数据·人工智能·决策树·随机森林·启发式算法
金融小师妹25 分钟前
基于多因子流动性模型的“黄金闪崩”解析:利率预期强化与资金再平衡驱动的金价8%下跌机制
大数据·人工智能·svn·能源