联邦迁移学习

Finetune(微调) 和 Fixed Feature Extractor(固定特征提取器) 确实有相似之处,但它们的关键区别在于模型参数的调整范围和任务的相似性。

区别:

Finetune(微调):

所有层都参与训练:在Finetune中,预训练模型的所有层都会参与训练。虽然我们使用预训练权重进行初始化,但训练过程中会根据新任务的数据对模型参数进行更新。

适用于相似任务:Finetune 适合原始任务和新任务有较大相似性的情况。比如,如果预训练模型在 ImageNet(自然图片)上训练过,用它来处理另一个自然图片的分类任务,Finetune 的效果往往很好。

复制代码
import torch
import torch.nn as nn
import torchvision.models as models
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

# 1. 加载预训练的 ResNet50 模型
model = models.resnet50(pretrained=True)

# 2. 修改最后的全连接层,适配新任务(假设新任务有10个类别)
model.fc = nn.Linear(model.fc.in_features, 10)  # in_features 为 ResNet50 的全连接层输入维度

# 3. 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 4. 加载数据集(例如,CIFAR-10 数据集)
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # ResNet50 需要 224x224 的输入尺寸
    transforms.ToTensor(),
])

train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# 5. 训练模型
model.train()  # 设置为训练模式
for epoch in range(10):  # 假设训练10个 epoch
    running_loss = 0.0
    for inputs, labels in train_loader:
        optimizer.zero_grad()  # 清除梯度
        outputs = model(inputs)  # 前向传播
        loss = criterion(outputs, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新模型参数
        
        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}")

# 6. 模型训练完成后保存
torch.save(model.state_dict(), "finetuned_resnet50.pth")

Fixed Feature Extractor(固定特征提取器):

仅微调最后几层:在这种方法中,预训练模型的大部分层是被冻结的,只有最后的几层(通常是全连接层)参与训练。这种方式把前几层看作一个固定的特征提取器,用来提取图片的高层次特征,而只在最后的几层上根据新任务进行训练。

适用于不同的任务:这种方法适合原始任务和新任务差异较大的情况,因为你可能只是需要使用预训练模型提取的通用特征,而不需要修改整个模型。

复制代码
import torch
import torch.nn as nn
import torchvision.models as models
import torch.optim as optim

# 1. 加载预训练的 ResNet50 模型
model = models.resnet50(pretrained=True)

# 2. 冻结前几层参数,使得它们不参与训练
for param in model.parameters():
    param.requires_grad = False

# 3. 替换最后的全连接层,适应新的任务 (假设是10类分类任务)
model.fc = nn.Sequential(
    nn.Linear(model.fc.in_features, 256),  # 添加一层全连接层
    nn.ReLU(),
    nn.Dropout(0.4),
    nn.Linear(256, 10),  # 最后输出10个类别
)

# 4. 只训练新的全连接层
optimizer = optim.Adam(model.fc.parameters(), lr=0.001)

# 5. 训练模型
criterion = nn.CrossEntropyLoss()

# 假设有一个训练数据集 train_loader
for epoch in range(10):
    running_loss = 0.0
    for inputs, labels in train_loader:
        optimizer.zero_grad()  # 清除梯度
        outputs = model(inputs)  # 前向传播
        loss = criterion(outputs, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新模型参数

        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}")
相关推荐
CoovallyAIHub3 小时前
标注成本骤降,DINOv3炸裂发布!冻结 backbone 即拿即用,性能对标SOTA
深度学习·算法·计算机视觉
wait a minutes3 小时前
【自动驾驶】8月 端到端自动驾驶算法论文(arxiv20250819)
人工智能·机器学习·自动驾驶
聚客AI4 小时前
深度拆解AI大模型从训练框架、推理优化到市场趋势与基础设施挑战
图像处理·人工智能·pytorch·深度学习·机器学习·自然语言处理·transformer
arron88994 小时前
YOLOv8n-pose 模型使用
人工智能·深度学习·yolo
Coovally AI模型快速验证13 小时前
农田扫描提速37%!基于检测置信度的无人机“智能抽查”路径规划,Coovally一键加速模型落地
深度学习·算法·yolo·计算机视觉·transformer·无人机
RaymondZhao3414 小时前
【全面推导】策略梯度算法:公式、偏差方差与进化
人工智能·深度学习·算法·机器学习·chatgpt
zhangfeng113314 小时前
DBSCAN算法详解和参数优化,基于密度的空间聚类算法,特别擅长处理不规则形状的聚类和噪声数据
算法·机器学习·聚类
无规则ai15 小时前
动手学深度学习(pytorch版):第四章节—多层感知机(5)权重衰减
人工智能·pytorch·python·深度学习
网安INF16 小时前
【论文阅读】-《HopSkipJumpAttack: A Query-Efficient Decision-Based Attack》
论文阅读·人工智能·深度学习·网络安全·对抗攻击
雷达学弱狗18 小时前
backward怎么计算的是torch.tensor(2.0, requires_grad=True)变量的梯度
人工智能·pytorch·深度学习