以102flowers数据集为例训练ResNet50模型

以102flowers数据集为例训练ResNet50模型

使用飞桨高阶API,使用最少的代码量,实现在102flowers数据集训练ResNet50模型。同时可以一条命令修改成Mnist、Cifar10、Cifar100等数据集,换成其它模型也是只需要一句话代码。

数据集介绍

102flowers数据集是一个专门用于图像分类的数据集,主要涵盖了102种英国常见的花类。每个类别包含40到258张图像,总计包含了大量的图像数据。这些图像在比例、姿势以及光照方面有着丰富的变化,为图像分类任务提供了丰富的素材。官网网址为:https://www.robots.ox.ac.uk/\~vgg/data/flowers/102/

飞桨自带了该数据集,直接调用即可,会从飞桨站点自动下载数据文件。若是自定义数据集,可参考相关文档:https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/beginner/data_load_cn.html

ResNet模型介绍

ResNet(Residual Neural Network)是一种深度卷积神经网络,在2015年提出。ResNet通过使用残差块(ResNet Block)成功解决了深度网络训练时的梯度消失问题,使得更深的网络能够被训练。ResNet模型在ILSVRC2015比赛中取得了冠军,并在多个视觉任务中表现突出,因此在实践中得到了广泛应用。

根据网络深度,ResNet有18、34、50、101和152层等多种。一直到今天,ResNet依然是使用最广泛的模型。

在飞桨中可以用一条命令直接调用该模型,非常简单方便。

训练模型

使用飞桨高层API,在配置好数据集和模型后,只需要两句代码就可以开始训练。

完整训练代码

python 复制代码
# 导入飞桨PaddlePaddle框架
import paddle
# 导入PaddlePaddle的视觉处理模块中的函数,ToTensor用于将图像数据转换为张量格式,Resize用于调整图像大小,Compose用于组合多个转换操作。
from paddle.vision.transforms import ToTensor,Resize, Compose
# 导入Flowers数据集
from paddle.vision.datasets import Flowers

# 定义了一个转换组合,首先使用Resize将图像大小调整为224x224,然后使用ToTensor将图像转换为张量格式。
transform = Compose([Resize(size=(224, 224)), ToTensor()]) 
# 加载花朵数据集的训练集和测试集,并应用之前定义的转换组合。
train_dataset = Flowers(mode='train', transform=transform)
test_dataset = Flowers(mode='test', transform=transform)

# 直接调用飞桨ResNet34模型
resnet = paddle.vision.models.resnet34()

# model包含了训练功能
model = paddle.Model(resnet)

# 设置训练模型所需的optimizer, loss, metric
model.prepare(
    paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters()),
    paddle.nn.CrossEntropyLoss(),
    paddle.metric.Accuracy(topk=(1, 2))
    )

# 启动训练,20个epochs V100下大约10分钟
model.fit(train_dataset, epochs=20, batch_size=32, log_freq=100)

# 启动评估
model.evaluate(test_dataset, log_freq=20, batch_size=64)

最终精度为:

python 复制代码
{'loss': [1.3582209348678589], 'acc_top1': 0.6813725490196079, 'acc_top2': 0.8}
相关推荐
Juicedata14 分钟前
JuiceFS v1.3-Beta2:集成 Apache Ranger,实现更精细化的权限控制
运维·人工智能·ai
Work(沉淀版)2 小时前
DAY 40
人工智能·深度学习·机器学习
蓦然回首却已人去楼空3 小时前
Build a Large Language Model (From Scratch) 序章
人工智能·语言模型·自然语言处理
CM莫问3 小时前
<论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
人工智能·算法·语言模型·自然语言处理·大模型·推理加速
拾忆-eleven3 小时前
NLP学习路线图(二十六):自注意力机制
人工智能·深度学习
MYH5164 小时前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
要努力啊啊啊4 小时前
KV Cache:大语言模型推理加速的核心机制详解
人工智能·语言模型·自然语言处理
mzlogin6 小时前
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
人工智能
归去_来兮6 小时前
知识图谱技术概述
大数据·人工智能·知识图谱
就是有点傻6 小时前
VM图像处理之图像二值化
图像处理·人工智能·计算机视觉