以102flowers数据集为例训练ResNet50模型

以102flowers数据集为例训练ResNet50模型

使用飞桨高阶API,使用最少的代码量,实现在102flowers数据集训练ResNet50模型。同时可以一条命令修改成Mnist、Cifar10、Cifar100等数据集,换成其它模型也是只需要一句话代码。

数据集介绍

102flowers数据集是一个专门用于图像分类的数据集,主要涵盖了102种英国常见的花类。每个类别包含40到258张图像,总计包含了大量的图像数据。这些图像在比例、姿势以及光照方面有着丰富的变化,为图像分类任务提供了丰富的素材。官网网址为:https://www.robots.ox.ac.uk/\~vgg/data/flowers/102/

飞桨自带了该数据集,直接调用即可,会从飞桨站点自动下载数据文件。若是自定义数据集,可参考相关文档:https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/beginner/data_load_cn.html

ResNet模型介绍

ResNet(Residual Neural Network)是一种深度卷积神经网络,在2015年提出。ResNet通过使用残差块(ResNet Block)成功解决了深度网络训练时的梯度消失问题,使得更深的网络能够被训练。ResNet模型在ILSVRC2015比赛中取得了冠军,并在多个视觉任务中表现突出,因此在实践中得到了广泛应用。

根据网络深度,ResNet有18、34、50、101和152层等多种。一直到今天,ResNet依然是使用最广泛的模型。

在飞桨中可以用一条命令直接调用该模型,非常简单方便。

训练模型

使用飞桨高层API,在配置好数据集和模型后,只需要两句代码就可以开始训练。

完整训练代码

python 复制代码
# 导入飞桨PaddlePaddle框架
import paddle
# 导入PaddlePaddle的视觉处理模块中的函数,ToTensor用于将图像数据转换为张量格式,Resize用于调整图像大小,Compose用于组合多个转换操作。
from paddle.vision.transforms import ToTensor,Resize, Compose
# 导入Flowers数据集
from paddle.vision.datasets import Flowers

# 定义了一个转换组合,首先使用Resize将图像大小调整为224x224,然后使用ToTensor将图像转换为张量格式。
transform = Compose([Resize(size=(224, 224)), ToTensor()]) 
# 加载花朵数据集的训练集和测试集,并应用之前定义的转换组合。
train_dataset = Flowers(mode='train', transform=transform)
test_dataset = Flowers(mode='test', transform=transform)

# 直接调用飞桨ResNet34模型
resnet = paddle.vision.models.resnet34()

# model包含了训练功能
model = paddle.Model(resnet)

# 设置训练模型所需的optimizer, loss, metric
model.prepare(
    paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters()),
    paddle.nn.CrossEntropyLoss(),
    paddle.metric.Accuracy(topk=(1, 2))
    )

# 启动训练,20个epochs V100下大约10分钟
model.fit(train_dataset, epochs=20, batch_size=32, log_freq=100)

# 启动评估
model.evaluate(test_dataset, log_freq=20, batch_size=64)

最终精度为:

python 复制代码
{'loss': [1.3582209348678589], 'acc_top1': 0.6813725490196079, 'acc_top2': 0.8}
相关推荐
野蛮的大西瓜13 分钟前
开源呼叫中心中,如何将ASR与IVR菜单结合,实现动态的IVR交互
人工智能·机器人·自动化·音视频·信息与通信
CountingStars61938 分钟前
目标检测常用评估指标(metrics)
人工智能·目标检测·目标跟踪
tangjunjun-owen1 小时前
第四节:GLM-4v-9b模型的tokenizer源码解读
人工智能·glm-4v-9b·多模态大模型教程
冰蓝蓝1 小时前
深度学习中的注意力机制:解锁智能模型的新视角
人工智能·深度学习
橙子小哥的代码世界1 小时前
【计算机视觉基础CV-图像分类】01- 从历史源头到深度时代:一文读懂计算机视觉的进化脉络、核心任务与产业蓝图
人工智能·计算机视觉
新加坡内哥谈技术2 小时前
苏黎世联邦理工学院与加州大学伯克利分校推出MaxInfoRL:平衡内在与外在探索的全新强化学习框架
大数据·人工智能·语言模型
fanstuck2 小时前
Prompt提示工程上手指南(七)Prompt编写实战-基于智能客服问答系统下的Prompt编写
人工智能·数据挖掘·openai
lovelin+v175030409662 小时前
安全性升级:API接口在零信任架构下的安全防护策略
大数据·数据库·人工智能·爬虫·数据分析
唐小旭2 小时前
python3.6搭建pytorch环境
人工智能·pytorch·python
洛阳泰山3 小时前
MaxKB基于大语言模型和 RAG的开源知识库问答系统的快速部署教程
人工智能·语言模型·开源·rag·maxkb