paddlepaddle框架构建数据集进行分类问题的时候,会发现数据集在构建的过程中不会构建标签(花分类)

问题描述

在做一个paddlepaddle项目的时候,需要使用神经网络对他进行分类,数据集的结构如下图,这时候我们可以使用常用dataset方法对数据集进行构建。

这时候我们就会发现一个问题,就是这个矿建不是构建标签,也就是说不能将该文件内的图片分配类别,这和torch中的dataset构建是不一样的。那么这时候,就需要我们手动的去构建这个,这时候,我们自定义类,代码如下。

python 复制代码
class CustomImageFolder(DatasetFolder):
    def __init__(self, root, transform=None, ):
        super(CustomImageFolder, self).__init__(root, transform=transform)

    def __getitem__(self, idx):
        img, label = super(CustomImageFolder, self).__getitem__(idx)

        # 添加图像增强
        img = Resize((224, 224))(img)
        img = RandomHorizontalFlip()(img)
        img = ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1)(img)
        img = ToTensor()(img)
        img = paddle.transpose(img, perm=[2, 0, 1])

        return img, label

# 加载数据集并应用自定义转换
dataset = CustomImageFolder(root=data_dir, transform=None)

这时候返回的数据集就会自带类别标签了,可以将dataset0打印出来看看结果。

相关推荐
王木风7 分钟前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
信实翻译7 分钟前
分账模式翻译:跨越商业与语言的精密计算
人工智能
EAIReport10 分钟前
企业级AI智能体平台说明
人工智能
智海观潮13 分钟前
UniScientist:30B开源科研大模型突破,重构AI自主研究范式
人工智能·ai·大模型
chen_zn9515 分钟前
VLA 的 Co-training:通过多源数据提升机器人泛化能力
人工智能·深度学习·具身智能·vla
AI客栈16 分钟前
K8s 调度器扩展:从 Scheduling Framework 到自定义插件的工程实战
人工智能
大模型最新论文速读27 分钟前
06-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·自然语言处理
城事漫游Molly35 分钟前
如何用 ChatGPT 辅助写文献综述,而不是编造文献?
人工智能·chatgpt·提示词·ai for science·文献综述
-山中问答-36 分钟前
【智能体工具使用实战06】工具增强型Agent的评测体系
人工智能·智能体·工具调用·测评体系
_codemonster38 分钟前
手语识别损失函数
人工智能·深度学习·机器学习