【huggingface】【pytorch-image-models】timm框架中使用albumentations库数据增广

文章目录

  • 一、前言
  • 二、实操
    • [2.1 声明库](#2.1 声明库)
    • [2.2 定义你的数据增广算子](#2.2 定义你的数据增广算子)
    • [2.3 加入其中](#2.3 加入其中)

一、前言

问题是这样的,在使用timm框架训练时,发现数据增广不够,想用Albumentations库的数据增广,怎么把后者嵌入到前者的训练中。

其实也是比较简单的,这里笔者也是做个笔记以往忘记,需要的童鞋自取。

二、实操

我们知道训练才需要数据增广,原始的数据增广是在:

其实也就是用XXX_tfl来收集数据增广的算子,

那么要加入Albumentations的算子,只需要3步:

2.1 声明库

py 复制代码
import numpy as np
from PIL import Image
import albumentations as A

2.2 定义你的数据增广算子

py 复制代码
albumentations_transform = A.Compose([
    A.XXXXX()
])

2.3 加入其中

py 复制代码
primary_tfl += [
    transforms.Lambda(lambda img: Image.fromarray(
        albumentations_transform_1(image=np.array(img))['image'].astype('uint8')))
]

这样在最后跟原始的数据增广算子,用transforms.Compose(XX)返回即可,这个本身自带了。

以上就可以搞定,在根据我之前的博客打印出预处理以后的图片即可。Enjoy~

∼ O n e p e r s o n g o f a s t e r , a g r o u p o f p e o p l e c a n g o f u r t h e r ∼ \sim_{One\ person\ go\ faster,\ a\ group\ of\ people\ can\ go\ further}\sim ∼One person go faster, a group of people can go further∼

相关推荐
Elastic 中国社区官方博客12 分钟前
Elasticsearch:智能搜索的 MCP
大数据·人工智能·elasticsearch·搜索引擎·全文检索
stbomei15 分钟前
从“能说话”到“会做事”:AI Agent如何重构日常工作流?
人工智能
yzx9910131 小时前
生活在数字世界:一份人人都能看懂的网络安全生存指南
运维·开发语言·网络·人工智能·自动化
许泽宇的技术分享2 小时前
LangGraph深度解析:构建下一代智能Agent的架构革命——从Pregel到现代AI工作流的技术飞跃
人工智能·架构
乔巴先生242 小时前
LLMCompiler:基于LangGraph的并行化Agent架构高效实现
人工智能·python·langchain·人机交互
张子夜 iiii3 小时前
实战项目-----Python+OpenCV 实现对视频的椒盐噪声注入与实时平滑还原”
开发语言·python·opencv·计算机视觉
静西子3 小时前
LLM大语言模型部署到本地(个人总结)
人工智能·语言模型·自然语言处理
cxr8283 小时前
基于Claude Code的 规范驱动开发(SDD)指南
人工智能·hive·驱动开发·敏捷流程·智能体
Billy_Zuo3 小时前
人工智能机器学习——决策树、异常检测、主成分分析(PCA)
人工智能·决策树·机器学习
小王爱学人工智能4 小时前
OpenCV的图像金字塔
人工智能·opencv·计算机视觉