【huggingface】【pytorch-image-models】timm框架中使用albumentations库数据增广

文章目录

  • 一、前言
  • 二、实操
    • [2.1 声明库](#2.1 声明库)
    • [2.2 定义你的数据增广算子](#2.2 定义你的数据增广算子)
    • [2.3 加入其中](#2.3 加入其中)

一、前言

问题是这样的,在使用timm框架训练时,发现数据增广不够,想用Albumentations库的数据增广,怎么把后者嵌入到前者的训练中。

其实也是比较简单的,这里笔者也是做个笔记以往忘记,需要的童鞋自取。

二、实操

我们知道训练才需要数据增广,原始的数据增广是在:

其实也就是用XXX_tfl来收集数据增广的算子,

那么要加入Albumentations的算子,只需要3步:

2.1 声明库

py 复制代码
import numpy as np
from PIL import Image
import albumentations as A

2.2 定义你的数据增广算子

py 复制代码
albumentations_transform = A.Compose([
    A.XXXXX()
])

2.3 加入其中

py 复制代码
primary_tfl += [
    transforms.Lambda(lambda img: Image.fromarray(
        albumentations_transform_1(image=np.array(img))['image'].astype('uint8')))
]

这样在最后跟原始的数据增广算子,用transforms.Compose(XX)返回即可,这个本身自带了。

以上就可以搞定,在根据我之前的博客打印出预处理以后的图片即可。Enjoy~

∼ O n e p e r s o n g o f a s t e r , a g r o u p o f p e o p l e c a n g o f u r t h e r ∼ \sim_{One\ person\ go\ faster,\ a\ group\ of\ people\ can\ go\ further}\sim ∼One person go faster, a group of people can go further∼

相关推荐
冬奇Lab9 分钟前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab14 分钟前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾33 分钟前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒2 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
用户8356290780513 小时前
Python 实现 PDF 文件加密与解密方法
后端·python
用户8356290780513 小时前
使用 Python 冻结与拆分 Excel 窗格教程
后端·python
阿里云大数据AI技术4 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12274 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队4 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发