人工智能-计算机视觉之图像增广

计算机视觉之图像增广

大型数据集是成功应用深度神经网络的先决条件。 图像增广在对训练图像进行一系列的随机变化之后,生成相似但不同的训练样本,从而扩大了训练集的规模。 此外,应用图像增广的原因是,随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力。 例如,我们可以以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖。 我们还可以调整亮度、颜色等因素来降低模型对颜色的敏感度。 可以说,图像增广技术对于AlexNet的成功是必不可少的。本节将讨论这项广泛应用于计算机视觉的技术。

python 复制代码
%matplotlib inline
from mxnet import autograd, gluon, image, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

常用的图像增广方法

python 复制代码
d2l.set_figsize()
img = image.imread('../img/cat1.jpg')
d2l.plt.imshow(img.asnumpy());

07:07:52\] ../src/storage/storage.cc:196: Using Pooled (Naive) StorageManager for CPU

大多数图像增广方法都具有一定的随机性。为了便于观察图像增广的效果,我们下面定义辅助函数apply。 此函数在输入图像img上多次运行图像增广方法aug并显示所有结果。

python 复制代码
def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
    Y = [aug(img) for _ in range(num_rows * num_cols)]
    d2l.show_images(Y, num_rows, num_cols, scale=scale)
相关推荐
WebCandy几秒前
【开源】一个丝滑的 Claude Code 环境变量快速切换工具
人工智能·aigc·ai编程
共绩算力4 分钟前
更小模型实现更强视觉 OCR
人工智能·ocr·共绩算力
胡乱编胡乱赢8 分钟前
关于联邦学习中的Decaf攻击基础知识
人工智能·深度学习·机器学习
五度易链-区域产业数字化管理平台12 分钟前
如何构建高质量产业数据信息库?五度易链的“八大核心库”与数据治理实践
大数据·人工智能
优宁维生物15 分钟前
DNA 提取的基础方法
人工智能·算法
Elastic 中国社区官方博客20 分钟前
用 Elasticsearch 构建一个 ChatGPT connector 来查询 GitHub issues
大数据·人工智能·elasticsearch·搜索引擎·chatgpt·github·全文检索
奔跑的石头_38 分钟前
如何用AI创建一个适合你的编程社区用户名
人工智能
yuhaiqun198938 分钟前
10分钟快速get:零基础AI人工智能学习路线
人工智能·学习
m0_6501082441 分钟前
Co-MTP:面向自动驾驶的多时间融合协同轨迹预测框架
论文阅读·人工智能·自动驾驶·双时间域融合·突破单车感知局限·帧间轨迹预测·异构图transformer
向阳逐梦41 分钟前
电子烟的4种屏幕驱动集成语音方案介绍
人工智能·语音识别