基于PyTorch的深度学习——迁移学习3

提高模型的泛化能力最重要的3大因素是数据、模型和损失函数,其中数据又是3个因素中最重要的因素。但数据的获取往往不充分或成本比较高。那是否有其他方法,可以快速又便捷地增加数据量呢?在一些领域存在,如图像识别、语言识别等,可以通过水平或垂直翻转图像、裁剪、色彩变换、扩展和旋转等数据增强技术来增加数据量,被证明是非常有效地。

随机比例缩放主要使用的是torchvision.transforms.Resize()。

随机裁剪有两种方式,一种是对图像在随机位置进行截取,可传入裁剪大小,使用的函数为:torhvision.transforms.RandomCrop(),另外一种是在中心,按比例裁剪,函数为:torchvision.transforms.CenterCrop()。

翻转猫还是猫,不会改变其类别。通过翻转图像可以增加其多样性,所以随机翻转也是一种非常有效地手段。在torchvision中,随机翻转使用的是torchvision.transforms.RandomHorizontalFlip()、torchvision.transforms.RandomVerticalFlip()和torchvision.transforms.RandomRotation()等。

除了形状变化外,颜色变化又是另外一种增强方式,其可以设置亮度变化、对比度变化和颜色变化等,在torchvision中主要是用torchvision.transforms.ColorJitter()来实现的。

还可以使用torchvision.transforms.Compose()函数把以上这些变化组合在一起。[插图]

相关推荐
周杰伦_Jay1 天前
【Mac 上命令行安装 Claude Code】(Claude 的终端版 AI 编程助手)完整指南
人工智能·macos·claude code
一只理智恩1 天前
AI辅助,两天实现一个IM系统?
人工智能
薛定谔的猫19821 天前
二十、使用PyTorch和Hugging Face Transformers训练中文GPT-2模型的技术实践
人工智能·pytorch·gpt
zhangfeng11331 天前
大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表
人工智能·语言模型·开源·llama
爱打代码的小林1 天前
OpenCV 实现实时人脸检测
人工智能·opencv·计算机视觉
cyyt1 天前
深度学习周报(1.26~2.1)
人工智能·深度学习
YOLO视觉与编程1 天前
yolo26目标检测可视化界面系统源码
人工智能·目标检测·计算机视觉
你大爷的,这都没注册了1 天前
配置阿里百炼云平台的api_key
人工智能
Faker66363aaa1 天前
青香蕉尺寸分类与检测:从小尺寸香蕉手识别到模型优化_cascade-rcnn_hrnetv2p-w40-20e_coco
人工智能·分类·数据挖掘
shangjian0071 天前
AI-大语言模型LLM-模型微调8-进阶操作
人工智能·深度学习·语言模型