PNG格式的图像比JPG图像多一个Alpha通道

今天在进行深度学习训练的过程中,我使用

复制代码
img = cv.imread(img_path, cv.IMREAD_UNCHANGED)

来读取图片进行相关的模型训练工作,但是在运行的过程中总是会遇到如下错误:

复制代码
ValueError: operands could not be broadcast together with shapes (512,512,4) (3,) (512,512,4) 

可以看出错误的原因就是我的图片通道数是4,一开始我比较疑惑,我们图片明明是RGB的3通道图像,但是为什么总是显示是4通道呢?

最后经过搜索发现:PNG格式的图像是比JPG格式的图像多了一个Alpha通道,而我们上面的图片的读取过程中,使用了cv.IMREAD_UNCHANGED,即指定了读取的时候包含Alpha通道,所以才会出现上面的错误,随后我将cv.IMREAD_UNCHANGED删除,即

复制代码
img = cv.imread(img_path)

即可解决上述问题。

相关推荐
LiYingL1 小时前
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
图像处理
前端不太难5 小时前
RN 图像处理(裁剪、压缩、滤镜)性能很差怎么办?
图像处理·人工智能
明洞日记5 小时前
【VTK手册024】高效等值面提取:vtkFlyingEdges3D 详解与实战
c++·图像处理·vtk·图形渲染
c#上位机6 小时前
halcon创建对象数组——concat_obj
图像处理·计算机视觉·c#·halcon
song5017 小时前
鸿蒙 Flutter 日志系统:分级日志与鸿蒙 Hilog 集成
图像处理·人工智能·分布式·flutter·华为
c#上位机9 小时前
halcon求图像灰度最大值和最小值——min_max_gray
图像处理·人工智能·计算机视觉·c#·上位机·halcon
IT·小灰灰10 小时前
AI成为精确的执行导演:Runway Gen-4.5如何用控制美学重塑社媒视频工业
大数据·图像处理·人工智能·python·数据分析·音视频
Coding茶水间1 天前
基于深度学习的无人机视角检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
程序员鱼皮1 天前
干掉 Draw.io,这个程序员画图神器杀疯了!
图像处理·计算机·程序员·软件开发·编程经验
民乐团扒谱机1 天前
【微实验】直方图均衡化:让光影重获新生的魔法,在明暗之间编织细节的诗篇
图像处理·opencv·计算机视觉