OpenCV 1

前言:开新坑辽,,


目录

计算机眼中的图像

视频的读取与处理

ROI区域

边界填充

数值计算

腐蚀操作

膨胀操作

开运算与闭运算

梯度计算

礼貌与黑帽

[Sobel算子 梯度计算方法](#Sobel算子 梯度计算方法)

scharr与laplacian


计算机眼中的图像

灰色图片,只有一个颜色通道

彩色图片,有三个颜色通道,并且都以矩阵的形式展示出来


%matplotlib inline:notebook特有,方便展示图片,少写代码

cv2.imread: 读取图像


cv2.imshow:展示图像

**'image':**给图像命名

cv2.waitKey(0):

"0",指按键盘任意键都可以取消图片的展示。

"1000"or"10000"等等,指当图片展示时间到1000or10000时,图片会自动消失

**cv2.destroyAllWindows():**结束代码

视频的读取与处理

**h(高):**414

**w(宽):**500

**c(通道数):**3 说明是彩色图


若想读取图像为灰度图像,则

其中,


保存代码:


问题1 :

if vc.isOpened():

open, frame = vc.read()

else: open = False,

这里的open和frame指的是什么?

  • open 是一个布尔变量 ,用来标记视频文件是否成功打开。
    • 如果 vc.isOpened() 返回 True,说明视频文件已被成功打开,此时 vc.read() 会返回两个值:第一个是一个布尔值 TrueFalse 表示是否有正确读取到帧,第二个值是实际读取到的图像帧。
    • 如果 vc.isOpened() 返回 False,说明视频文件没有被成功打开,此时直接设置 openFalse,而不调用 vc.read() 方法。
  • frame 是一个 NumPy 数组,代表从视频流中读取的一帧图像数据。如果成功读取了一帧,它将包含图像数据;如果没有成功读取或已经到了视频结尾,它的值将是 None

问题2:while open:

ret, frame = vc.read()

if frame is None:

break

这里的ret,frame指的是什么?

  • open 是一个布尔变量,用来控制循环的进行。
  • ret 是一个布尔值,表示是否成功读取到了一帧图像。如果 vc.read() 成功读取了一帧图像,它将返回 True;否则返回 False
  • frame 同上,是一个包含读取到的图像数据的 NumPy 数组,如果读取失败或达到视频末尾,其值为 None

问题3:ESC键是哪个键

  • ESC 键通常位于键盘的左上角,全称为"Escape",通常用来中断或退出当前操作。在很多程序中,按下 ESC 键可以关闭窗口或退出应用。ASCII码为27。

问题4:waitKey(?)

?:若为数字100,则展示速度较缓快

?:若为数字1000,则展示速度较缓


ROI区域

cat =img[0:50,0:200]

**0:50,0:200:**分别代表宽和长


**r.shape:**长宽是多少


cv2.merge:

在OpenCV中,cv2.merge()函数是用来合并多个单通道图像(例如BGR)成一个三通道彩色图像。在这个例子中,(b,g,r)表示三个单通道图像数组,它们会被合并成一个新的三通道图像。

img.shape输出的是新合并后的图像的维度信息,包括高度、宽度和通道数。在这个例子中,结果为(414, 500, 3),表明合并后的图像有414行、500列以及3个颜色通道(即RGB)。

所以,cv2.merge()的主要作用就是将多个单通道图像组合成一个完整的彩色图像。


BGR:分别的索引为0,1,2

因此,不要什么通道就将通道设置为0

比如:只保留R通道,即不需要BG通道,即将BG通道设置为0,即将索引编号为0,1设置为0

:,:,:表示所有,即整个图片的长度和宽度都要包含


边界填充

cv2.BORDER_WRAP的方法下,cde|abcde|abc为什么这样循环?

cv2.BORDER_WRAP: 用另一边的像素进行填充

假设我们有一个字符串 "abcde" 作为图像的一部分。在cv2.BORDER_WRAP模式下,边界像素会"环绕",即当超出边界时,会从相反的一侧取像素

考虑以下几种情况:

  1. 原始字符串"abcde"
  2. 向左扩展一个像素 :在这种情况下,我们需要取左边的像素。由于我们已经处于字符串的起始位置,我们需要从字符串的末尾取一个像素。因此,我们得到 "e|abcde"
  3. 向右扩展一个像素 :在这种情况下,我们需要取右边的像素。由于我们已经处于字符串的末尾位置,我们需要从字符串的起始位置取一个像素。因此,我们得到 "abcde|a"

现在,让我们看看您提供的字符串 "cde|abcde|abc" 是否可以解释为某种特定的扩展方式:

  • 左边的扩展"cde"。这看起来是从原始字符串 "abcde" 的第三个字符开始,一直到字符串末尾。
  • 中间的原始字符串"abcde"
  • 右边的扩展"abc"。这看起来是从原始字符串的起始位置开始,一直到倒数第二个字符。

数值计算

**+10:**矩阵里面的每一个值都加10


对于第一种相加的方式,要取模%256,即,若数值超过256,则取模

对于第二种相加的方式,若超过255,则计为255,若小于255,则就是那个数字


若要融合两张图片,必须使得两张图片的尺寸一致,也就是size一致,利用resize进行调整

第二种改变图片大小的方法,是放大or缩小多少倍数。(0,0)说明不指定具体数字


addWeighted(图片1,图片1的权重,图片2,图片2的权重,提亮多少)

R = ax1 + bx2 + b


腐蚀操作

iterations 为1,2,3 有以上不同的效果


膨胀操作

iterations 为1,2,3 有以上不同的效果


开运算与闭运算


梯度计算

得到边缘信息


礼貌与黑帽

礼帽:结果是不带刺的图案

黑帽:结果不带刺,只剩下一点字的轮廓了


Sobel算子 梯度计算方法

获得图案的轮廓

上减下,右减左

用上cv2.CV_64F以及convertScaleAbs的用处就是,即便是负数也可以。

scharr与laplacian

scharr能捕抓到更加细腻的细节

相关推荐
日出等日落几秒前
小白也能轻松上手的GPT-SoVITS AI语音克隆神器一键部署教程
人工智能·gpt
孤独且没人爱的纸鹤13 分钟前
【机器学习】深入无监督学习分裂型层次聚类的原理、算法结构与数学基础全方位解读,深度揭示其如何在数据空间中构建层次化聚类结构
人工智能·python·深度学习·机器学习·支持向量机·ai·聚类
后端研发Marion15 分钟前
【AI编辑器】字节跳动推出AI IDE——Trae,专为中文开发者深度定制
人工智能·ai编程·ai程序员·trae·ai编辑器
Tiger Z38 分钟前
R 语言科研绘图 --- 散点图-汇总
人工智能·程序人生·r语言·贴图
小深ai硬件分享2 小时前
Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘
服务器·人工智能·深度学习
hunter2062063 小时前
用opencv生成视频流,然后用rtsp进行拉流显示
人工智能·python·opencv
Daphnis_z3 小时前
大模型应用编排工具Dify之常用编排组件
人工智能·chatgpt·prompt
yuanbenshidiaos4 小时前
【大数据】机器学习----------强化学习机器学习阶段尾声
人工智能·机器学习
好评笔记9 小时前
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
算家云9 小时前
TangoFlux 本地部署实用教程:开启无限音频创意脑洞
人工智能·aigc·模型搭建·算家云、·应用社区·tangoflux