OpenCV 1

前言:开新坑辽,,


目录

计算机眼中的图像

视频的读取与处理

ROI区域

边界填充

数值计算

腐蚀操作

膨胀操作

开运算与闭运算

梯度计算

礼貌与黑帽

[Sobel算子 梯度计算方法](#Sobel算子 梯度计算方法)

scharr与laplacian


计算机眼中的图像

灰色图片,只有一个颜色通道

彩色图片,有三个颜色通道,并且都以矩阵的形式展示出来


%matplotlib inline:notebook特有,方便展示图片,少写代码

cv2.imread: 读取图像


cv2.imshow:展示图像

**'image':**给图像命名

cv2.waitKey(0):

"0",指按键盘任意键都可以取消图片的展示。

"1000"or"10000"等等,指当图片展示时间到1000or10000时,图片会自动消失

**cv2.destroyAllWindows():**结束代码

视频的读取与处理

**h(高):**414

**w(宽):**500

**c(通道数):**3 说明是彩色图


若想读取图像为灰度图像,则

其中,


保存代码:


问题1 :

if vc.isOpened():

open, frame = vc.read()

else: open = False,

这里的open和frame指的是什么?

  • open 是一个布尔变量 ,用来标记视频文件是否成功打开。
    • 如果 vc.isOpened() 返回 True,说明视频文件已被成功打开,此时 vc.read() 会返回两个值:第一个是一个布尔值 TrueFalse 表示是否有正确读取到帧,第二个值是实际读取到的图像帧。
    • 如果 vc.isOpened() 返回 False,说明视频文件没有被成功打开,此时直接设置 openFalse,而不调用 vc.read() 方法。
  • frame 是一个 NumPy 数组,代表从视频流中读取的一帧图像数据。如果成功读取了一帧,它将包含图像数据;如果没有成功读取或已经到了视频结尾,它的值将是 None

问题2:while open:

ret, frame = vc.read()

if frame is None:

break

这里的ret,frame指的是什么?

  • open 是一个布尔变量,用来控制循环的进行。
  • ret 是一个布尔值,表示是否成功读取到了一帧图像。如果 vc.read() 成功读取了一帧图像,它将返回 True;否则返回 False
  • frame 同上,是一个包含读取到的图像数据的 NumPy 数组,如果读取失败或达到视频末尾,其值为 None

问题3:ESC键是哪个键

  • ESC 键通常位于键盘的左上角,全称为"Escape",通常用来中断或退出当前操作。在很多程序中,按下 ESC 键可以关闭窗口或退出应用。ASCII码为27。

问题4:waitKey(?)

?:若为数字100,则展示速度较缓快

?:若为数字1000,则展示速度较缓


ROI区域

cat =img[0:50,0:200]

**0:50,0:200:**分别代表宽和长


**r.shape:**长宽是多少


cv2.merge:

在OpenCV中,cv2.merge()函数是用来合并多个单通道图像(例如BGR)成一个三通道彩色图像。在这个例子中,(b,g,r)表示三个单通道图像数组,它们会被合并成一个新的三通道图像。

img.shape输出的是新合并后的图像的维度信息,包括高度、宽度和通道数。在这个例子中,结果为(414, 500, 3),表明合并后的图像有414行、500列以及3个颜色通道(即RGB)。

所以,cv2.merge()的主要作用就是将多个单通道图像组合成一个完整的彩色图像。


BGR:分别的索引为0,1,2

因此,不要什么通道就将通道设置为0

比如:只保留R通道,即不需要BG通道,即将BG通道设置为0,即将索引编号为0,1设置为0

:,:,:表示所有,即整个图片的长度和宽度都要包含


边界填充

cv2.BORDER_WRAP的方法下,cde|abcde|abc为什么这样循环?

cv2.BORDER_WRAP: 用另一边的像素进行填充

假设我们有一个字符串 "abcde" 作为图像的一部分。在cv2.BORDER_WRAP模式下,边界像素会"环绕",即当超出边界时,会从相反的一侧取像素

考虑以下几种情况:

  1. 原始字符串"abcde"
  2. 向左扩展一个像素 :在这种情况下,我们需要取左边的像素。由于我们已经处于字符串的起始位置,我们需要从字符串的末尾取一个像素。因此,我们得到 "e|abcde"
  3. 向右扩展一个像素 :在这种情况下,我们需要取右边的像素。由于我们已经处于字符串的末尾位置,我们需要从字符串的起始位置取一个像素。因此,我们得到 "abcde|a"

现在,让我们看看您提供的字符串 "cde|abcde|abc" 是否可以解释为某种特定的扩展方式:

  • 左边的扩展"cde"。这看起来是从原始字符串 "abcde" 的第三个字符开始,一直到字符串末尾。
  • 中间的原始字符串"abcde"
  • 右边的扩展"abc"。这看起来是从原始字符串的起始位置开始,一直到倒数第二个字符。

数值计算

**+10:**矩阵里面的每一个值都加10


对于第一种相加的方式,要取模%256,即,若数值超过256,则取模

对于第二种相加的方式,若超过255,则计为255,若小于255,则就是那个数字


若要融合两张图片,必须使得两张图片的尺寸一致,也就是size一致,利用resize进行调整

第二种改变图片大小的方法,是放大or缩小多少倍数。(0,0)说明不指定具体数字


addWeighted(图片1,图片1的权重,图片2,图片2的权重,提亮多少)

R = ax1 + bx2 + b


腐蚀操作

iterations 为1,2,3 有以上不同的效果


膨胀操作

iterations 为1,2,3 有以上不同的效果


开运算与闭运算


梯度计算

得到边缘信息


礼貌与黑帽

礼帽:结果是不带刺的图案

黑帽:结果不带刺,只剩下一点字的轮廓了


Sobel算子 梯度计算方法

获得图案的轮廓

上减下,右减左

用上cv2.CV_64F以及convertScaleAbs的用处就是,即便是负数也可以。

scharr与laplacian

scharr能捕抓到更加细腻的细节

相关推荐
羊小猪~~4 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
AI小杨5 分钟前
【车道线检测】一、传统车道线检测:基于霍夫变换的车道线检测史诗级详细教程
人工智能·opencv·计算机视觉·霍夫变换·车道线检测
晨曦_子画9 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
道可云11 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
人工智能培训咨询叶梓20 分钟前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
zzZ_CMing20 分钟前
大语言模型训练的全过程:预训练、微调、RLHF
人工智能·自然语言处理·aigc
newxtc22 分钟前
【旷视科技-注册/登录安全分析报告】
人工智能·科技·安全·ddddocr
成都古河云23 分钟前
智慧场馆:安全、节能与智能化管理的未来
大数据·运维·人工智能·安全·智慧城市
UCloud_TShare25 分钟前
浅谈语言模型推理框架 vLLM 0.6.0性能优化
人工智能
软工菜鸡30 分钟前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert