《深度学习》OpenCV 计算机视觉入门 (上篇)

目录

一、了解OpenCV

1、简介

2、导包

3、了解图片构成

二、函数运用

1、展示图片

2、展示图片属性

[1)img.shape 形状](#1)img.shape 形状)

[2)img.dtype 类型](#2)img.dtype 类型)

像素值类型:

[3)img.size 尺寸](#3)img.size 尺寸)

4)演示,img为上图

3、展示灰度图

1)使用cv2.cvtColor()

2)直接使用参数

3)运行结果

4)对比

4、保存图片

5、了解视频构成

6、展示视频

1)videoCapture()

2)isopend()

3)read()

[• 返回值ret](#• 返回值ret)

[• 返回值frame](#• 返回值frame)

4)实例展示

7、图片的切片

8、切分图片通道

1)直接切分

2)split切分

9、图片部分打码

10、图片缩放

参数解释:


一、了解OpenCV

1、简介

OpenCV (Open Source Computer Vision)是一个开放源代码的计算机视觉库 ,提供了一系列用于处理图像和视频的函数和算法。

它可以用于开发各种计算机视觉应用程序,包括人脸检测、目标跟踪、图像分类、图像分割等。

OpenCV支持多种编程语言 ,包括C++、Python和Java,并且可以在多个操作系统上运行,包括Windows、Linux和Mac OS X。OpenCV是一个广泛使用的计算机视觉库,被用于许多领域,如工业自动化、医学影像分析、机器人视觉等。

2、导包

python 复制代码
pip install opencv-python==3.4.2
python 复制代码
pip install opencv-contrib-python==3.4.2  # opencv扩展库,包含其他一些图像处理算法函数的扩展库

**注意:**此处两个版本必须相同,防止不兼容问题

3、了解图片构成

一张图片由图像数据组成,图像数据是由像素 (pixel)组成的。每个像素代表着图像中的一个点,每个像素包含了图像在该点处的颜色信息。图像的分辨率决定了图像中的像素数量,分辨率越高,图像越清晰。

图像可以以不同的色彩模型 来表示颜色,最常用的是RGB 色彩模型。RGB色彩模型 是一种加法 色彩模型,其中的三个通道分别表示了红色R绿色G蓝色B亮度。通过调整这三个分量的数值,可以得到不同的颜色。

此外,还有其他一些重要的图像属性 ,如亮度、对比度、饱和度 等。亮度表示图像的明暗程度 ,对比度表示图像中不同颜色之间的差异程度 ,饱和度表示图像的颜色鲜艳程度

二、函数运用

1、展示图片

python 复制代码
import cv2  # 导入OpenCV 包

img = cv2.imread('girl.jpg') # 读取图片
cv2.imshow("aa",img)  # 展示图片,展示图片的标签名字为aa
cv2.waitKey(10000)  # 图片展示时间,其内参数为毫秒,如果参数设置为0,可以点击键盘任意键关闭图片
cv2.destroyAllWindows() # 用于关闭所有已经创建的窗口。

运行结果如下所示:(图像来源网络,如有侵权敬请告知删除)

2、展示图片属性

1)img.shape 形状

用于获取图像的形状信息。它返回一个包含图像行数、列数和通道数的元组。

2)img.dtype 类型

用于获取图像的数据类型。它返回一个描述图像像素值类型的字符串。

像素值类型:
  • uint8:无符号8位整型,表示像素值范围为 0-255。
  • int8:有符号8位整型,表示像素值范围为 -128-127。
  • uint16:无符号16位整型,表示像素值范围为 0-65535。
  • int16:有符号16位整型,表示像素值范围为 -32768-32767。
  • float32:32位浮点型,表示像素值范围为 -∞-∞。
  • float64:64位浮点型,表示像素值范围为 -∞-∞。
3)img.size 尺寸

用于获取图像的尺寸信息。它返回一个包含两个元素的元组,表示图像的高度和宽度。

4)演示,img为上图
python 复制代码
print("图片形状:",img.shape)
print("图片数据类型:",img.dtype)
print("图形大小:",img.size)

运行结果如下图,

图像形状所示内容表示,宽度为940个像素,高度为627个像素,通道数为3,即RGB三通道

这里的图像尺寸为图像形状的三个值相乘

3、展示灰度图

1)使用cv2.cvtColor()
python 复制代码
img = cv2.imread('girl.jpg')  # 导入彩色图片
img1 = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)  # 转变为灰度图
2)直接使用参数
python 复制代码
img = cv2.imread('girl.jpg',cv2.IMREAD_GRAYSCALE)
3)运行结果
4)对比

调试模式 下可以看到彩色图片的格式为:

灰度图下的格式为:

此时少了一个rgb三通道数

4、保存图片

python 复制代码
cv2.imwrite(r'./girl_gray.jpg',img)  # 这里的./表示当前目录下,命名为girl_gray.jpg

5、了解视频构成

一个视频 由一系列连续的图像帧 组成。每一帧都是一个静止的图像 ,当这些图像以一定的速率连续播放时,就会形成动态的视频。视频的每一帧都包含了图像的像素信息,包括颜色、亮度等。通过在一定的时间间隔内连续播放这些帧,就能够产生流畅的视频效果。

除了图像帧之外,视频还可以包含音频轨道、元数据以及其他附加信息。在视频文件中,这些信息以特定的文件格式(如AVI、MP4等)进行封装,以便能够方便地进行存储和传输。

6、展示视频

1)videoCapture()

创建一个视频捕捉对象,括号内写入参数为视频地址,也可以设置参数为0,则表示捕获当前电脑默认摄像头,如果有多个摄像头可用,可以传入不同的数字来选择相应的摄像头。

2)isopend()

用于判断视频捕获对象是否捕获成功,返回布尔值true、false

3)read()

读取捕获的视频的下一帧图像,一帧表示一个图像,这里可以使用死循环来不断读取所有的帧,

• 返回值ret

用于判断是否读取成功,返回布尔值true和false

• 返回值frame

用于表示读取到的帧,类型为numpy数组,可以对其进行处理,如显示、保存、分析

4)实例展示
python 复制代码
import cv2
video_capture = cv2.VideoCapture("tiger9.mp4")  # 创建一个视频捕捉对象

if not video_capture.isOpened():   # 判断是否捕获成功
    print("错误")
    exit()

while True:
    # ret返回bool值,读取成功为ret,每帧图片表示frame
    ret,frame = video_capture.read()
    if not ret:
        break
# 灰度图
    frame = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
    cv2.imshow('video',frame)
# 每帧图片停留时间,如果键入esc则停止
    if cv2.waitKey(30) == 27:
        break
# 释放资源
video_capture.release()
cv2.destroyAllWindows()

此处的cv2.waitkey(30) == 27 用于判断键盘点击位置是否是esc键,其值对应为ascll码

运行结果为:

7、图片的切片

python 复制代码
import cv2
a = cv2.imread('girl.jpg')  # 导入图片
a_new = a.copy()  # 复制图片
# 切片
b = a_new[100:300,100:500]  # 高宽,高度为像素值范围为100~300,宽度范围为100~500
cv2.imshow('bb',b)  # 展示图片
cv2.waitKey(10000)
cv2.destroyAllWindows()

其运行结果为:

8、切分图片通道

1)直接切分
python 复制代码
import cv2
a = cv2.imread('girl.jpg')

a1 = a[:,:,0]  # 0表示切分的通道为B
a2 = a[:,:,1]  # 1表示切分的通道为G
a3 = a[:,:,2]  # 2表示切分的通道为R

cv2.imshow('B',a1) 
cv2.waitKey(0)

此时展示的图片为灰色的,如果想展示带切分通道颜色的,可以增加以下内容:

python 复制代码
a[:,:,0] = 0  # 将B通道值改变为0
a[:,:,1] = 0  # 将G通道值改变为0
cv2.imshow('R',a) # 展示a图

此时展示画面为:

2)split切分
python 复制代码
b,g,r = cv2.split(img) 

此时返回三个参数,分别表示bgr三通道的图片

9、图片部分打码

python 复制代码
import cv2
import numpy as np
a = cv2.imread('girl.jpg')
a[100:200,200:300] = np.random.randint(0,256,(100,100,3))  
cv2.imshow('a',a)
cv2.waitKey(1000)
cv2.destroyAllWindows()

**a[100:200,200:300]**表示图片的切片,即将高100~200,宽200~300的位置取出

np.random.randint(0,256,(100,100,3)) 使用numpy函数里的random.randint随机生成整数,括号内参数表示0~256之间的随机整数,(100,100,3)表示生成的形状为一个100x100大小的二维数组,每个元素是一个包含3个随机整数的一维数组。

运行结果为:

10、图片缩放
python 复制代码
import cv2
a = cv2.imread('girl.jpg')
a_new = cv2.resize(a,dsize=None,fx=1.3,fy=1.3) # 将图片高宽都更改为1.3倍
cv2.imshow("aa",a_new)
cv2.waitKey(10000)
cv2.destroyAllWindows()
参数解释:

a_new = cv2.resize(a,dsize=None,fx=1.3,fy=1.3)

  • a 是要调整大小的输入图像。
  • dsize 是目标图像的大小,可以通过设置dsize参数来指定目标图像的大小,或者通过设置fxfy参数来按比例调整图像大小。例如cv2.resize(a,(400,500))
    • 如果dsize参数不为None,则将图像调整为dsize指定的大小。
    • 如果fxfy参数都为None,则图像大小不会改变,返回与输入图像一样大小的图像。
    • 如果只设置了fx参数,那么图像的宽度会按照fx的比例进行调整,高度会根据宽度的比例自动调整。
    • 如果只设置了fy参数,那么图像的高度会按照fy的比例进行调整,宽度会根据高度的比例自动调整。
    • 如果同时设置了fxfy参数,那么图像的宽度和高度都会按照对应的比例进行调整。
相关推荐
芙蓉姐姐陪你写论文5 分钟前
别再为创新点发愁了!ChatGPT助你快速搞定!
大数据·论文阅读·人工智能·chatgpt·ai写作·论文笔记·aipapergpt
967710 分钟前
神经网络的线性部分和非线性部分
人工智能·深度学习·神经网络
富士达幸运星33 分钟前
模板匹配应用(opencv的妙用)
人工智能·opencv·计算机视觉
安科瑞蒋静1 小时前
介绍 TensorFlow 的基本概念和使用场景
人工智能
Aha_aho1 小时前
【pytorch】keepdim参数解析
人工智能·pytorch·python
AI大模型训练家1 小时前
大模型 LLM(Large Language Models)如今十分火爆,对于初入此领域的新人小白来说,应该如何入门 LLM 呢?是否有值得推荐的入门教程呢?
人工智能·语言模型·自然语言处理·chatgpt·aigc·agi
天润融通1 小时前
AI客服机器人开启企业客户服务新纪元
人工智能·其他·机器人
超维机器人1 小时前
智能巡检机器人局部放电检测的应用
运维·人工智能·算法·机器人
AI科研视界1 小时前
机器人可能会在月球上提供帮助
人工智能·机器人
天下谁人不识军1 小时前
【深度学习】注意力机制介绍,了解什么是注意力计算规则以及常见的计算规则,知道注意力机制的工作流程
人工智能·python·深度学习