文章目录
一、OpenCV
1.介绍
-
OpenCV(开放源代码计算机视觉库)是一个开源的计算机视觉和机器学习软件库。由一系列 C++ 类和函数构成,用于图像处理、计算机视觉领域的算法实现。
-
OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
2.下载
python
x pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python
3.图像的表示
- 图像一般是RGB三原色图。RGB图上的每个点都是由红(R)、绿(G)、蓝(B)三个颜色按照一定比例混合而成的;在OpenCV中,默认情况下,彩色图像是以BGR(蓝-绿-红)顺序存储。
- 彩色图像:三维数组存储【行数,列数,通道数(一般是3)】
- 灰色图像:二维存储【行数,列数】
- 数组存储的数据类型(dtype):图像中的每个像素值的数据类型决定了可以存储的最大值。例如,8位无符号整数(uint8)允许的范围是从0到255。
4.图像的基本操作
4.1图片读取或创建
4.1.1读取
- cv2.imread(filename)
- 参数:
- filename:图像路径
4.1.2创建
python
import cv2
import numpy as np
# 设置图像尺寸
height, width = 512, 512
# 创建一个空白的彩色图像-----三维数组,8位
img = np.zeros((height, width, 3), dtype=np.uint8)
# 修改像素值-----0~255的随机整数,大小相同的数组
img[::] = np.random.randint(0, 256, img.shape)
# 设置显示的图像---z'd
cv2.imshow('Random Color Image', img)
# 显示时间
cv2.waitKey(0)
# 释放内存
cv2.destroyAllWindows()
4.2创建窗口
用于显示图片。不创建也可以,在显示的时候可以自动创建。
-
cv2.namedWindow(winname [,窗口属性])
-
使用
cv2.namedWindow()
方法创建一个新的窗口。你可以为这个窗口指定一个名称,并且可以选择窗口的属性(例如,是否可调整大小)。 -
参数:
-
winname
:窗口名 -
窗口属性:窗口大小是否可调整
cv2.WINDOW_AUTOSIZE
:默认,窗口自适应大小,不能调整cv2.WINDOW_NORMAL
:窗口大小是可调整的,用户可以通过鼠标拖动窗口边缘来自由改变窗口大小。
4.3显示图片
4.3.1设置读取的图片
cv2.imshow(winname,img)
参数:
- winname:显示图像的窗口名,以字符串类型表示
- img:要显示的图像
注意:在调用显示图像的API后,要调用cv2.waitKey(0)给图像绘制留下时间,否则窗口会出现无响应情况,并且图像无法显示出来。
4.3.2设置显示多久
cv.waitKey(n):
-
n = 0:一直显示
-
n > 0:显示 n毫秒
4.3.3释放
在关闭图像后执行
cv2.destroyAllWindows()
:立即销毁所有(打开的)窗口cv2.destroyWindow(winname)
:关闭指定名称的窗口。省略则销毁所有已打开的窗口。
4.4.保存图片
cv2.imwrite(path,img)
参数:
- path:图片保存的路径和图片名
- img:要保存的图像
4.5图片切片(剪裁)
从图像中提取一个子区域(矩形区域)。
读取到的图片是一个numpy.ndarray
类型的数组,所以可以直接切片操作。
img[y:y+h,x:x+w]
提取的是从(x,y)
开始,高度为h
,宽度为w
的矩形区域
示例:
python
import numpy as np
import cv2 as cv
# 读取图像
img=cv.imread("images/001.jpg")
print(img.shape)
# 定义剪裁后图像的宽度和高度(以像素为单位)
h = 300
w = 500
# 定义剪裁的起始点,坐标小于图片的宽高
y=100
x=200
# 剪裁
img2=img[y:y+h,x:x+w]
print(img2.shape)
4.6图片大小调节
cv2.resize
是Opencv库中用于调整图像大小的函数,在图像处理中很常用,特别是在要对图像进行缩放以适应不同需求时。- cv2.resize(img,dsize)
- img:输入图像,通常是二维或三位NumPy数组。
- dsize:输出图像的尺寸,是一个二元组
(w,h)
- 示例:
python
import cv2 as cv
# 读取图片
img=cv.imread("images/001.jpg")
print(img.shape)
# 调整的大小
dsize=(100,200)
new_img=cv.resize(img,dsize)
print(new_img.shape)
5.在图像中绘值
5.1绘制直线
-
cv2.line(img,sart,end,color,thickness)
-
参数
- img:要绘制直线的图像
- start、end:直线的起点和终点坐标
- color:直线的颜色(对于彩色图像,使用 BGR 格式指定颜色)
- thickness:线条宽度
5.2绘制圆形
-
cv2.circle(img,centerpoint,r,color,thickness,cv.LINE_AA)
-
参数:
- img:要绘制圆形的图片
- centerpoint、r:圆心坐标和半径
- color:线条颜色
- tnickness:线条宽度,为-1时完全填充颜色
- cv.LINE_AA: 反走样技术,让图行边缘更光滑
5.3绘制矩形
-
cv2.rectangle(img,leftupper,rightdown,color,thickness)
-
参数:
- img:要绘制矩形的图像
- leftupper、rightdown:矩形的左上角和右下角坐标
- color:线条的颜色
- thickness:线条的宽度
5.4添加文字
-
cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)
-
参数:
- img:要添加文字的图像
- text:要写入的文本数据
- station:文本的放置位置
- font:字体样式
- Fontscale:字体大小
- thickness:字体线条宽度
- cv2.LINE_AA: 反走样技术,让图行边缘更光滑
5.5综合案例
python
import cv2 as cv
# 读取图片
img = cv.imread("./imgs/cat1.png")
# 绘制直线---起点,终点,颜色,粗细
cv.line(img, [100,100], [400, 400], [0, 0, 255], 2)
# 绘制圆形---圆心,半径,颜色,粗细,抗锯齿(平滑)
cv.circle(img, [300, 300], 50, [0, 255, 0], 2,cv.LINE_AA)
# 绘制矩形---左上角,右下角,颜色,粗细,抗锯齿(平滑)
cv.rectangle(img, [100, 100], [400, 400], [255, 0, 0], 2, cv.LINE_AA)
# 绘制文字---文字内容,哪里开始写,字体类型,字体大小,颜色,字体粗细
cv.putText(img, "Hello World!",(450,450), cv.FONT_ITALIC, 1, [255, 0, 0], 2)
cv.imshow("Cat", img)
cv.waitKey(0)
cv.destroyAllWindows()
6.读取视频
-
cap = cv2.VideoCapture(path)
- path:视频流资源路径设置为;填0,代表从默认摄像头捕获视频流(自拍)
-
ret,frame = cap.read()
-
返回值cap调用read()方法得到一个布尔值和一帧图像,布尔值表示是否成功读取到帧,如果为False,可能是因为视频结束或读取失败,如果为True,frame则是当前帧的图像数据。
示例:
python
import cv2 as cv
# 创建VideoCapture对象,参数为摄像头索引(通常为0,如果为单一摄像头)
vi=cv.VideoCapture(0)
while True:
ret,frame=vi.read()
if not ret:
print("error")
break
cv.imshow("frame",frame)
# 等待40毫秒并检查按键事件,获取按键的ASCII码,判断按键是否为q键
if cv.waitKey(40) & 0xFF==ord('q'):
break
vi.release()# 释放摄像头资源
cv.destroyAllWindows()