day26图像处理OpenCV

文章目录

一、OpenCV

1.介绍

  • OpenCV(开放源代码计算机视觉库)是一个开源的计算机视觉和机器学习软件库。由一系列 C++ 类和函数构成,用于图像处理、计算机视觉领域的算法实现。

  • OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。

2.下载

python 复制代码
x pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python

3.图像的表示

  • 图像一般是RGB三原色图。RGB图上的每个点都是由红(R)、绿(G)、蓝(B)三个颜色按照一定比例混合而成的;在OpenCV中,默认情况下,彩色图像是以BGR(蓝-绿-红)顺序存储
  • 彩色图像:三维数组存储【行数,列数,通道数(一般是3)】
  • 灰色图像:二维存储【行数,列数】
  • 数组存储的数据类型(dtype):图像中的每个像素值的数据类型决定了可以存储的最大值。例如,8位无符号整数(uint8)允许的范围是从0到255。

4.图像的基本操作

4.1图片读取或创建

4.1.1读取
  • cv2.imread(filename)
  • 参数:
    • filename:图像路径
4.1.2创建
python 复制代码
import cv2
import numpy as np

# 设置图像尺寸
height, width = 512, 512
# 创建一个空白的彩色图像-----三维数组,8位
img = np.zeros((height, width, 3), dtype=np.uint8)
# 修改像素值-----0~255的随机整数,大小相同的数组
img[::] = np.random.randint(0, 256, img.shape)

# 设置显示的图像---z'd
cv2.imshow('Random Color Image', img)
# 显示时间
cv2.waitKey(0)
# 释放内存
cv2.destroyAllWindows()

4.2创建窗口

用于显示图片。不创建也可以,在显示的时候可以自动创建。

  • cv2.namedWindow(winname [,窗口属性])

  • 使用 cv2.namedWindow() 方法创建一个新的窗口。你可以为这个窗口指定一个名称,并且可以选择窗口的属性(例如,是否可调整大小)。

  • 参数:

  • winname:窗口名

  • 窗口属性:窗口大小是否可调整

    • cv2.WINDOW_AUTOSIZE:默认,窗口自适应大小,不能调整
    • cv2.WINDOW_NORMAL:窗口大小是可调整的,用户可以通过鼠标拖动窗口边缘来自由改变窗口大小。

4.3显示图片

4.3.1设置读取的图片

cv2.imshow(winname,img)

参数:

  • winname:显示图像的窗口名,以字符串类型表示
  • img:要显示的图像

注意:在调用显示图像的API后,要调用cv2.waitKey(0)给图像绘制留下时间,否则窗口会出现无响应情况,并且图像无法显示出来。

4.3.2设置显示多久

cv.waitKey(n):

  • n = 0:一直显示

  • n > 0:显示 n毫秒

4.3.3释放

在关闭图像后执行

  • cv2.destroyAllWindows():立即销毁所有(打开的)窗口
  • cv2.destroyWindow(winname):关闭指定名称的窗口。省略则销毁所有已打开的窗口。

4.4.保存图片

cv2.imwrite(path,img)

参数:

  • path:图片保存的路径和图片名
  • img:要保存的图像

4.5图片切片(剪裁)

从图像中提取一个子区域(矩形区域)。

读取到的图片是一个numpy.ndarray类型的数组,所以可以直接切片操作

  • img[y:y+h,x:x+w]提取的是从(x,y)开始,高度为h,宽度为w的矩形区域

示例:

python 复制代码
import numpy as np
import cv2 as cv
# 读取图像
img=cv.imread("images/001.jpg")
print(img.shape)
# 定义剪裁后图像的宽度和高度(以像素为单位)
h = 300
w = 500
# 定义剪裁的起始点,坐标小于图片的宽高
y=100
x=200
# 剪裁
img2=img[y:y+h,x:x+w]
print(img2.shape)

4.6图片大小调节

  • cv2.resize是Opencv库中用于调整图像大小的函数,在图像处理中很常用,特别是在要对图像进行缩放以适应不同需求时。
  • cv2.resize(img,dsize)
    • img:输入图像,通常是二维或三位NumPy数组。
    • dsize:输出图像的尺寸,是一个二元组(w,h)
  • 示例:
python 复制代码
import cv2 as cv
# 读取图片
img=cv.imread("images/001.jpg")
print(img.shape)
# 调整的大小
dsize=(100,200)
new_img=cv.resize(img,dsize)
print(new_img.shape)

5.在图像中绘值

5.1绘制直线

  • cv2.line(img,sart,end,color,thickness)

  • 参数

    • img:要绘制直线的图像
    • start、end:直线的起点和终点坐标
    • color:直线的颜色(对于彩色图像,使用 BGR 格式指定颜色)
    • thickness:线条宽度

5.2绘制圆形

  • cv2.circle(img,centerpoint,r,color,thickness,cv.LINE_AA)

  • 参数:

    • img:要绘制圆形的图片
    • centerpoint、r:圆心坐标和半径
    • color:线条颜色
    • tnickness:线条宽度,为-1时完全填充颜色
    • cv.LINE_AA: 反走样技术,让图行边缘更光滑

5.3绘制矩形

  • cv2.rectangle(img,leftupper,rightdown,color,thickness)

  • 参数:

    • img:要绘制矩形的图像
    • leftupper、rightdown:矩形的左上角和右下角坐标
    • color:线条的颜色
    • thickness:线条的宽度

5.4添加文字

  • cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)

  • 参数:

    • img:要添加文字的图像
    • text:要写入的文本数据
    • station:文本的放置位置
    • font:字体样式
    • Fontscale:字体大小
    • thickness:字体线条宽度
    • cv2.LINE_AA: 反走样技术,让图行边缘更光滑

5.5综合案例

python 复制代码
import cv2 as cv
# 读取图片
img = cv.imread("./imgs/cat1.png")
# 绘制直线---起点,终点,颜色,粗细
cv.line(img, [100,100], [400, 400], [0, 0, 255], 2)
# 绘制圆形---圆心,半径,颜色,粗细,抗锯齿(平滑)
cv.circle(img, [300, 300], 50, [0, 255, 0], 2,cv.LINE_AA)
# 绘制矩形---左上角,右下角,颜色,粗细,抗锯齿(平滑)
cv.rectangle(img, [100, 100], [400, 400], [255, 0, 0], 2, cv.LINE_AA)
# 绘制文字---文字内容,哪里开始写,字体类型,字体大小,颜色,字体粗细
cv.putText(img, "Hello World!",(450,450), cv.FONT_ITALIC, 1, [255, 0, 0], 2)

cv.imshow("Cat", img)
cv.waitKey(0)
cv.destroyAllWindows()

6.读取视频

  • cap = cv2.VideoCapture(path)

    • path:视频流资源路径设置为;填0,代表从默认摄像头捕获视频流(自拍)
  • ret,frame = cap.read()

  • 返回值cap调用read()方法得到一个布尔值和一帧图像,布尔值表示是否成功读取到帧,如果为False,可能是因为视频结束或读取失败,如果为True,frame则是当前帧的图像数据。

示例:

python 复制代码
import cv2 as cv
# 创建VideoCapture对象,参数为摄像头索引(通常为0,如果为单一摄像头)
vi=cv.VideoCapture(0)
while True:
    ret,frame=vi.read()
    if not ret:
        print("error")
        break
    cv.imshow("frame",frame)
    # 等待40毫秒并检查按键事件,获取按键的ASCII码,判断按键是否为q键
    if cv.waitKey(40) & 0xFF==ord('q'):
        break
vi.release()# 释放摄像头资源
cv.destroyAllWindows()
相关推荐
jndingxin1 小时前
OpenCV 图形API(27)图像滤波-----膨胀函数dilate()
opencv·计算机视觉
东方芷兰1 小时前
JavaWeb 课堂笔记 —— 04 Ajax
笔记·ajax·okhttp
Allen_LVyingbo1 小时前
数智读书笔记系列028 《奇点更近》
论文阅读·笔记
_zsw5 小时前
Spring三级缓存学习
学习·spring·缓存
美味的大香蕉5 小时前
安装大数据分析利器Spark
笔记
Amor风信子7 小时前
【大模型微调】如何解决llamaFactory微调效果与vllm部署效果不一致如何解决
人工智能·学习·vllm
虾球xz8 小时前
游戏引擎学习第220天
c++·学习·游戏引擎
努力奋斗的小杨8 小时前
学习MySQL的第八天
数据库·笔记·学习·mysql·navicat
LongRunning9 小时前
【随手笔记】QT避坑一(串口readyRead信号不产生)
笔记·qt
echola_mendes9 小时前
Streamlit性能优化:缓存与状态管理实战
学习