【OpenCV实现鼠标绘图，轨迹栏做调色板，图像的基本操作】

文章目录

鼠标绘图

在OpenCV中操作鼠标事件

函数：cv.setMouseCallback()

目的是在鼠标双击的地方画一个圆。首先，我们需要创建一个鼠标回调函数，该函数会在鼠标事件发生时执行。鼠标事件包括左键按下、左键松开、左键双击等等。通过获取每个鼠标事件的坐标(x, y)，我们就能实现画圆的功能。

bash 复制代码

import numpy as np
import cv2 as cv

# 创建一个黑色图像
img = np.zeros((512, 512, 3), np.uint8)

# 鼠标回调函数，当鼠标左键双击时，在双击的位置画一个半径为100的蓝色圆
def draw_circle(event, x, y, flags, param):
    if event == cv.EVENT_LBUTTONDBLCLK:
        # 画一个半径为100的蓝色圆，圆心坐标为(x, y)，颜色为(255, 0, 0)，-1表示填充整个圆
        cv.circle(img, (x, y), 100, (255, 0, 0), -1)

# 创建一个窗口，并将鼠标回调函数与窗口绑定
cv.namedWindow('image')
cv.setMouseCallback('image', draw_circle)

while True:
    # 显示图像
    cv.imshow('image', img)
    # 等待用户按键，如果按下的是'q'键，则退出循环
    if cv.waitKey(20) == ord('q'):
        break

# 关闭窗口
cv.destroyAllWindows()

结果，双击画圆：

这段代码创建了一个大小为512x512的黑色图像，然后定义了一个鼠标回调函数draw_circle，该函数在鼠标左键双击时，在双击的位置画一个半径为100的蓝色（BGR值为(255, 0, 0))的圆。程序将这个回调函数与窗口"image"绑定，然后进入一个无限循环，显示图像，直到用户按下键盘上的"q"键，窗口才会关闭。

当我们创建一个交互式绘图程序时，我们需要考虑两种模式：画矩形和画圆形。为了实现这个目标，我们需要在鼠标回调函数中添加逻辑，以便根据用户的选择来绘制相应的图形。

bash 复制代码

import numpy as np
import cv2 as cv

drawing = False # 当鼠标按下的时候会为True
mode = True # True画矩形，按下'm'改变模式
ix, iy = -1, -1

# 鼠标回调函数
def  draw_circle(event, x, y, flags, param):
    global ix, iy, drawing, mode
    if event == cv.EVENT_LBUTTONDOWN:
        drawing = True
        ix, iy = x, y

    elif event == cv.EVENT_MOUSEMOVE:
        if drawing == True:
            if mode == True:
                cv.rectangle(img, (ix, iy), (x, y), (0, 255, 0), -1)
            else:
                cv.circle(img, (x, y), 5, (0, 0, 255), -1)

    elif event == cv.EVENT_LBUTTONUP:
        drawing = False
        if mode == True:
            cv.rectangle(img, (ix, iy), (x, y), (0, 255, 0), -1)
        else:
            cv.circle(img, (x, y), 5, (0, 0, 255), -1)

img = np.zeros((512, 512, 3), np.uint8)
cv.namedWindow('image')
cv.setMouseCallback('image', draw_circle)

while 1:
    cv.imshow('image', img)
    k = cv.waitKey(1) & 0xFF

    if k == ord('m'):
        mode = not mode

    elif k == ord('q'):
        break

cv.destroyAllWindows()

二：

bash 复制代码

import numpy as np
import cv2 as cv

# 定义全局变量，初始模式为矩形
drawing = False  # 当鼠标按下时变为True
mode = True  # True表示矩形模式，False表示圆形模式
ix, iy = -1, -1  # 矩形或圆形的起始坐标

# 鼠标回调函数
def draw_shape(event, x, y, flags, param):
    global ix, iy, drawing, mode

    if event == cv.EVENT_LBUTTONDOWN:  # 当鼠标左键按下时
        drawing = True
        ix, iy = x, y

    elif event == cv.EVENT_LBUTTONUP:  # 当鼠标左键松开时
        drawing = False
        if mode:  # 如果是矩形模式
            cv.rectangle(img, (ix, iy), (x, y), (0, 255, 0), -1)
        else:  # 如果是圆形模式
            radius = int(np.sqrt((x - ix) ** 2 + (y - iy) ** 2))
            cv.circle(img, (ix, iy), radius, (0, 0, 255), -1)

# 创建一个黑色图像
img = np.zeros((512, 512, 3), np.uint8)

# 创建一个窗口，并将鼠标回调函数与窗口绑定
cv.namedWindow('Drawing')
cv.setMouseCallback('Drawing', draw_shape)

while True:
    cv.imshow('Drawing', img)
    # 检测键盘按键，切换模式（'r'键表示矩形模式，'c'键表示圆形模式）
    k = cv.waitKey(1) & 0xFF
    if k == ord('r'):
        mode = True
    elif k == ord('c'):
        mode = False
    elif k == 27:  # 按下ESC键退出程序
        break

cv.destroyAllWindows()

在这个程序中，我们使用了全局变量drawing来追踪鼠标是否按下，mode来追踪当前的绘制模式（矩形或圆形），以及ix和iy来保存绘制形状的起始坐标。当用户按下鼠标左键时，drawing变为True，ix和iy保存了鼠标按下的位置。当鼠标松开时，根据当前的模式（矩形或圆形）在图像上绘制相应的形状。

轨迹栏做调色板

OpenCV窗口建立轨迹栏

函数：cv.getTrackbarPos()，cv.createTrackbar()等等

使用OpenCV中的轨迹条（Trackbar）功能。这个应用将会有一个用于显示颜色的窗口，并且提供了三个轨迹条，分别用来指定红色（R）、绿色（G）和蓝色（B）的分量。通过滑动这些轨迹条，窗口的颜色会相应地变化。初始颜色为黑色。

bash 复制代码

import numpy as np
import cv2 as cv

# 回调函数，什么也不做
def nothing(x):
    pass

# 创建一个黑色图像和一个窗口
img = np.zeros((300, 512, 3), np.uint8)  # 创建一个黑色图像（300x512的RGB图像）
cv.namedWindow('image')  # 创建一个名为'image'的窗口

# 创建轨迹栏，参数分别为：轨迹条的名称、所属窗口的名称、默认值、最大值、回调函数
cv.createTrackbar('R', 'image', 0, 255, nothing)  # 创建红色分量的轨迹条
cv.createTrackbar('G', 'image', 0, 255, nothing)  # 创建绿色分量的轨迹条
cv.createTrackbar('B', 'image', 0, 255, nothing)  # 创建蓝色分量的轨迹条

# 创建开关轨迹条，用于开启或关闭窗口显示颜色
switch = '0 : OFF \n1 : ON'
cv.createTrackbar(switch, 'image', 0, 1, nothing)  # 创建开关轨迹条

while 1:
    cv.imshow('image', img)  # 在窗口中显示图像

    # 检测按键，如果按下'q'键则退出循环
    if cv.waitKey(1) & 0xFF == ord('q'):
        break

    # 获取轨迹条的当前位置
    r = cv.getTrackbarPos('R', 'image')  # 获取红色分量轨迹条的位置
    g = cv.getTrackbarPos('G', 'image')  # 获取绿色分量轨迹条的位置
    b = cv.getTrackbarPos('B', 'image')  # 获取蓝色分量轨迹条的位置
    s = cv.getTrackbarPos(switch, 'image')  # 获取开关轨迹条的位置

    # 根据轨迹条的位置设置图像颜色
    if s == 0:
        img[:] = 0  # 如果开关为关闭状态，将图像颜色设置为黑色
    else:
        img[:] = [b, g, r]  # 如果开关为开启状态，根据轨迹条位置设置图像颜色

cv.destroyAllWindows()  # 关闭所有窗口

结果：

在这个应用中，我们会使用cv.createTrackbar()函数来创建这些轨迹条。这个函数的第一个参数是轨迹条的名称，第二个参数是要应用的窗口的名称，第三个参数是一个默认值，第四个参数是最大值，第五个参数是一个回调函数，用于监测轨迹条值的变化。在本例中，我们不需要回调函数，所以我们将跳过这一部分。

轨迹条的另一个重要应用是作为按钮或者开关。因为OpenCV默认并没有按钮功能，所以你可以使用轨迹条来实现这个功能。在我们的应用中，我们会创建一个开关，只有当开关处于导通状态时，窗口才会显示颜色，否则窗口将一直保持黑色。通过这种方式，我们可以实现一个简单的颜色选择器应用。

图像的基本操作

访问像素值并修改他们。

当处理图像时，你可以通过像素的横纵坐标来访问和修改像素值。在OpenCV中，颜色图像通常使用BGR（蓝、绿、红）通道来表示每个像素的颜色，而灰度图像只有一个单通道，表示像素的亮度。

访问像素值：

bash 复制代码

import numpy as np
import cv2 as cv

# 加载图像
img = cv.imread('messi5.jpg')

# 访问像素值，返回BGR值
px = img[100, 100]
print(px)  # 输出：[157 166 200]


# 访问蓝色通道值
blue = img[100, 100, 0]
print(blue)  # 输出：157

在上述代码中，img[100, 100]返回了坐标为(100, 100)的像素的BGR值，img[100, 100, 0]返回了该像素的蓝色通道值。

修改像素值：

bash 复制代码

# 修改像素值为白色（255, 255, 255）
img[100, 100] = [255, 255, 255]

# 验证修改后的像素值
print(img[100, 100])  # 输出：[255 255 255]

在上述代码中，img[100, 100]的像素值被修改为白色（255, 255, 255）。

这些基本操作允许你直接访问和修改图像的像素值，为图像处理提供了灵活性。请确保在修改像素值时，坐标值在图像的范围内，以避免访问超出图像边界的像素。

警告：

在处理图像时，简单地遍历每个像素并逐个访问或修改它们通常会非常缓慢，特别是对于大型图像。Numpy是一个针对快速矩阵运算优化过的库，所以它的目标是通过矢量化操作来提高性能。对于单个像素的访问和修改，直接遍历图像的每个像素并逐个处理会效率低下。

在Numpy中，可以使用array.item()和array.itemset()来更高效地访问和修改单个像素的值。这两个方法始终返回或设置标量值。如果需要访问或修改B、G、R通道的值，可以分别使用array.item()来获取每个通道的值。

访问图像属性

图像的特征包括：

复制代码

形状（Shape）：图像的形状描述了它的尺寸，通常以行数、列数和通道数表示。在彩色图像中，通道数为3（表示红、绿、蓝通道），在灰度图像中，通道数为1。你可以使用img.shape获取图像的形状。

bash 复制代码

print(img.shape)  # 输出：(342, 548, 3)

像素数量（Size）：图像中像素点的总数量，可以通过img.size获得。

bash 复制代码

print(img.size)  # 输出：562248

数据类型（Data Type）：图像的数据类型表示像素值的存储格式。在OpenCV中，通常使用uint8（8位无符号整数）来表示像素值的范围为0到255。

bash 复制代码

  print(img.dtype)  # 输出：uint8

这些特征对于了解图像的结构和存储格式非常重要。特别是在调试时，检查图像的数据类型（img.dtype）可以帮助你避免许多与数据类型相关的错误。通过这些特征，可以确定图像的维度、通道数、像素总数以及像素值的表示范围，为图像处理和分析提供了基础信息。

设置一个感兴趣的区域（ROI）

图像处理中，通常需要对图像的特定区域进行操作。这种操作称为兴趣区域（Region of Interest，ROI）操作。通过在图像中找到特定区域，我们可以提高处理的精度和速度，因为我们只需在一个相对较小的区域上执行操作。

在Python中，使用Numpy的索引功能可以很容易地获取和操作ROI。以下是一个示例，演示了如何从图像中选择一个包含球的区域，并将该区域复制到图像的另一部分：

bash 复制代码

# 选择图像中包含球的区域（ROI）
ball = img[280:340, 330:390]

# 将球的区域复制到图像的另一部分（例如，将其粘贴到另一个位置）
img[273:333, 100:160] = ball

在上述示例中，img[280:340, 330:390]选择了图像中的一个特定区域，该区域包含球。然后，通过将这个区域赋值给ball，我们得到了一个ball变量，其中包含了球的图像区域。接着，我们将ball变量的内容复制到图像的另一个位置（例如，图像的[273:333, 100:160]区域），从而将包含球的区域粘贴到了图像的另一部分。

拆分和组合图像

在图像处理中，有时需要分开和合成图像的通道。OpenCV提供了cv.split()函数来将BGR图像分离成单独的通道，同时也提供了cv.merge()函数用于将单独的通道合成成一个BGR图像。另外，也可以通过Numpy的索引来直接访问和修改图像的特定通道。

分开图像通道：

bash 复制代码

# 使用cv.split()将BGR图像分离成单独的通道
b, g, r = cv.split(img)

在这个例子中，cv.split()函数将BGR图像分离成了三个单独的通道：蓝色（b）、绿色（g）和红色（r）。

合成图像通道：

bash 复制代码

# 使用cv.merge()将单独的通道合成为BGR图像
img = cv.merge((b, g, r))

在这个例子中，cv.merge()函数将单独的蓝色（b）、绿色（g）和红色（r）通道合成为一个BGR图像。

使用Numpy索引直接访问和修改通道

bash 复制代码

# 将所有的红色通道设置为0（即去除红色）
img[:, :, 2] = 0

在这个例子中，img[:, :, 2]直接访问并修改了图像的红色通道，将所有的红色值设置为0。

警告：

cv.split() 是一个开销很大的操作，因为它需要遍历整个图像。只有在必要的时候才使用它。否则，尽量使用Numpy的索引来直接访问和修改图像的通道，这样会更高效。

cv.copyMakeBorder()函数可以用来在图像周围添加边框。该函数有以下参数：

复制代码

src：输入的图像。
top, bottom, left, right：对应方向填充的像素宽度。
borderType：想要添加的边框类型，可以是cv.BORDER_CONSTANT、cv.BORDER_REFLECT、cv.BORDER_REFLECT_101、cv.BORDER_REPLICATE 或 cv.BORDER_WRAP。
value：如果borderType是cv.BORDER_CONSTANT，需要在这里指定颜色值。

以下是一个使用cv.copyMakeBorder()函数演示的例子：

bash 复制代码

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255, 0, 0]
img1 = cv.imread('opencv-logo.png')

# 添加不同类型的边框
replicate = cv.copyMakeBorder(img1, 10, 10, 10, 10, cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1, 10, 10, 10, 10, cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1, 10, 10, 10, 10, cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1, 10, 10, 10, 10, cv.BORDER_WRAP)
constant = cv.copyMakeBorder(img1, 10, 10, 10, 10, cv.BORDER_CONSTANT, value=BLUE)

# 显示原始图像和添加边框后的图像
plt.subplot(231), plt.imshow(img1, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
plt.show()

在这个例子中，cv.copyMakeBorder()函数被用来创建原始图像和带有不同边框类型的图像。这些边框类型包括：REPLICATE、REFLECT、REFLECT_101、WRAP 和 CONSTANT。每种类型的边框都会以不同的方式填充图像的边界。通过这个例子，你可以看到不同类型的边框效果。