【OpenCV】第二章——图像处理基础

图像处理基础学习笔记

本章节详细介绍了图像处理的基础内容，包括图像的读取、显示、保存，基本属性的查看，图像的变换与操作，以及常用的图像处理方法。

cv2.imread(filename, flag) ：读取图像，filename为文件路径，flag可以是：
- cv2.IMREAD_COLOR：默认，加载为彩色图像
- cv2.IMREAD_GRAYSCALE：加载为灰度图像
- cv2.IMREAD_UNCHANGED：加载图像，包括透明通道（如果有）
cv2.imshow(window_name, image)：显示图像。
cv2.waitKey(0) ：等待按键输入。0表示无限等待。
cv2.imwrite(filename, image)：保存图像。

2. 图像基本属性

图像通常是由多个像素组成的数组，我们可以查看图像的维度、通道数、数据类型等基本信息。

示例代码：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 获取图像的属性
height, width, channels = image.shape
print(f"Height: {height}, Width: {width}, Channels: {channels}")

# 获取图像数据类型
print(f"Data type: {image.dtype}")

image.shape ：返回图像的高、宽、通道数。对于彩色图像，shape返回一个 (height, width, channels) 的元组。
image.dtype ：返回图像的类型，如 uint8，表示每个像素值为0-255之间的整数。

3. 图像的灰度化与二值化

灰度化：将彩色图像转换为灰度图像。
二值化：根据一个阈值，将图像转换为黑白图像。

示例代码：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图像
cv2.imshow('Gray Image', gray_image)

# 二值化图像
_, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY)

# 显示二值化图像
cv2.imshow('Binary Image', binary_image)

# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.cvtColor(image, code) ：转换颜色空间，code可以是：
- cv2.COLOR_BGR2GRAY：将BGR图像转换为灰度图像
- cv2.COLOR_BGR2RGB：将BGR图像转换为RGB图像
- cv2.COLOR_BGR2HSV：将BGR图像转换为HSV图像
cv2.threshold() ：二值化图像。127为阈值，255为大于阈值的像素值，cv2.THRESH_BINARY为二值化方法。

4. 图像的色彩空间转换

图像有多种色彩空间，其中常用的有RGB、灰度、HSV、YUV等。OpenCV提供了色彩空间转换的功能。

示例代码（RGB与灰度图转换、HSV色彩空间）：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# RGB与灰度图的转换
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图
cv2.imshow('Gray Image', gray_image)

# 转换为HSV色彩空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

# 显示HSV图像
cv2.imshow('HSV Image', hsv_image)

# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()

BGR到HSV ：cv2.COLOR_BGR2HSV
BGR到YUV ：cv2.COLOR_BGR2YUV
BGR到LAB ：cv2.COLOR_BGR2LAB

5. 图像变换与操作

图像的变换操作包括缩放、旋转、平移、仿射变换和透视变换。

缩放图像：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 缩放图像
resized_image = cv2.resize(image, (300, 300))  # 目标尺寸为300x300

# 显示缩放后的图像
cv2.imshow('Resized Image', resized_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.resize(image, dsize) ：调整图像大小，dsize为目标尺寸。

旋转与平移图像：

python 复制代码

import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 获取图像的中心点
center = (image.shape[1] // 2, image.shape[0] // 2)

# 旋转矩阵
rotation_matrix = cv2.getRotationMatrix2D(center, 45, 1)  # 旋转45度，缩放因子为1

# 旋转图像
rotated_image = cv2.warpAffine(image, rotation_matrix, (image.shape[1], image.shape[0]))

# 显示旋转后的图像
cv2.imshow('Rotated Image', rotated_image)

# 平移图像
translation_matrix = np.float32([[1, 0, 50], [0, 1, 100]])  # 向右平移50个像素，向下平移100个像素
translated_image = cv2.warpAffine(image, translation_matrix, (image.shape[1], image.shape[0]))

# 显示平移后的图像
cv2.imshow('Translated Image', translated_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.getRotationMatrix2D(center, angle, scale)：计算旋转矩阵。
cv2.warpAffine(image, M, dsize)：进行仿射变换。

仿射变换与透视变换：

python 复制代码

import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 仿射变换：通过3个点的对应关系进行图像变换
pts1 = np.float32([[50, 50], [200, 50], [50, 200]])  # 原图中的3个点
pts2 = np.float32([[10, 100], [250, 50], [100, 250]])  # 目标图像中的3个点

# 获取仿射变换矩阵
affine_matrix = cv2.getAffineTransform(pts1, pts2)

# 应用仿射变换
affine_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))

# 显示变换后的图像
cv2.imshow('Affine Transformed Image', affine_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.getAffineTransform(src, dst)：获取仿射变换矩阵。
cv2.warpAffine(image, M, dsize)：进行仿射变换。

6. 图像滤波与平滑

图像滤波通常用于去除噪声和平滑图像。常见的滤波方法有平均滤波、高斯滤波、中值滤波和双边滤波。

平均滤波：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用平均滤波
blurred_image = cv2.blur(image, (5, 5))

# 显示滤波后的图像
cv2.imshow('Blurred Image', blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

高斯滤波：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用高斯滤波
gaussian_blurred_image = cv2.GaussianBlur(image, (5, 5), 0)

# 显示高斯滤波后的图像
cv2.imshow('Gaussian Blurred Image', gaussian_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

中值滤波：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用中值滤波
median_blurred_image = cv2.medianBlur(image, 5)

# 显示中值滤波后的图像
cv2.imshow('Median Blurred Image', median_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

双边滤波：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用双边滤波
bilateral_blurred_image = cv2.bilateralFilter(image, 9, 75, 75)

# 显示双边滤波后的图像
cv2.imshow('Bilateral Blurred Image', bilateral_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

7. 边缘检测（Sobel、Canny）

边缘检测用于检测图像中的边缘，常见的边缘检测方法有Sobel算子和Canny算法。

Sobel边缘检测：

python 复制代码

import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Sobel算子进行边缘检测
sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=3)

# 计算边缘强度
sobel_edges = cv2.magnitude(sobel_x, sobel_y)

# 显示边缘图像
cv2.imshow('Sobel Edge Detection', sobel_edges)

cv2.waitKey(0)
cv2.destroyAllWindows()

Canny边缘检测：

python 复制代码

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Canny边缘检测
edges = cv2.Canny(gray_image, 100, 200)

# 显示边缘图像
cv2.imshow('Canny Edge Detection', edges)

cv2.waitKey(0)
cv2.destroyAllWindows()

总结：

以上是图像处理的基础内容，涵盖了图像的读取、显示、基本属性、灰度化、二值化、色彩空间转换、图像变换与操作、图像滤波和平滑以及边缘检测等常用操作。

【OpenCV】第二章——图像处理基础

图像处理基础学习笔记

目录

1. 图像的读取与显示

示例代码：

2. 图像基本属性

示例代码：

3. 图像的灰度化与二值化

示例代码：

4. 图像的色彩空间转换

示例代码（RGB与灰度图转换、HSV色彩空间）：

5. 图像变换与操作

缩放图像：

旋转与平移图像：

仿射变换与透视变换：

6. 图像滤波与平滑

平均滤波：

高斯滤波：

中值滤波：

双边滤波：

7. 边缘检测（Sobel、Canny）

Sobel边缘检测：

Canny边缘检测：

总结：