图像处理基础学习笔记
本章节详细介绍了图像处理的基础内容,包括图像的读取、显示、保存,基本属性的查看,图像的变换与操作,以及常用的图像处理方法。
目录
1. 图像的读取与显示
图像是由一系列像素组成的矩阵,在OpenCV中可以使用cv2.imread()
函数读取图像,使用cv2.imshow()
显示图像,使用cv2.imwrite()
保存图像。
示例代码:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 显示图像
cv2.imshow('Image', image)
# 等待按键
cv2.waitKey(0)
# 保存图像
cv2.imwrite('saved_image.jpg', image)
# 关闭所有窗口
cv2.destroyAllWindows()
-
cv2.imread(filename, flag) :读取图像,
filename
为文件路径,flag
可以是:cv2.IMREAD_COLOR
:默认,加载为彩色图像cv2.IMREAD_GRAYSCALE
:加载为灰度图像cv2.IMREAD_UNCHANGED
:加载图像,包括透明通道(如果有)
-
cv2.imshow(window_name, image):显示图像。
-
cv2.waitKey(0) :等待按键输入。
0
表示无限等待。 -
cv2.imwrite(filename, image):保存图像。
2. 图像基本属性
图像通常是由多个像素组成的数组,我们可以查看图像的维度、通道数、数据类型等基本信息。
示例代码:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 获取图像的属性
height, width, channels = image.shape
print(f"Height: {height}, Width: {width}, Channels: {channels}")
# 获取图像数据类型
print(f"Data type: {image.dtype}")
- image.shape :返回图像的高、宽、通道数。对于彩色图像,
shape
返回一个(height, width, channels)
的元组。 - image.dtype :返回图像的类型,如
uint8
,表示每个像素值为0-255之间的整数。
3. 图像的灰度化与二值化
- 灰度化:将彩色图像转换为灰度图像。
- 二值化:根据一个阈值,将图像转换为黑白图像。
示例代码:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 显示灰度图像
cv2.imshow('Gray Image', gray_image)
# 二值化图像
_, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY)
# 显示二值化图像
cv2.imshow('Binary Image', binary_image)
# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
-
cv2.cvtColor(image, code) :转换颜色空间,
code
可以是:cv2.COLOR_BGR2GRAY
:将BGR图像转换为灰度图像cv2.COLOR_BGR2RGB
:将BGR图像转换为RGB图像cv2.COLOR_BGR2HSV
:将BGR图像转换为HSV图像
-
cv2.threshold() :二值化图像。
127
为阈值,255
为大于阈值的像素值,cv2.THRESH_BINARY
为二值化方法。
4. 图像的色彩空间转换
图像有多种色彩空间,其中常用的有RGB、灰度、HSV、YUV等。OpenCV提供了色彩空间转换的功能。
示例代码(RGB与灰度图转换、HSV色彩空间):
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# RGB与灰度图的转换
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 显示灰度图
cv2.imshow('Gray Image', gray_image)
# 转换为HSV色彩空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
# 显示HSV图像
cv2.imshow('HSV Image', hsv_image)
# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
- BGR到HSV :
cv2.COLOR_BGR2HSV
- BGR到YUV :
cv2.COLOR_BGR2YUV
- BGR到LAB :
cv2.COLOR_BGR2LAB
5. 图像变换与操作
图像的变换操作包括缩放、旋转、平移、仿射变换和透视变换。
缩放图像:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 缩放图像
resized_image = cv2.resize(image, (300, 300)) # 目标尺寸为300x300
# 显示缩放后的图像
cv2.imshow('Resized Image', resized_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.resize(image, dsize) :调整图像大小,
dsize
为目标尺寸。
旋转与平移图像:
python
import cv2
import numpy as np
# 读取图像
image = cv2.imread('image.jpg')
# 获取图像的中心点
center = (image.shape[1] // 2, image.shape[0] // 2)
# 旋转矩阵
rotation_matrix = cv2.getRotationMatrix2D(center, 45, 1) # 旋转45度,缩放因子为1
# 旋转图像
rotated_image = cv2.warpAffine(image, rotation_matrix, (image.shape[1], image.shape[0]))
# 显示旋转后的图像
cv2.imshow('Rotated Image', rotated_image)
# 平移图像
translation_matrix = np.float32([[1, 0, 50], [0, 1, 100]]) # 向右平移50个像素,向下平移100个像素
translated_image = cv2.warpAffine(image, translation_matrix, (image.shape[1], image.shape[0]))
# 显示平移后的图像
cv2.imshow('Translated Image', translated_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.getRotationMatrix2D(center, angle, scale):计算旋转矩阵。
- cv2.warpAffine(image, M, dsize):进行仿射变换。
仿射变换与透视变换:
python
import cv2
import numpy as np
# 读取图像
image = cv2.imread('image.jpg')
# 仿射变换:通过3个点的对应关系进行图像变换
pts1 = np.float32([[50, 50], [200, 50], [50, 200]]) # 原图中的3个点
pts2 = np.float32([[10, 100], [250, 50], [100, 250]]) # 目标图像中的3个点
# 获取仿射变换矩阵
affine_matrix = cv2.getAffineTransform(pts1, pts2)
# 应用仿射变换
affine_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))
# 显示变换后的图像
cv2.imshow('Affine Transformed Image', affine_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.getAffineTransform(src, dst):获取仿射变换矩阵。
- cv2.warpAffine(image, M, dsize):进行仿射变换。
6. 图像滤波与平滑
图像滤波通常用于去除噪声和平滑图像。常见的滤波方法有平均滤波、高斯滤波、中值滤波和双边滤波。
平均滤波:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 应用平均滤波
blurred_image = cv2.blur(image, (5, 5))
# 显示滤波后的图像
cv2.imshow('Blurred Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
高斯滤波:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 应用高斯滤波
gaussian_blurred_image = cv2.GaussianBlur(image, (5, 5), 0)
# 显示高斯滤波后的图像
cv2.imshow('Gaussian Blurred Image', gaussian_blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
中值滤波:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 应用中值滤波
median_blurred_image = cv2.medianBlur(image, 5)
# 显示中值滤波后的图像
cv2.imshow('Median Blurred Image', median_blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
双边滤波:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 应用双边滤波
bilateral_blurred_image = cv2.bilateralFilter(image, 9, 75, 75)
# 显示双边滤波后的图像
cv2.imshow('Bilateral Blurred Image', bilateral_blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
7. 边缘检测(Sobel、Canny)
边缘检测用于检测图像中的边缘,常见的边缘检测方法有Sobel算子和Canny算法。
Sobel边缘检测:
python
import cv2
import numpy as np
# 读取图像
image = cv2.imread('image.jpg')
# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Sobel算子进行边缘检测
sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=3)
# 计算边缘强度
sobel_edges = cv2.magnitude(sobel_x, sobel_y)
# 显示边缘图像
cv2.imshow('Sobel Edge Detection', sobel_edges)
cv2.waitKey(0)
cv2.destroyAllWindows()
Canny边缘检测:
python
import cv2
# 读取图像
image = cv2.imread('image.jpg')
# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Canny边缘检测
edges = cv2.Canny(gray_image, 100, 200)
# 显示边缘图像
cv2.imshow('Canny Edge Detection', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()
总结:
以上是图像处理的基础内容,涵盖了图像的读取、显示、基本属性、灰度化、二值化、色彩空间转换、图像变换与操作、图像滤波和平滑以及边缘检测等常用操作。