【OpenCV】第二章——图像处理基础

图像处理基础学习笔记

本章节详细介绍了图像处理的基础内容,包括图像的读取、显示、保存,基本属性的查看,图像的变换与操作,以及常用的图像处理方法。


目录

  1. 图像的读取与显示
  2. 图像基本属性
  3. 图像的灰度化与二值化
  4. 图像的色彩空间转换
  5. 图像变换与操作
  6. 图像滤波与平滑
  7. 边缘检测(Sobel、Canny)

1. 图像的读取与显示

图像是由一系列像素组成的矩阵,在OpenCV中可以使用cv2.imread()函数读取图像,使用cv2.imshow()显示图像,使用cv2.imwrite()保存图像。

示例代码:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 显示图像
cv2.imshow('Image', image)

# 等待按键
cv2.waitKey(0)

# 保存图像
cv2.imwrite('saved_image.jpg', image)

# 关闭所有窗口
cv2.destroyAllWindows()
  • cv2.imread(filename, flag) :读取图像,filename为文件路径,flag可以是:

    • cv2.IMREAD_COLOR:默认,加载为彩色图像
    • cv2.IMREAD_GRAYSCALE:加载为灰度图像
    • cv2.IMREAD_UNCHANGED:加载图像,包括透明通道(如果有)
  • cv2.imshow(window_name, image):显示图像。

  • cv2.waitKey(0) :等待按键输入。0表示无限等待。

  • cv2.imwrite(filename, image):保存图像。


2. 图像基本属性

图像通常是由多个像素组成的数组,我们可以查看图像的维度、通道数、数据类型等基本信息。

示例代码:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 获取图像的属性
height, width, channels = image.shape
print(f"Height: {height}, Width: {width}, Channels: {channels}")

# 获取图像数据类型
print(f"Data type: {image.dtype}")
  • image.shape :返回图像的高、宽、通道数。对于彩色图像,shape返回一个 (height, width, channels) 的元组。
  • image.dtype :返回图像的类型,如 uint8,表示每个像素值为0-255之间的整数。

3. 图像的灰度化与二值化

  • 灰度化:将彩色图像转换为灰度图像。
  • 二值化:根据一个阈值,将图像转换为黑白图像。
示例代码:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图像
cv2.imshow('Gray Image', gray_image)

# 二值化图像
_, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY)

# 显示二值化图像
cv2.imshow('Binary Image', binary_image)

# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
  • cv2.cvtColor(image, code) :转换颜色空间,code可以是:

    • cv2.COLOR_BGR2GRAY:将BGR图像转换为灰度图像
    • cv2.COLOR_BGR2RGB:将BGR图像转换为RGB图像
    • cv2.COLOR_BGR2HSV:将BGR图像转换为HSV图像
  • cv2.threshold() :二值化图像。127为阈值,255为大于阈值的像素值,cv2.THRESH_BINARY为二值化方法。


4. 图像的色彩空间转换

图像有多种色彩空间,其中常用的有RGB、灰度、HSV、YUV等。OpenCV提供了色彩空间转换的功能。

示例代码(RGB与灰度图转换、HSV色彩空间):
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# RGB与灰度图的转换
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图
cv2.imshow('Gray Image', gray_image)

# 转换为HSV色彩空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

# 显示HSV图像
cv2.imshow('HSV Image', hsv_image)

# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
  • BGR到HSVcv2.COLOR_BGR2HSV
  • BGR到YUVcv2.COLOR_BGR2YUV
  • BGR到LABcv2.COLOR_BGR2LAB

5. 图像变换与操作

图像的变换操作包括缩放、旋转、平移、仿射变换和透视变换。

缩放图像:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 缩放图像
resized_image = cv2.resize(image, (300, 300))  # 目标尺寸为300x300

# 显示缩放后的图像
cv2.imshow('Resized Image', resized_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
  • cv2.resize(image, dsize) :调整图像大小,dsize为目标尺寸。
旋转与平移图像:
python 复制代码
import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 获取图像的中心点
center = (image.shape[1] // 2, image.shape[0] // 2)

# 旋转矩阵
rotation_matrix = cv2.getRotationMatrix2D(center, 45, 1)  # 旋转45度,缩放因子为1

# 旋转图像
rotated_image = cv2.warpAffine(image, rotation_matrix, (image.shape[1], image.shape[0]))

# 显示旋转后的图像
cv2.imshow('Rotated Image', rotated_image)

# 平移图像
translation_matrix = np.float32([[1, 0, 50], [0, 1, 100]])  # 向右平移50个像素,向下平移100个像素
translated_image = cv2.warpAffine(image, translation_matrix, (image.shape[1], image.shape[0]))

# 显示平移后的图像
cv2.imshow('Translated Image', translated_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
  • cv2.getRotationMatrix2D(center, angle, scale):计算旋转矩阵。
  • cv2.warpAffine(image, M, dsize):进行仿射变换。
仿射变换与透视变换:
python 复制代码
import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 仿射变换:通过3个点的对应关系进行图像变换
pts1 = np.float32([[50, 50], [200, 50], [50, 200]])  # 原图中的3个点
pts2 = np.float32([[10, 100], [250, 50], [100, 250]])  # 目标图像中的3个点

# 获取仿射变换矩阵
affine_matrix = cv2.getAffineTransform(pts1, pts2)

# 应用仿射变换
affine_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))

# 显示变换后的图像
cv2.imshow('Affine Transformed Image', affine_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
  • cv2.getAffineTransform(src, dst):获取仿射变换矩阵。
  • cv2.warpAffine(image, M, dsize):进行仿射变换。

6. 图像滤波与平滑

图像滤波通常用于去除噪声和平滑图像。常见的滤波方法有平均滤波、高斯滤波、中值滤波和双边滤波。

平均滤波:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用平均滤波
blurred_image = cv2.blur(image, (5, 5))

# 显示滤波后的图像
cv2.imshow('Blurred Image', blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
高斯滤波:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用高斯滤波
gaussian_blurred_image = cv2.GaussianBlur(image, (5, 5), 0)

# 显示高斯滤波后的图像
cv2.imshow('Gaussian Blurred Image', gaussian_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
中值滤波:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用中值滤波
median_blurred_image = cv2.medianBlur(image, 5)

# 显示中值滤波后的图像
cv2.imshow('Median Blurred Image', median_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()
双边滤波:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 应用双边滤波
bilateral_blurred_image = cv2.bilateralFilter(image, 9, 75, 75)

# 显示双边滤波后的图像
cv2.imshow('Bilateral Blurred Image', bilateral_blurred_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

7. 边缘检测(Sobel、Canny)

边缘检测用于检测图像中的边缘,常见的边缘检测方法有Sobel算子和Canny算法。

Sobel边缘检测:
python 复制代码
import cv2
import numpy as np

# 读取图像
image = cv2.imread('image.jpg')

# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Sobel算子进行边缘检测
sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=3)

# 计算边缘强度
sobel_edges = cv2.magnitude(sobel_x, sobel_y)

# 显示边缘图像
cv2.imshow('Sobel Edge Detection', sobel_edges)

cv2.waitKey(0)
cv2.destroyAllWindows()
Canny边缘检测:
python 复制代码
import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Canny边缘检测
edges = cv2.Canny(gray_image, 100, 200)

# 显示边缘图像
cv2.imshow('Canny Edge Detection', edges)

cv2.waitKey(0)
cv2.destroyAllWindows()

总结:

以上是图像处理的基础内容,涵盖了图像的读取、显示、基本属性、灰度化、二值化、色彩空间转换、图像变换与操作、图像滤波和平滑以及边缘检测等常用操作。

相关推荐
海特伟业19 分钟前
隧道调频广播覆盖的实现路径:隧道无线广播技术赋能行车安全升级,隧道汽车广播收音系统助力隧道安全管理升级
人工智能
CareyWYR25 分钟前
每周AI论文速递(250421-250425)
人工智能
追逐☞44 分钟前
机器学习(10)——神经网络
人工智能·神经网络·机器学习
winner88811 小时前
对抗学习:机器学习里的 “零和博弈”,如何实现 “双赢”?
人工智能·机器学习·gan·对抗学习
Elastic 中国社区官方博客1 小时前
使用 LangGraph 和 Elasticsearch 构建强大的 RAG 工作流
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
娃娃略1 小时前
【AI模型学习】双流网络——更强大的网络设计
网络·人工智能·pytorch·python·神经网络·学习
福尔摩东1 小时前
从零到精通:2025年最全大模型学习资源
人工智能·github
青橘MATLAB学习1 小时前
深度学习中的预训练与微调:从基础概念到实战应用全解析
人工智能·深度学习·微调·迁移学习·预训练·梯度消失·模型复用
高桐@BILL1 小时前
1.4 大模型应用产品与技术架构
人工智能·架构·agent
Ann2 小时前
Prompt Engineering:如何让大模型按要求“工作”
人工智能·llm