1 计算机是视觉的定义和任务
计算机视觉(Computer Vision, CV)是人工智能领域的分支,旨在通过算法让计算机从图像或视频中提取信息、理解内容并做出决策。
其核心任务是模拟人类视觉系统,实现场景理解、目标检测、图像分类等功能。
2 传统CV解决问题的步骤和方法
步骤
对图片、视频进行预处理,增强对比度,灰度化,变形等
特征提取,边缘、角点、纹理等
分割,通过阈值进行分割,分别处理
形态学处理,通过膨胀、腐蚀改变图形结构,清楚噪点
目标检测和识别,结合特征描述子和分类器来实现
传统CV擅长
采集视频和图像
对图像、视频预处理
从图像和视频中提取特征
传统CV不擅长
受关照、角度、纹理影响大
鲁棒性差
难以处理复杂的视觉任务
3 OpenCV环境搭建
搭建
可以使用-i 镜像地址
国内的pip源,如下:
阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/
bash
pip install opencv-python
pip install opencv-contrib-python -i https://pypi.mirrors.ustc.edu.cn/simple/
使用
python
# 示例1 使用OpenCV打开图片并关闭
import cv2
# 读取
img =cv2.imread('anna.jpg')
# 展示体魄
cv2.imshow('image',img)
# 等待键盘输入 q 后,关闭图片
while 1:
key = cv2.waitKey(0)
if key & 0xFF ==ord('q'):
cv2.destroyAllWindows()
python
# 示例2 通过openCV采集图片
import cv2
cap = cv2.VideoCapture(0)
while cap.isOpened:
ret, frame = cap.read()
if ret:
# 将数据帧保存图片对象
cv2.imwrite('frame.jpg', frame)
break
cap.release()
4 二值法与实践
**目标:**简化图形处理难度,将图像转换为黑白两色,通过谁定阈值处理为0和1
过程:
RGB到Gray的过程:解码到RGB的矩阵,乘对用矩阵得到YUV,最后丢弃UV保留Y则是灰度图

灰度图二值化:阈值设置为127,如果像素值>127,则变成255,否则为0

python
# 示例3 使用openCv进行二值化
import cv2
# 读取图片
img = cv2.imread('anna.jpg')
if img is None:
print("错误:无法加载图片,请检查文件路径")
exit()
# 展示原始图片
cv2.imshow('Original Image', img)
# 灰度化
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 展示灰度图
cv2.imshow('Gray Image', gray)
# 二值化处理
ret, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
# 展示二值化图
cv2.imshow('binary image', binary)
# 等待键盘输入(0表示无限等待)
key = cv2.waitKey(0)
# 无论按下什么键,都关闭所有窗口
cv2.destroyAllWindows()
Blur
目的:对图形做模糊处理,计算机视觉中用于消除噪声
Padding:把0增加到一圈边缘,防止丢失重要信息
Kernel:一般是3*3矩阵扫描原图,乘法求平均
步长:扫描时候移动的格子

均值blur、中值Blur、高斯Blur、双边Blur
python
# 示例 Blur
import cv2
# 读取图片
img = cv2.imread('anna.jpg')
# 显示图形
cv2.imshow('Original Image', img)
# 转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Blur处理 平均blur
blurred = cv2.blur(gray, (5, 5))
# 保留更多边缘 高斯Blur 和双边Blur
# cv2.GaussianBlur(gray, (5, 5), 0)
cv2.imshow('blurred Image', blurred)
# 二值化
ret, binary = cv2.threshold(blurred, 137, 255, cv2.THRESH_BINARY)
# 显示处理后的图像
# cv2.imshow('Binary Image', binary)
cv2.waitKey(0)