嵌入式人工智能(OpenCV-图像的基本操作)

1、OpenCV简介

人工智能一个重要方面的应用就是计算机视觉,而OpenCV正是基于BSD许可发行的开源、跨平台的计算机视觉库。它可以运行在Linux、Windows、Android和Mac OS操作系统上。 [1]它轻量级而且高效------由一系列 C 函数和C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

计算机视觉包括底层的图像处理、中层的图像分析以及高层的视觉技术,OpenCV已经延伸到计算机视觉的每个领域,其功能涵盖每个研究方向。应用领域包括人机互动、物体识别、图像分割、人脸识别、动作识别、运动跟踪、机器人、运动分析、机器视觉、结构分析、汽车安全驾驶。

2、图像处理过程

图像处理指对图像进行分析、加工和处理,使其满足视觉、心理、或其他要求的技术、图像处理是信号处理在图像领域上的一个应用。。当前大多是图像是以数字形式存储,因为图像处理又称数字图像处理。

(1)导入图像

(2)去噪处理

(3)图像增强

(4)图像复原

(5)彩色图像转灰度

(6)灰度图转二值图

(7)边缘检测/分割

(8)直方图匹配/轮廓匹配

3、图像的载入、显示、转化为灰度图

(1)OpenCV安装

OpenCV库在Python中安装和导入非常方便

pip install opencv-python就可以了,安装完可以查看版本

复制代码
import cv2
print(cv2.__version__)

(2)图像的获取

图像的获取可以加载本地图片,也可以从摄像头读取一张图片。

在本地新建一个图片1.png

上传给树莓派SSH服务器。然后通过imead读取,imshow显示。

python 复制代码
image = cv2.imread('1.png')
print(type(image))
# 显示读取的图像,窗口名称为buster
cv2.imshow('buster', image)
# 使程序停留,等待任意键按下,参数表示停留的时间,0表示无限长
k = cv2.waitKey(0)
# 按下ESC键(ASCII码为27)后,销毁所有窗口,终止程序
if k == 27:
    cv2.destroyAllWindows()

如果使用imshow函数,需要为当前的py文件在pycharm中开启SSH的Xserver显示功能。

可能会有同学报错,见下图。提示不支持验证协议。

编辑 /etc/ssh/ssh_config文件,下面2行注释给去掉

然后在pycharm运行该文件,则正常显示了。

注意红框的内容,这里显示的x、y的值是从图像上选择的像素点,距左边和上边的距离,RGB是三通道的值。

从摄像头获取图片,保存。保存的图片是放到树莓派的开发板上面。默认保存的图像分辨率为640*480

python 复制代码
import cv2
cap = cv2.VideoCapture(0)
# cap.set(cv2.CAP_PROP_FRAME_WIDTH,1440)
# cap.set(cv2.CAP_PROP_FRAME_HEIGHT,960)
while cap.isOpened() :
    # 摄像头工作时,读取一帧图像
    ret, frame = cap.read()
    # 显示图像窗口在树莓派的屏幕上
    cv2.imshow('Capture', frame)
    # 按下q键退出,s键保存图像,保存到树莓派上面
    key = cv2.waitKey(1)
    if key & 0x00FF == ord('s'):
        cv2.imwrite('imgshoot.jpg',frame)
    if key & 0x00FF == ord('q'):
        break

cap.set(cv2.CAP_PROP_FRAME_WIDTH,1440)

cap.set(cv2.CAP_PROP_FRAME_HEIGHT,960)

cap.set用来设置图片的分辨率,由于开发板的处理能力相对较弱,一般图像的显示和存储、处理不用太高的分辨率,不然爆显存导致死机,程序中止等故障。除了分辨率控制图像大小,还有就是通过灰度图来控制图像大小。

将读取后的图片转换为灰度图片

img_gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)

python 复制代码
image = cv2.imread('1.png')
#创建一个窗口。可以调整窗口显示大小 cv2.WINDOW_NORMAL,也可以在初始化的时候给定大小
cv2.namedWindow('buster', cv2.WINDOW_NORMAL)
#cv2.resizeWindow('buster', 320, 240)
# 将读取后的图片转换为灰度图片
img_gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
# 显示灰度图像
cv2.imshow("buster", img_gray)
key = cv2.waitKey(0)
# 保存灰度图像
cv2.imwrite("buster_gray.png", img_gray)

灰度图就没有RGB三通道的值了。

相关推荐
小于小于大橙子3 小时前
视觉SLAM数学基础
人工智能·数码相机·自动化·自动驾驶·几何学
埃菲尔铁塔_CV算法4 小时前
图像算法之 OCR 识别算法:原理与应用场景
图像处理·python·计算机视觉
封步宇AIGC5 小时前
量化交易系统开发-实时行情自动化交易-3.4.2.Okex行情交易数据
人工智能·python·机器学习·数据挖掘
封步宇AIGC5 小时前
量化交易系统开发-实时行情自动化交易-2.技术栈
人工智能·python·机器学习·数据挖掘
陌上阳光5 小时前
动手学深度学习68 Transformer
人工智能·深度学习·transformer
OpenI启智社区5 小时前
共筑开源技术新篇章 | 2024 CCF中国开源大会盛大开幕
人工智能·开源·ccf中国开源大会·大湾区
AI服务老曹5 小时前
建立更及时、更有效的安全生产优化提升策略的智慧油站开源了
大数据·人工智能·物联网·开源·音视频
YRr YRr5 小时前
PyTorch:torchvision中的dataset的使用
人工智能
love_and_hope6 小时前
Pytorch学习--神经网络--完整的模型训练套路
人工智能·pytorch·python·深度学习·神经网络·学习
思通数据6 小时前
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
大数据·人工智能·目标检测·计算机视觉·自然语言处理·数据挖掘·ocr