OPENCV(0-1之0.1)

OPENCV-0.1

官方文档

学习安排

  1. 计算机视觉简介

目标:了解计算机视觉是如何使计算机"看"到并理解图像和视频的。
学习内容

  1. 计算机视觉的定义和应用领域,比如自动驾驶、安防监控、医学图像处理等。
  2. 基础概念,包括图像识别、物体检测、图像分割、场景重建等。
  1. OpenCV简介

目标:了解OpenCV库的历史、特点和能为你的项目带来什么优势。
学习内容

  1. OpenCV的历史背景和主要贡献者。
  2. OpenCV支持的语言和平台。
  3. OpenCV库的主要模块和功能。
  1. 安装OpenCV

目标:在你的操作系统上安装OpenCV,并配置好开发环境。
学习内容

  1. 在Windows上安装OpenCV
  1. 第一个OpenCV程序

目标:学会使用OpenCV读取、显示和保存图像。
学习内容

  1. 使用cv2.imread()函数读取图像。
  2. 使用cv2.imshow()函数显示图像。
  3. 使用cv2.imwrite()函数保存图像。
  4. 了解图像的基本属性,如大小、类型和像素值。
  1. 实践练习
  1. 读取并显示图像:选择一张图像,使用OpenCV读取并显示出来。
  2. 图像转换:将读取的图像转换为灰度图,并显示。
  3. 保存图像:将转换后的灰度图保存到你的磁盘上。

计算机视觉简介

是什么?

计算机视觉是一门研究如何使机器"看"的科学。更具体地说,它是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量的技术,进而对这些信息进行处理,使计算机能够进一步处理、理解和解释视觉世界。

应用领域

自动驾驶:利用计算机视觉来识别道路上的车辆、行人、交通标志等,实现自动驾驶汽车的导航和安全。
安防监控:通过监控视频来检测异常行为、识别特定人群,提高安全防护效率。
医学图像处理:分析X光片、MRI等医学图像,帮助诊断疾病、规划治疗方案。
零售:在零售行业中,计算机视觉技术可以用于顾客行为分析、智能结账系统等。
增强现实(AR)和虚拟现实(VR):通过理解和解释用户的视觉环境,增强或创建全新的虚拟体验。

基础概念

图像识别:从图像中识别一个或多个特定对象的过程。这是计算机视觉中最基本的任务之一,比如识别照片中的人脸。
物体检测:不仅识别图像中的对象,还确定它们在图像中的位置。通常表现为定位框或边界框。
图像分割:将图像细分为多个部分或对象的过程。目的是简化或改变图像的表现形式,使其更容易分析。
场景重建:通过分析图像或视频序列来重建三维场景的过程。这在自动驾驶、机器人导航等领域非常重要。

OpenCV简介

历史背景和主要贡献者

历史背景:OpenCV最初由Intel在1999年启动,并在2000年首次公开发布。该项目的目的是提供一个通用的基础设施,能够加速计算机视觉的应用开发过程,并推动该领域内的商业应用和学术研究。Gary Bradski是OpenCV项目的创始人之一。
主要贡献者:自诞生以来,OpenCV已经吸引了全球数千名开发者的贡献。虽然最初由Intel支持,但后来也得到了其他公司和组织的支持,包括Google、NVIDIA、AMD等,它现在是由一个非营利组织------OpenCV.org负责维护和发展。

支持的语言和平台

支持的语言:OpenCV最初是用C++编写的,提供了良好的C++接口。随着项目的发展,它现在也提供了Python、Java和MATLAB等语言的接口,这使得它可以轻松地被集成到各种应用中。
支持的平台:OpenCV可以在多种操作系统上运行,包括Windows、Linux、Mac OS X、甚至在移动平台如Android和iOS上也有良好支持。

主要模块和功能

核心功能(Core functionality):基本数据结构,绘图函数,数组操作等。
图像处理(Imgproc):图像滤波,图像变换,颜色空间转换等。
图像分析(Imgcodecs):读写图像,图像编码等。
视频分析(Video):运动估计,背景减法等。
特征检测和描述(Features2D):关键点检测,描述符提取等。
摄像头标定和3D重建(Calib3d):立体视觉,摄像头标定等。
机器学习(ML):SVM,决策树,神经网络等。
深度学习(Dnn):支持多种深度学习框架,如TensorFlow、Torch/PyTorch等。
等其他模块

安装(windows_python)

pip安装

前提是安装好python环境。

python:官网下载

anaconda:官网下载
tips:记得勾选添加环境变量。

在终端命令行中执行以下语句

python 复制代码
pip install opencv-python

如下图所示(包含创建、切换conda环境):

验证安装(记得安装jupyter)

代码:

python 复制代码
import cv2

# 打印OpenCV版本
print(cv2.__version__)

# 尝试打开摄像头
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print("无法打开摄像头")
else:
    print("摄像头已就绪")
    cap.release()

结果(记得打开摄像头权限,这里未打开):

第一个OpenCV程序

代码

python 复制代码
import cv2

# 读取图像
image = cv2.imread('../image.jpg')  # 读取图片
# 打印图像的基本属性
print(f'Width: {image.shape[1]} pixels')
print(f'Height: {image.shape[0]} pixels')
print(f'Channels: {image.shape[2]}')
# 显示图像
cv2.imshow('Image', image)
cv2.waitKey(0)  # 等待任意键盘按键
cv2.destroyAllWindows()  # 关闭所有OpenCV窗口

# 保存图像
cv2.imwrite('image_copy.jpg', image)  # 保存图像的路径

结果

实践练习

python 复制代码
import cv2

# 图像路径
image_path = '../image.jpg'

# 读取图像
image = cv2.imread(image_path)

# 检查图像是否正确加载
if image is None:
    print("Error: 图像未加载,请检查路径。")
else:
    # 转换图像为灰度图
    gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # 显示原图
    cv2.imshow('Original Image', image)
    # cv2.waitKey(0)  # 等待按键
    # cv2.destroyAllWindows()  # 关闭窗口

    # 显示灰度图
    cv2.imshow('Grayscale Image', gray_image)
    cv2.waitKey(0)  # 等待按键
    cv2.destroyAllWindows()  # 关闭窗口

    # 保存灰度图到磁盘
    save_path = 'gray_image.jpg'
    cv2.imwrite(save_path, gray_image)
    print(f"灰度图已保存到 {save_path}")

结果

相关推荐
一点.点28 分钟前
SafeDrive:大语言模型实现自动驾驶汽车知识驱动和数据驱动的风险-敏感决策——论文阅读
人工智能·语言模型·自动驾驶
concisedistinct36 分钟前
如何评价大语言模型架构 TTT ?模型应不应该永远“固定”在推理阶段?模型是否应当在使用时继续学习?
人工智能·语言模型·大模型
找了一圈尾巴37 分钟前
AI Agent-基础认知与架构解析
人工智能·ai agent
jzwei0231 小时前
Transformer Decoder-Only 参数量计算
人工智能·深度学习·transformer
小言Ai工具箱1 小时前
PuLID:高效的图像变脸,可以通过文本提示编辑图像,通过指令修改人物属性,个性化文本到图像生成模型,支持AI变脸!艺术创作、虚拟形象定制以及影视制作
图像处理·人工智能·计算机视觉
白熊1881 小时前
【计算机视觉】基于深度学习的实时情绪检测系统:emotion-detection项目深度解析
人工智能·深度学习·计算机视觉
TextIn智能文档云平台1 小时前
PDF文档解析新突破:图表识别、公式还原、手写字体处理,让AI真正读懂复杂文档!
图像处理·人工智能·算法·自然语言处理·pdf·ocr
老任与码1 小时前
Spring AI(2)—— 发送消息的API
java·人工智能·spring ai
AI改变未来1 小时前
智慧城市新力量!AI如何助力社会治理创新?
人工智能·ai·智慧城市·ai应用
Panesle1 小时前
HunyuanCustom:文生视频框架论文速读
人工智能·算法·音视频·文生视频