计算机视觉简介(1)

任何计算机视觉处理流程都始于成像系统,它从景物中捕获反射出来的光线,并将光信号转换成计算机可以读取和处理的图像格式 在计算机成像技术发展的早期,图像通过把胶卷或印刷图像素 化后获得;而现在图 像通常直接由数码相机获取,并存储成称为像素的有序数字 目前已有很多关于图像采集和照相机内部工作原理的教科书(例如光学、机械控制和彩色滤波等), 展示了光线进入相机形成图像的采样( 通过图像网格划分)和 量化(即用有限的整数 表示每 个像素的颜 色值) 过程

所有图像可以看作一个矩阵(或三 个矩阵,如果分别考虑色彩平面,该矩阵是景物的反射光在相机成像平面上的强度和色彩信息的量化数据, 显示了景物在数码相机上成像的过程:相机中的传感器阵列决定了 图像的大小和分辨率 假设传感器阵列有 个传感器,则产生大小的图像。每个传感器捕获通过透镜入射到该传感器上的光线。对于一位图像,传感器为每个采样赋予 0到(2的b次方 -1) 间的值 。假设一 位图像,那么采样值就在0到255 之间,如图 1-1 所示 上述过程称为采样和量化.所谓采样就是在连续视场中选择某些点;所谓量化就是把光强的取值限制在有限的离散数值内。在相机设计和相机模型中,采样、量化和图像形成涉及很多主题,感兴趣的读者可以查阅相关文献并进行更深入 的研究 。彩 色图像在照相机中通常会分别对应生成红 ( CR )、绿 ( CG) 和蓝 ( CB ) 个基色图像 。如 产生这些 图像 取决于相机,大多数消 费级相 机在传感器平面前设 置滤色器来捕获所有三个颜色通道的马赛克图像,然后依靠"解马赛克"过程来创建全分辨率 、分离的R,G,B 图像。
有了这个装置,我们就能把图像表示为计算机中可存储的数字数据,称为图像的像素表示。每个图像是表示一个(灰色)或三个(彩色)或更多(深度和其他场)通道的矩阵或张量。像素顺序与采样顺序相同,也就是采集像素的传感器的位置顺序。像素值越大,对应的颜色强度就越大,这可能是图像最明显的表示方法。图像越大,像素越多。当要捕获景物的细节时,传感器需靠得更近,产生的图像分辨率也越高。如果用两个大小不同的图像来拍摄现实世界的相同区域和视场,那么较大图像比较小图像具有更高的分辨率,这是因为较大图像可以分辨更多的细

节。对于灰度图像,我们通常使用二维离散矩阵I(ni,n2)来表示像素值矩阵,其中n1和n2分别索引矩阵的第n行和第n列的像素,I(ni,n2)的值对应像素强度。

虽然每个像素独立于其他像素进行采样,但相邻像素之间通常是相关的。因为典型场景不会在任何地方都有剧烈变化,除了两个不同实体间的边界像素外,相邻像素-般会很相似。因此,图像中像素值不连续(或变化较大)的"边界"能较好地识别出不同实体。通常情况下,除了实体边界的像素之外,自然景观的图像很多区域是平滑的(即没有变化或变化很小)。

如上所述,像素矩阵是图像的基本表示方式,通常称为空域表示。像素是对空间,更准确地说是对成像平面上的光强的测量值进行采样。还有使用所谓的频域方法来观察甚至获取图像,将图像分解成频率分量,类似于棱镜将太阳光分解成不同的色带。还有一些方法,如小波变换,使用时频变换来分析或分解图像,这里的时间在图像领域实际上是指空间。所有这些表示方法都称为图像的变换域表示。通常,图像的变换域表示是可逆的,即可以从变换域表示返回到原始图像。实际上,对于特定的处理任务使用哪种表示确实是个问题。除了空间域和变换域中的表示之外,许多计算机视觉任务首先从图像中(原始图像或一些变换域表示)计算各种类型的特征,然后基于所计算的特征执行- -些分析/推断任务。从某种意义上说,这种计算出的特征充当底层图像的新表示,故将此称为特征表示。下面,简要介绍几种常用的图像变换域表示和特征表示。

相关推荐
沉下心来学鲁班3 分钟前
复现LLM:带你从零认识语言模型
人工智能·语言模型
数据猎手小k4 分钟前
AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。
android·人工智能·机器学习·语言模型
YRr YRr13 分钟前
深度学习:循环神经网络(RNN)详解
人工智能·rnn·深度学习
sp_fyf_202425 分钟前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘
多吃轻食29 分钟前
大模型微调技术 --> 脉络
人工智能·深度学习·神经网络·自然语言处理·embedding
北京搜维尔科技有限公司1 小时前
搜维尔科技:【应用】Xsens在荷兰车辆管理局人体工程学评估中的应用
人工智能·安全
说私域1 小时前
基于开源 AI 智能名片 S2B2C 商城小程序的视频号交易小程序优化研究
人工智能·小程序·零售
YRr YRr1 小时前
深度学习:Transformer Decoder详解
人工智能·深度学习·transformer
知来者逆1 小时前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理
云起无垠1 小时前
技术分享 | 大语言模型赋能软件测试:开启智能软件安全新时代
人工智能·安全·语言模型