计算机视觉简介(1)

任何计算机视觉处理流程都始于成像系统，它从景物中捕获反射出来的光线，并将光信号转换成计算机可以读取和处理的图像格式在计算机成像技术发展的早期，图像通过把胶卷或印刷图像素化后获得；而现在图像通常直接由数码相机获取，并存储成称为像素的有序数字目前已有很多关于图像采集和照相机内部工作原理的教科书（例如光学、机械控制和彩色滤波等），展示了光线进入相机形成图像的采样（通过图像网格划分）和量化（即用有限的整数表示每个像素的颜色值) 过程

所有图像可以看作一个矩阵（或三个矩阵，如果分别考虑色彩平面,该矩阵是景物的反射光在相机成像平面上的强度和色彩信息的量化数据, 显示了景物在数码相机上成像的过程：相机中的传感器阵列决定了图像的大小和分辨率假设传感器阵列有个传感器，则产生大小的图像。每个传感器捕获通过透镜入射到该传感器上的光线。对于一位图像，传感器为每个采样赋予 0到（2的b次方 -1) 间的值。假设一位图像，那么采样值就在0到255 之间，如图 1-1 所示上述过程称为采样和量化.所谓采样就是在连续视场中选择某些点；所谓量化就是把光强的取值限制在有限的离散数值内。在相机设计和相机模型中，采样、量化和图像形成涉及很多主题，感兴趣的读者可以查阅相关文献并进行更深入的研究。彩色图像在照相机中通常会分别对应生成红 ( CR )、绿 ( CG) 和蓝 ( CB ) 个基色图像。如产生这些图像取决于相机，大多数消费级相机在传感器平面前设置滤色器来捕获所有三个颜色通道的马赛克图像，然后依靠"解马赛克"过程来创建全分辨率、分离的R,G,B 图像。
有了这个装置，我们就能把图像表示为计算机中可存储的数字数据，称为图像的像素表示。每个图像是表示一个(灰色)或三个(彩色)或更多(深度和其他场)通道的矩阵或张量。像素顺序与采样顺序相同，也就是采集像素的传感器的位置顺序。像素值越大，对应的颜色强度就越大，这可能是图像最明显的表示方法。图像越大，像素越多。当要捕获景物的细节时，传感器需靠得更近，产生的图像分辨率也越高。如果用两个大小不同的图像来拍摄现实世界的相同区域和视场，那么较大图像比较小图像具有更高的分辨率，这是因为较大图像可以分辨更多的细

节。对于灰度图像，我们通常使用二维离散矩阵I(ni,n2)来表示像素值矩阵，其中n1和n2分别索引矩阵的第n行和第n列的像素，I(ni,n2)的值对应像素强度。

虽然每个像素独立于其他像素进行采样，但相邻像素之间通常是相关的。因为典型场景不会在任何地方都有剧烈变化，除了两个不同实体间的边界像素外，相邻像素-般会很相似。因此，图像中像素值不连续(或变化较大)的"边界"能较好地识别出不同实体。通常情况下，除了实体边界的像素之外，自然景观的图像很多区域是平滑的(即没有变化或变化很小)。

如上所述，像素矩阵是图像的基本表示方式，通常称为空域表示。像素是对空间，更准确地说是对成像平面上的光强的测量值进行采样。还有使用所谓的频域方法来观察甚至获取图像，将图像分解成频率分量，类似于棱镜将太阳光分解成不同的色带。还有一些方法，如小波变换，使用时频变换来分析或分解图像，这里的时间在图像领域实际上是指空间。所有这些表示方法都称为图像的变换域表示。通常，图像的变换域表示是可逆的，即可以从变换域表示返回到原始图像。实际上，对于特定的处理任务使用哪种表示确实是个问题。除了空间域和变换域中的表示之外，许多计算机视觉任务首先从图像中(原始图像或一些变换域表示)计算各种类型的特征，然后基于所计算的特征执行- -些分析/推断任务。从某种意义上说，这种计算出的特征充当底层图像的新表示，故将此称为特征表示。下面，简要介绍几种常用的图像变换域表示和特征表示。