数字图像处理(冈萨雷斯)第三版:第二章——数字图像基础——主要内容和重点

一.视觉感知要素(★★☆☆☆)

1.人眼的结构

2.眼睛中图像的形成

(1)人眼中的图像

物体由人眼的晶状体在视网膜上倒立的实像

(2)人眼的亮度适应

(3)马赫带效应

在灰度级相同的条带中,靠近暗带的边缘显示的更亮,靠近亮带的边缘会显示的更暗

(4)同时对比

灰度级不变,在背景较亮的时候,在人眼中会看起来更暗

二.光和电磁波谱(了解)

光通常指电磁波谱中的可见光,是电磁波的一种特殊形式,其频率范围在 3.9×10¹⁴~7.5×10¹⁴Hz 之间,真空中的波长约为 400~760nm

  • 无线电波:波长最长,从几千米到 0.3 米左右,由振荡电路中自由电子的运动产生,一般用于电视和无线电广播等。
  • 微波:波长从 0.3 米到 10⁻³ 米,多用在雷达或其它通讯系统。
  • 红外线:波长范围在 10⁻³ 米到 7.8×10⁻⁷米,由原子的外层电子受激发后产生,具有热效应,常用于夜视遥感、热成像等。
  • 可见光:人眼可感知的极狭窄波段,波长从(78~3.8)×10⁻⁶厘米,是原子或分子内的电子运动状态改变时发出的电磁波,包含红、橙、黄、绿、蓝、靛、紫等颜色。
  • 紫外线:波长从 3×10⁻⁷米到 6×10⁻¹⁰米,产生原因和光波类似,常常在放电时发出,其化学效应最强,可用于杀菌消毒等。
  • X 射线:波长从 2×10⁻⁹米到 6×10⁻¹² 米,由原子内层电子受到激发后产生,具有较强的穿透性,用于医学成像、安检等领域。
  • γ 射线:波长从 10⁻¹⁰~10⁻¹⁴米,从原子核内发出,放射性物质或原子核反应中常有这种辐射伴随,穿透力很强,对生物的破坏力很大。

三.图像感知和获取(了解)

1.使用单个传感器获取图像

优点 缺点
结构简单,成本低(无需复杂的阵列传感器) 帧率低:扫描需时间,难以拍摄运动物体(易模糊)
适应特殊波段:单个传感器可定制为红外、紫外等阵列传感器难以实现的波段 分辨率受限:扫描步数决定像素数量,高分辨率需更长时间
功耗低:单个传感器的电路设计更简单 机械扫描易受振动影响,导致图像畸变

2.使用条带传感器获取图像

优点 缺点
高分辨率:单行像素数可轻松达到数千甚至数万,远超同尺寸面阵传感器的单方向分辨率 依赖运动同步:若同步精度不足,易出现图像畸变(拉伸、倾斜)
大视场适应性:通过运动可实现无限长(理论上)的图像采集(如万米长卷扫描) 帧率限制:成像速度受运动速度和扫描频率制约,难以拍摄静态场景(需额外运动机构)
高感光效率:线阵传感器的单个像素感光面积更大,弱光性能优于同尺寸面阵传感器 系统复杂度:需额外运动控制和同步装置,成本高于简单面阵系统
波段灵活性:易于定制多波段线阵传感器(如红外 + 可见光),适用于多光谱成像 动态场景限制:快速变化的场景(如运动物体突然变速)易产生模糊

3.使用传感器阵列获取图像

优点 缺点
瞬时成像:无需运动配合,可直接拍摄静态和动态场景,避免运动模糊 视场限制:传感器尺寸固定,单次成像的视场范围有限(需广角镜头扩展,但会牺牲部分分辨率)
系统简单:无需复杂的运动同步机构,成本低于高精度条带传感器系统 像素限制:相同尺寸下,像素数量越多,单个像素尺寸越小,弱光性能可能下降(需通过像素合并技术优化)
高帧率潜力:快速读出电路支持高帧率视频拍摄(如 4K 60fps、8K 30fps) 大尺寸成本高:全画幅、中画幅等大尺寸传感器制造难度大,价格昂贵(如单反相机的全画幅传感器)
彩色成像成熟:拜耳阵列等技术已非常成熟,彩色还原效果好 卷帘快门畸变:部分设备使用卷帘快门,拍摄高速运动物体时可能出现扭曲(如飞机螺旋桨弯曲)

四.图像取样和量化(★★★★☆)

1.图像传感器

真实物体通过透镜组成像在图像传感器的光敏平面上,被传感器接受。

传感器的成像平面由密集的光敏单元陈列组成,每一个光敏单元都可以通过吸收的单位时间(曝光时间)的光强,得到像在这一点上的相对亮度,大量的点构成了整幅图像。

2.采样和量化

(1)采样、量化

**采样:**采集图像空间中部分点的灰度值来表示图像的过程(将图像的灰度值采集出来)

量化: 将采样后所得到的各个像素的灰度值由连续转换成离散的整数值

**采样定理(奈奎斯特采样定理):**采样频率应该大于信号中最高频率的二倍

(2)采样间隔和量化等级的影响

采样间隔越大,采样点数越少,原图细节损失多,可能产生马赛克

量化等级越少,原图灰度信息损失多,可能产生伪轮廓。(可能低于人眼能够分辨的灰度级数)

空间分辨率:单位长度的像素数(细采样------细节丰富)

灰度分辨率:灰度级中的可分辨的最小变化(多量化------灰度渐变)

(3)图像传感器的工作原理

  1. 感光:光线通过镜头照射到传感器表面的像素阵列,像素中的光电元件(如光电二极管)利用光电效应,将光子转化为光生电荷,光强越强,电荷越多。

  2. 电荷存储:每个像素暂时存储产生的电荷,积累量与曝光时间、光线强度相关。

  3. 信号转换与输出:存储的电荷被读取后,通过放大器转换为电信号,再经模数转换器转为数字信号,最终传输给处理器生成图像。

(4)数字图像的描述

数字图像是由离散的像素(Pixel)构成的二维网格,每个像素包含特定的颜色或灰度信息,通过这些像素的组合呈现视觉内容。其本质是将连续的光学图像经过采样(离散化空间位置)和量化(离散化色彩 / 灰度值)后得到的数字信号,可被计算机存储、处理和传输。

  • 像素:图像的基本单元,每个像素用一组数值表示其属性(如灰度图像用 0-255 的整数表示明暗,彩色图像常用 RGB 三通道数值表示颜色)。
  • 分辨率:像素的排列密度,通常用 "宽度 × 高度" 表示(如 1920×1080,即水平方向 1920 个像素,垂直方向 1080 个像素)。

数字图像的坐标系为二维直角坐标系,通常遵循 "图像坐标系" 约定:

  • 原点(0,0):位于图像的左上角(与数学坐标系原点位置不同,便于计算机按行 / 列存储数据)。
  • x 轴(水平轴):向右为正方向,代表图像的宽度方向(列索引)。
  • y 轴(垂直轴):向下为正方向,代表图像的高度方向(行索引)。

(5)图像的文件结构

矢量图:用一组数学表达式和属性记录图像信息(存储低、清晰)

位图:以数字阵列形式记录图像上所有像素点的颜色和强度信息(矩阵)

五.像素间的一些基本关系

像素间的关系本质是空间位置、信息连续性、功能协同的综合体现:

  • 空间位置决定图像的几何结构,
  • 灰度 / 色彩关联是图像降噪、分割、压缩的基础,
  • 像素合并 / 拆分和插值则实现了分辨率与性能的动态平衡。
    理解这些关系有助于深入掌握图像处理算法(如滤波、缩放、分割)的原理,以及优化图像质量的方法。

六.数字图像的灰度直方图(★★★☆☆)

**定义:**图像中个各灰度级出现的频率统计(简单的来说,就是把每个灰度级出现的次数相加计算概率)

灰度直方图可用于判断图像是否合理利用了全部被允许的灰度级范围

俩个不同的图片灰度直方图完全可能相同

可以用灰度直方图逆推图像吗?为什么?

答:不可以,灰度直方图丢失了图像的空间位置信息,仅保留了灰度值的统计分布特征。

七.彩色图像(★★☆☆☆)

颜色:人的眼睛、脑根据生活经验对光产生的视觉效应

自然界中的任何一种颜色都可以用三原色------红、绿、蓝按照不同的比例混合得到

1.分类

彩色图像中,每个像素点占存储空间的大小叫做位深,一位就是1bit

2色图像:位深为1,二值图像

256色图像:位深为8,伪彩色图像

真彩色图像:位深为24,R/G/B各8位

灰度图像:位深为8,R/G/B分量相等

2.颜色模型

(1)RGB模型

相加混色:用于屏幕显示

由红(Red)、绿(Green)、蓝(Blue)三种色光,按照不同的比例混合出所有的色光

(2)CMYK模型(CMY)

相减混色:用于彩色打印

由青色(Cyan)、品红色(Magenta)、黄色(Yellow)三种色光,按照不同的比例混合出所有的色光

显色原理:不发光的物体的颜色由被反射的色光决定

(3)SMI模型

彩色图像处理

颜色三要素:

色相(Hue):光的颜色,白光的波长决定

饱和度(Saturation):颜色的纯度(混合白光的量)

亮度(Intensity):颜色的明暗程度,白光线强弱决定

(4)YUV模型

黑白电视

Y输出灰度图,U、Y负责给图像上色