图像形成与计算机视觉基础

1. 图像形成的基本原理

图像形成是物理世界与传感器（如胶片、CCD/CMOS）交互的过程，核心是光线的传播与记录。

1.1 直接放置胶片模型

物理原理：物体表面反射的光线直接照射到胶片上，但无任何遮挡或聚焦机制。
问题：所有物体点的光线会覆盖整个胶片，导致完全模糊（如图1）。

1.2 针孔相机模型

改进：在物体与胶片间加入针孔屏障，仅允许通过小孔的光线到达胶片（图2）。
关键参数：
- 孔径大小（d）：孔径越小，成像越清晰但亮度越低（需权衡信噪比）。
- 焦距（f）：针孔到胶片的距离，决定成像比例。

1.3 透镜模型

原理：透镜通过折射集中光线，替代针孔以提高亮度（图3）。
薄透镜公式：

1/f=1/u+1/v
- u：物距（物体到透镜的距离）
- v：像距（透镜到成像平面的距离）
景深（Depth of Field）：透镜允许一定范围内的物体清晰成像，与光圈大小成反比。

2. 投影几何与数学模型

2.1 透视投影（Perspective Projection）

2.2 仿射投影（Affine Projection）

2.3 消失点与消失线

3. 颜色空间与模型

3.1 RGB颜色空间

定义：通过红、绿、蓝三原色的叠加表示颜色（图6）。
缺点：
- 通道强相关：调整亮度需同时改变所有通道。
- 非线性感知：人眼对亮度的响应接近对数尺度，而RGB是线性的。

3.2 HSV/HSL颜色空间

组成：
- H（色相）：颜色类型（0°-360°）。
- S（饱和度）：颜色纯度（0%-100%）。
- V（明度）/L（亮度）：颜色明暗程度。
应用：图像编辑软件（如Photoshop）中的颜色选择器。

3.3 YCbCr颜色空间

分离亮度与色度：
- Y（亮度）：Y=0.299R+0.587G+0.114B
- Cb（蓝色色差）：Cb=0.564(B−Y)+128
- Cr（红色色差）：Cr=0.713(R−Y)+128
压缩优势：人眼对亮度更敏感，可对Cb/Cr进行子采样（如4:2:0）。

3.4 CIELAB颜色空间

4. 数字图像形成技术

4.1 空间采样（Spatial Sampling）

奈奎斯特采样定理：采样频率需大于信号最高频率的2倍，避免混叠（图7）。
- 示例：若图像最高空间频率为100 cycles/mm，则采样间隔需小于0.005 mm。
像素阵列：

x=j⋅Δx,y=k⋅Δy(j,k 为整数)

4.2 量化（Quantization）

位深度与灰度级：
- 8位：256级（JPEG标准）。
- 12位：4096级（医学影像）。
- 16位：65536级（专业摄影）。
量化误差：

误差=动态范围2n(n=位深度)

4.3 分辨率与存储权衡

空间分辨率：
- 人脸识别：64×64像素（约0.1MP）可满足基本需求。
- 高清显示：1920×1080像素（2MP）。
存储计算：

单张图像大小=宽×高×通道数×位深度单张图像大小=宽×高×通道数×位深度
- 示例：24位彩色图（3通道×8位），1024×768像素：
  
  1024×768×3×8=18,874,368 bits=2.36 MB

5. 空间域与变换域操作

- 定义：
  - 图像处理：输入图像 → 输出图像，目标是抑制失真、增强有用信息（如对比度调整、去噪）。
  - 图像分析：输入图像 → 提取特征/测量（如边缘检测、目标计数）。
  - 计算机视觉：输入图像 → 语义理解（如目标识别、场景重建）。
- 空间域操作：直接在像素值上进行处理，分为两类：
  - 点操作：单个像素独立变换，公式：
    
    g(x,y)=T(f(x,y))（如对比度拉伸、反转）g(x,y)=T(f(x,y))（如对比度拉伸、反转）
  - 邻域操作：基于像素周围区域计算，公式：
    
    g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),... )（如均值滤波）g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),...)（如均值滤波）

6. 点操作详解

6.1 对比度拉伸（Contrast Stretching）

6.2 阈值处理（Thresholding）

6.3 强度反转（Intensity Inversion）

6.4 对数与幂变换

7. 直方图处理

7.1 直方图均衡化（Histogram Equalization）

7.2 直方图规定（Histogram Matching）

8. 算术与逻辑操作

算术操作：
- 加法：多幅图像平均降噪（噪声方差降低 σ2NNσ2）。
- 减法：检测变化区域（如运动目标）。
逻辑操作：
- AND/OR：掩膜操作（提取特定区域）。
- XOR：检测差异（如边缘增强）。

9. 关键问题解析

10.总结

图像形成：从物理模型（针孔、透镜）到数学建模（透视/仿射投影）。

颜色科学：不同颜色空间适应不同需求（编辑、压缩、感知）。

数字化技术：采样与量化需平衡质量与效率，避免信息损失。

点操作：直接修改像素值，适合对比度调整和二值化。

直方图处理：通过分布调整优化全局或局部对比度。

算术操作：多用于图像融合与噪声抑制。

核心公式与算法：如Otsu阈值、直方图均衡化需熟练掌握推导与应用。