【计算机视觉(1)】图像形成基础篇:从光线到图像的完整过程

文章目录

    • [📚 学习路线图](#📚 学习路线图)
    • 本文内容一览(快速理解)
    • 一、图像是什么:理解像素的本质
      • [1.1 图像是什么?:图像是2D矩形阵列的像素集合](#1.1 图像是什么?:图像是2D矩形阵列的像素集合)
      • [1.2 像素值的含义:像素值越大越亮,越小越暗](#1.2 像素值的含义:像素值越大越亮,越小越暗)
    • 二、为什么需要小孔:解决光线混合问题
      • [2.1 为什么白纸上不会自动出现图像?:多个点的光线混合在一起](#2.1 为什么白纸上不会自动出现图像?:多个点的光线混合在一起)
      • [2.2 针孔相机的解决方案:用小孔限制光线路径](#2.2 针孔相机的解决方案:用小孔限制光线路径)
    • 三、针孔相机的困境:孔径大小的矛盾
      • [3.1 孔径大小的影响:孔径太小进光不足,孔径太大图像模糊](#3.1 孔径大小的影响:孔径太小进光不足,孔径太大图像模糊)
    • 四、镜头的解决方案:增加进光量
      • [4.1 镜头的解决方案:通过折射汇聚更多光线](#4.1 镜头的解决方案:通过折射汇聚更多光线)
      • [4.2 镜头的工作原理:多个针孔图像的叠加和对齐](#4.2 镜头的工作原理:多个针孔图像的叠加和对齐)
    • 五、相机参数基础:四个关键参数
      • [5.1 焦距(Focal Length):决定视角和放大倍数](#5.1 焦距(Focal Length):决定视角和放大倍数)
      • [5.2 光圈(Aperture):控制进光量和景深](#5.2 光圈(Aperture):控制进光量和景深)
      • [5.3 快门速度(Shutter Speed):控制曝光时间](#5.3 快门速度(Shutter Speed):控制曝光时间)
      • [5.4 传感器ISO:控制传感器灵敏度](#5.4 传感器ISO:控制传感器灵敏度)
      • [5.5 参数平衡策略:四个参数相互关联](#5.5 参数平衡策略:四个参数相互关联)
    • [📝 本章总结](#📝 本章总结)

📌 适合对象 :计算机视觉初学者、图像处理入门者

⏱️ 预计阅读时间 :30-40分钟

🎯 学习目标:理解图像的本质、掌握针孔相机原理、了解镜头的作用


📚 学习路线图

第一步
理解图像是什么
2D像素阵列 第二步
理解为什么需要针孔相机
(重点) 第三步
了解针孔相机的困境
孔径大小的矛盾 第四步
理解镜头的解决方案
折射汇聚光线 第五步
掌握相机参数基础
焦距、光圈、快门、ISO


本文内容一览(快速理解)

  1. 图像是什么? 图像是2D像素阵列,每个像素记录一个亮度值,值越大越亮

  2. 为什么需要小孔? 没有小孔时,多个点的光线会混合,无法形成清晰图像

  3. 针孔相机的困境 孔径太小→进光不足;孔径太大→图像模糊

  4. 镜头的解决方案 通过折射汇聚更多光线,增加进光量

  5. 相机参数基础 焦距、光圈、快门、ISO四个基本参数


一、图像是什么:理解像素的本质

这一章要建立的基础:理解数字图像是什么,像素是什么,这是理解后续所有内容的基础。

核心问题:当我们说"图像"时,到底指的是什么?


!NOTE

📝 关键点总结:数字图像是2D像素阵列,每个像素记录一个亮度值,像素值越大越亮,越小越暗。

1.1 图像是什么?:图像是2D矩形阵列的像素集合

图像的本质

图像是2D矩形阵列的像素集合。每个像素(pixel)是图像的基本单元,就像拼图的每一块。

图解说明
数字图像的2D矩阵表示 第一行: 218 | 220 | 215 | ... 第二行: 210 | 208 | 212 | ... 第三行: 205 | 207 | 210 | ... ... | ... | ... | ...

💡 说明:每个数字代表一个像素的亮度值(0-255),值越大越亮

类比理解:想象你在测量一个房间的温度分布。数字图像就像你在房间中放置温度计网格,每个温度计记录一个位置的温度。图像中的每个像素就像温度计,记录一个位置的亮度。

1.2 像素值的含义:像素值越大越亮,越小越暗

像素值代表什么?

在灰度图像中:

  • 更大的值 = 更亮:像素值越大,该位置越亮
  • 更小的值 = 更暗:像素值越小,该位置越暗
  • 最亮白色 = 255:完全白色的像素值为255
  • 最暗黑色 = 0:完全黑色的像素值为0

图解说明
0
纯黑色
最暗 64
深灰
较暗 128
中灰
中等 192
浅灰
较亮 255
纯白色
最亮

💡 亮度渐变:像素值从0到255,对应从纯黑到纯白的连续渐变

实际例子

复制代码
一幅1920×1080的图像 = 2,073,600个像素
每个像素用8位(0-255)表示亮度
总存储量 = 2,073,600 × 8位 = 16.6MB(未压缩)

二、为什么需要小孔:解决光线混合问题

前面我们知道了:图像是2D像素阵列,每个像素记录一个亮度值。

但遇到了问题:如果没有限制,来自场景中多个点的光线会同时到达图像平面的同一点,光线混合在一起,无法形成清晰图像。

这一章要解决:如何让每个像素只接收来自场景中一个点的光线?

答案:用一个小孔限制光线路径。这就是针孔相机的核心原理。


!NOTE

📝 关键点总结:没有针孔时,场景中多个点的光线会混合在一起,无法形成清晰图像;针孔让每个像素只接收来自场景中一个点的光线,实现"一点对一点"的清晰成像。

2.1 为什么白纸上不会自动出现图像?:多个点的光线混合在一起

问题场景

想象你在一个暗室中,墙上有一个小孔,外面有明亮的场景。你在暗室中放一张白纸,为什么纸上不会自动出现图像?

原因:光线混合了

图解说明
🌳 A点(树) 📄 P点
混合光线 🏠 B点(房子) ☁️ C点(天空) ❌ 无法区分
无法形成清晰图像

💡 问题:多个场景点的光线同时到达图像平面的同一点,光线混合在一起,无法区分

类比理解:就像很多人同时对你说话,你听到的是混乱的声音,无法听清任何一个人的话。

2.2 针孔相机的解决方案:用小孔限制光线路径

核心思路:限制光线路径,让每个像素只接收来自一个点的光线。

图解说明
光线1 光线2 光线3 只通过A的光线 只通过B的光线 只通过C的光线 🌳 A点 🔘 针孔 🏠 B点 ☁️ C点 📄 P1点
只有A点光线 📄 P2点
只有B点光线 📄 P3点
只有C点光线 ✅ 清晰图像
一点对一点

💡 解决方案:针孔限制光线路径,每个图像点只接收来自一个场景点的光线

针孔相机的工作原理

针孔相机(pinhole camera)只允许来自场景中一个点 的光线到达图像平面上的一个点

关键机制

  • 光线限制:小孔限制了光线的传播路径,只有特定方向的光线能通过
  • 一一对应:场景中的每个点对应图像平面上的一个点
  • 清晰成像:每个像素只记录来自一个方向的光线,形成清晰的图像

类比理解:就像在墙上开一个小洞,只有正对着洞的光线能通过,其他方向的光线被挡住了。

实际例子

复制代码
场景中的树 → 通过针孔 → 在图像平面上形成倒立的树像
每个场景点 → 对应一个图像点 → 形成清晰图像

三、针孔相机的困境:孔径大小的矛盾

前面我们知道了:针孔相机通过限制光线路径实现清晰成像,每个像素只接收来自一个点的光线。

但遇到了问题:针孔相机只有一个可调参数(孔径大小),但这个参数存在根本矛盾------孔径太小进光不足,孔径太大图像模糊。

这一章要解决:理解针孔相机的局限性,为什么没有完美的孔径大小?

答案:孔径大小存在两难困境,无法同时满足清晰度和进光量的要求。这引出了镜头的必要性。


!NOTE

📝 关键点总结:针孔相机只有一个参数(孔径大小),但存在根本矛盾:孔径太小→进光不足;孔径太大→图像模糊;没有完美的孔径大小。

3.1 孔径大小的影响:孔径太小进光不足,孔径太大图像模糊

针孔相机的唯一参数

针孔相机只有一个可调参数:孔径大小(aperture size),即针孔的大小。

孔径大小的影响

(1)孔径非常小的情况

图解说明
少量光线 清晰光线 优点 缺点 🌍 场景 🔘 小孔径
进光量很少 📄 图像平面
图像清晰 ✅ 图像清晰
光线路径受限 ❌ 进光量不足
需要长时间曝光

优点

  • 图像更清晰(光线路径更受限)

缺点

  • 进光量不足:需要很长的曝光时间(只适用于静态场景)
  • 需要高光强:场景必须非常明亮

(2)孔径太大的情况

图解说明
大量光线 混合光线 优点 缺点 🌍 场景 🔴 大孔径
进光量多 📄 图像平面
图像模糊 ✅ 进光量多
曝光时间短 ❌ 图像模糊
光线混合

问题

  • 图像模糊:来自场景中多个点的光线会混合在一起
  • 失去了针孔相机"一点对一点"的优势

(3)没有完美的孔径

核心矛盾

  • 如果孔径大 → 图像模糊
  • 如果孔径小 → 进光不足
  • 没有中间值可以同时满足清晰度和进光量

类比理解:就像门的大小------门太小,人进不来;门太大,所有人都能进来,无法控制。没有完美的门大小。

实际应用

复制代码
静态场景拍摄:
小孔径 + 长时间曝光 → 获得清晰图像
适用于:风景、建筑等静态场景

动态场景拍摄:
需要大孔径 → 更多进光量 → 快速曝光
但会牺牲清晰度 → 需要其他解决方案(如镜头)

四、镜头的解决方案:增加进光量

前面我们知道了:针孔相机虽然解决了清晰度问题,但进光量不足,而且孔径大小存在两难困境。

但遇到了问题:有没有办法在保持清晰度的同时增加进光量?

这一章要解决:如何用镜头解决进光量不足的问题?

答案:镜头通过折射汇聚更多光线,在保持清晰度的同时大幅增加进光量,但需要聚焦到特定距离。


!NOTE

📝 关键点总结:镜头通过折射汇聚更多光线,解决针孔相机进光不足的问题,但需要聚焦;镜头本质上是对多个针孔图像的叠加和对齐,但只能对一个距离完美对齐。

4.1 镜头的解决方案:通过折射汇聚更多光线

问题的提出

针孔相机存在进光量不足的问题,有没有办法在保持清晰度的同时增加进光量?

解决方案:折射(Refraction)

镜头通过折射(refraction)来汇聚光线:

  • 汇聚更多光线:镜头可以收集来自更大范围的光线
  • 需要聚焦:但必须将镜头聚焦到特定距离

图解说明
镜头相机 针孔相机 少量光线 进光量少 多方向光线 汇聚光线
进光量大 🔍 镜头
折射汇聚 🌍 场景 📄 图像平面 🔘 小孔 🌍 场景 📄 图像平面

💡 对比:镜头通过折射汇聚来自不同方向的光线,在保持清晰度的同时大幅增加进光量

类比理解:就像用放大镜聚焦阳光------放大镜可以收集更大范围的阳光,然后汇聚到一个点,产生更强的光。

4.2 镜头的工作原理:多个针孔图像的叠加和对齐

本质理解

镜头本质上是对多个针孔图像的叠加和对齐:

  • 多个针孔:相当于有多个小孔同时工作
  • 叠加对齐:通过折射将这些图像叠加并对齐
  • 距离限制 :对齐只对一个距离有效

图解说明
光线1 光线2 光线3 汇聚到焦点 关键限制 🌳 A点 🔍 镜头
折射汇聚 🏠 B点 ☁️ C点 📄 图像平面 ⚠️ 只能对一个距离
完美聚焦
其他距离会模糊

💡 工作原理:镜头将来自不同方向的光线汇聚到图像平面,但只能对一个距离完美聚焦

关键限制

  • 只能对一个距离完美聚焦:如果物体不在聚焦平面上,图像会模糊
  • 景深问题:只有聚焦平面上的物体完全清晰,其他距离的物体会产生不同程度的模糊

实际应用示例

复制代码
人像摄影:
聚焦到人物 → 人物清晰
背景不在聚焦平面 → 背景模糊(背景虚化效果)

风景摄影:
聚焦到远处 → 远处清晰
近处物体模糊 → 需要小光圈增加景深

五、相机参数基础:四个关键参数

前面我们知道了:镜头通过折射汇聚光线,增加进光量,但需要聚焦。

但遇到了问题:如何控制图像?有哪些参数可以调节?

这一章要解决:理解相机的四个关键参数及其作用。

答案:相机有四个关键参数:焦距(决定视角)、光圈(控制进光量和景深)、快门速度(曝光时间)、ISO(传感器灵敏度)。这些参数相互关联,需要根据拍摄需求平衡。


!NOTE

📝 关键点总结:相机有四个关键参数:焦距(决定视角)、光圈(控制进光量和景深)、快门速度(曝光时间)、ISO(传感器灵敏度);这些参数相互关联,需要平衡。

5.1 焦距(Focal Length):决定视角和放大倍数

定义:透镜的焦距,决定视角和放大倍数

作用

  • 焦距大 → 视角小 → 远摄效果(物体看起来更大)
  • 焦距小 → 视角大 → 广角效果(视野更广)

图解说明
焦距大(远摄镜头) 焦距小(广角镜头) 大视角 视野很广 小视角 视野窄 🔍 长焦距 🌍 场景 📄 图像
物体看起来更大 🔍 短焦距 🌍 场景 📄 图像
能看到更多内容

💡 焦距对比:焦距小→视野广但物体小;焦距大→视野窄但物体大

类比理解:焦距就像望远镜的倍数------焦距大,看得远但视野窄;焦距小,视野广但看得近。

5.2 光圈(Aperture):控制进光量和景深

定义:控制光线通过的孔径大小

表示:F-number(F数),如f/1.4、f/5.6、f/16

  • F-number = 焦距 / 孔径直径
  • F-number小 → 孔径大 → 进光多
  • F-number大 → 孔径小 → 进光少

作用

  • 控制进光量:光圈越大,进光越多
  • 控制景深:光圈越小,景深越大(更多物体清晰)

图解说明
小光圈(f/16) 大光圈(f/1.4) 大量光线 只有聚焦平面清晰 少量光线 前后都清晰 🔘 小孔径
进光少 🌍 场景 📄 图像
大景深 🔴 大孔径
进光多 🌍 场景 📄 图像
背景虚化

💡 光圈对比:大光圈→进光多但景深小(背景虚化);小光圈→进光少但景深大(前后都清晰)

实际效果

  • 小光圈(如f/16):进光量少,景深大(更多物体清晰)
  • 大光圈(如f/1.4):进光量大,景深小(只有聚焦平面清晰,背景虚化)

5.3 快门速度(Shutter Speed):控制曝光时间

定义:传感器接收光线的时间

作用

  • 时间长 → 进光多,但可能产生运动模糊
  • 时间短 → 进光少,但可以冻结运动

图解说明
快速快门(1/1000秒) 慢速快门(1/30秒) 长时间曝光 运动模糊 短时间曝光 冻结运动 ⏱️ 短时间
进光少 🌍 场景
运动物体 📄 图像
可以冻结运动 ⏱️ 长时间
进光多 🌍 场景
运动物体 📄 图像
运动物体会模糊

💡 快门对比:慢速快门→进光多但可能运动模糊;快速快门→进光少但可以冻结运动

应用场景

  • 静态场景:可以使用较慢的快门速度
  • 动态场景:需要使用较快的快门速度冻结运动

5.4 传感器ISO:控制传感器灵敏度

定义:传感器的灵敏度

作用

  • ISO高 → 更敏感,在暗光下也能拍摄,但噪声更大
  • ISO低 → 噪声小,但需要更多光线

权衡:提高ISO可以在暗光下拍摄,但会牺牲图像质量。应尽可能使用低ISO以获得最佳图像质量。

5.5 参数平衡策略:四个参数相互关联

如何让暗室中的图像更亮?

可以通过以下方式增加进光量:

  1. 增大光圈(降低F-number):让更多光线进入
  2. 降低快门速度(增加曝光时间):让传感器接收光线更长时间
  3. 提高ISO:增加传感器灵敏度

参数权衡

  • 增大光圈 → 景深变小
  • 降低快门 → 可能产生运动模糊
  • 提高ISO → 噪声增加

实际应用示例

复制代码
人像摄影:
大光圈(f/1.4) → 背景虚化 → 突出人物
快速快门 → 冻结人物动作
低ISO → 保持图像质量

风景摄影:
小光圈(f/16) → 大景深 → 前后都清晰
中等快门速度 → 平衡进光和运动模糊
低ISO → 最佳图像质量

暗光环境:
大光圈(f/1.4) → 最大进光量
慢速快门 → 增加曝光时间(需要三脚架)
适度提高ISO → 平衡亮度和噪声

📝 本章总结

核心要点回顾

  1. 图像的本质:2D像素阵列,每个像素记录亮度值,值越大越亮

  2. 为什么需要针孔相机:没有针孔时,多个点的光线会混合,无法形成清晰图像;针孔让每个像素只接收来自一个点的光线

  3. 针孔相机的困境:孔径太小→进光不足;孔径太大→图像模糊;没有完美孔径

  4. 镜头的解决方案:通过折射汇聚更多光线,增加进光量,但需要聚焦

  5. 相机参数基础:焦距(视角)、光圈(进光+景深)、快门(曝光)、ISO(灵敏度)四个参数相互关联

知识地图
🌍 光线从场景发出 ❓ 问题1:如何选择性接收? ✅ 针孔相机
限制光线路径 ❓ 问题2:进光不足怎么办? ✅ 镜头
汇聚光线 ❓ 问题3:如何控制图像质量? ✅ 四个参数
焦距、光圈、快门、ISO

关键决策点

  • 需要清晰度 → 小孔径或聚焦
  • 需要进光量 → 大光圈或长曝光
  • 需要大景深 → 小光圈
  • 需要背景虚化 → 大光圈

相关推荐
小小工匠1 小时前
LLM - AI Agent 学习路线图:从 RAG 到多智能体实战
人工智能·多智能体·rag
moonquakeTT1 小时前
雷达调试5大核心思路:从理论到实战
人工智能·matlab·目标跟踪·雷达
雍凉明月夜1 小时前
Ⅳ人工智能机器学习之监督学习的概述
人工智能·深度学习·学习
三块可乐两块冰1 小时前
【第二十二周】机器学习笔记二十一
人工智能·笔记·机器学习
人工小情绪1 小时前
pytorch nn.CrossEntropyLoss
人工智能·pytorch
持续学习的程序员+11 小时前
强化学习阶段性总结
人工智能·算法
永远都不秃头的程序员(互关)1 小时前
昇腾CANN算子开发实践:从入门到性能优化
人工智能·python·机器学习
ConardLi1 小时前
分析了 100 万亿 Token 后,得出的几个关于 AI 的真相
前端·人工智能·后端
明月照山海-1 小时前
机器学习周报二十五
人工智能·机器学习