图像处理与视觉感知复习--概述

文章目录

图像和像素的表示

一幅图像可分解为许多个单元。每个基本单元叫做图像元素,简称像素

  • 图像是用于各种观测系统以不同形式和手段观测客观世界而获得的、可以直接或间接作用于人的视觉系统而产生的视知觉实体。
    图像可以分为模拟图像和数字图像
    模拟图像:二维空间和亮度都是连续值的图像。亮度值连续且不分等级
    数字图像:二维空间和亮度都是用有限数字数值表示的图像

图像工程的三个层次

视觉适应与辨别

亮度适应现象:感知亮度不是亮度的简单函数

马赫带:视觉系统往往会在不同强度区域的边界处出现"下冲"或"上冲"现象(毛边)

图像取样和量化

动态范围:

  • 处于存储和量化硬件的考虑,灰度级数通常取为2的整数幂,即 L = 2 k L = 2^k L=2k
  • 灰度级区间为: [ 0 , L − 1 ] [0, L - 1] [0,L−1]
  • 动态范围上限取决于饱和度,下限取决于噪声

像素之间的一些基本关系

  • 相邻像素

    • 4邻域

    • D邻域

    • 8邻域

  • 连通性

    连通性是描述区域和边界的重要概念

    两个像素连通的两个必要条件是:

    1. 两个像素的位置是否相邻
    2. 两个像素的灰度值是否满足特定的相似性准则
    • 4连通
    • 8连通
    • m连通

      两种情况都属于m连通,一个是一个在另一个的4邻域内,另外一种是在对应的d邻域内,并且4邻域没有对应的相似像素(一个像素块周围只能有一个像素块)

例:

答:第一个是8连通,第二个是m连通,第三个是4连通

  • 距离
    距离度量
    1. 欧式距离(范数为2的距离)
      D e ( p , q ) = [ ( x − u ) 2 + ( y − v ) 2 ] 1 2 D_e(p, q) = [(x - u)^2 + (y - v)^2]^{\frac{1}{2}} De(p,q)=[(x−u)2+(y−v)2]21
    2. (曼哈顿)城区距离(范数为1的距离)
      D 4 ( p , q ) = ∣ x − u ∣ + ∣ y − v ∣ D_4(p, q) = |x - u| + |y - v| D4(p,q)=∣x−u∣+∣y−v∣
    3. 棋盘距离(范数为 ∞ \infty ∞的距离)
      D 8 ( p , q ) = m a x ( ∣ x − u ∣ , ∣ y − v ∣ ) D_8(p, q) = max(|x - u|, |y - v|) D8(p,q)=max(∣x−u∣,∣y−v∣)

例:

D e = 2 2 + 5 2 = 29 D 4 = 2 + 5 = 7 D 8 = 5 D_e = \sqrt{2^2 + 5^2} = \sqrt{29} \\ D_4 = 2 + 5 = 7 \\ D_8 = 5 De=22+52 =29 D4=2+5=7D8=5

空间变换的坐标公式与应用

坐标变换可以借助矩阵写为
v ′ = T v v' = Tv v′=Tv

为了将所有的对图像的操作都变成对矩阵的乘法运算,将原坐标进行升维,将2D坐标变成3D坐标,这样对图像进行平移的矩阵操作也变成了矩阵乘法。

转换为3D坐标后对对应图像操作的对应矩阵:

  • 改变图像的像素值,我们称为滤波(Filtering)

  • 改变图像的像素位置,我们称为扭曲(Warping)

  • 转置变换

    图像转置是指将图像像素的x坐标和y坐标互换

    图像的大小会随之改变:高度和宽度将互换

    对应要乘的矩阵:

    0 1 0 1 0 0 0 0 1 \] \\begin{bmatrix} 0 \& 1 \& 0\\\\ 1 \& 0 \& 0 \\\\ 0 \& 0 \& 1\\\\ \\end{bmatrix} 010100001

    公式推导:
    逆时针旋转 θ \theta θ度后,对应的系数矩阵(极坐标变换方式)
    { x ′ = x cos ⁡ θ − y sin ⁡ θ y ′ = x sin ⁡ θ + y cos ⁡ θ \begin{cases} x' = x\cos\theta - y \sin\theta\\ y' = x\sin\theta + y\cos\theta \end{cases} {x′=xcosθ−ysinθy′=xsinθ+ycosθ

    cos ⁡ θ − sin ⁡ θ 0 sin ⁡ θ cos ⁡ θ 0 0 0 1 \] \\begin{bmatrix} \\cos\\theta \& -\\sin\\theta \& 0\\\\ \\sin\\theta \& \\cos\\theta \& 0\\\\ 0 \& 0 \& 1 \\end{bmatrix} cosθsinθ0−sinθcosθ0001

答:

  1. 平移变换

    1 0 6 0 1 5 0 0 1 \] \\begin{bmatrix} 1 \& 0 \& 6\\\\ 0 \& 1 \& 5 \\\\ 0 \& 0 \& 1\\\\ \\end{bmatrix} 100010651 伸缩变换 \[ 4 0 0 0 2 0 0 0 1 \] \\begin{bmatrix} 4 \& 0 \& 0\\\\ 0 \& 2 \& 0 \\\\ 0 \& 0 \& 1\\\\ \\end{bmatrix} 400020001

    x y 1 \] ⋅ \[ cos ⁡ 45 − sin ⁡ 45 0 sin ⁡ 45 cos ⁡ 45 0 0 0 1 \] \\begin{bmatrix} x\\\\ y\\\\ 1 \\end{bmatrix} \\cdot \\begin{bmatrix} \\cos 45 \& -\\sin 45 \& 0\\\\ \\sin 45 \& \\cos 45 \& 0\\\\ 0 \& 0 \& 1 \\end{bmatrix} xy1 ⋅ cos45sin450−sin45cos450001

  • 仿射变换
  • 投影变换

灰度级插值

在数字图像处理中,几何变换由两个基本操作组成:

  • 空间变换,它定义了图像平面上像素的重新安排
  • 灰度级插补,处理空间变换后图像中像素灰度级的赋值

数字图像处理只能对坐标网格点(离散点)的值进行变换。而坐标变换后产生的新坐标值同网格点值往往不重合,因此需要通过内插的方法将非网格点的灰度值变换成网格点的灰度值,这种算法称为灰度内插:

方法:

  • 最邻近插值法

    将离他最近的灰度值赋予它

    这种方法经常产生不希望的人为疵点,如高分辨率图像的直边扭曲。可以用更完善的技术得到较平滑的结果。

  • 双线性插值

    将相邻的两个灰度值相连对应线性值就是当前位置的灰度值

    双线性插值的特点:

    • 计算量大,但缩放后图像质量高,不会出现图像不连续的情况
    • 具有低通滤波器的性质,使高频分量减弱,所以使图像的轮廓在一定程度上受损
  • 高阶插值

常见的灰度插值算法和对应的优缺点:

  • 最邻近插值法:这种方法简单效果不太好
  • 双线性插值(一阶插值),计算量大,但缩放后图像质量高,不会出现图像不连续的情况
  • 高阶插值,计算量最大,插值后图像的视觉质量最好
相关推荐
lqjun082713 分钟前
Focal Loss 原理详解及 PyTorch 代码实现
人工智能·pytorch·python
科技小E13 分钟前
WebRTC技术EasyRTC嵌入式音视频通信SDK打造远程实时视频通话监控巡检解决方案
人工智能·音视频
风虎云龙科研服务器19 分钟前
英伟达Blackwell架构重构未来:AI算力革命背后的技术逻辑与产业变革
人工智能·重构·架构
白熊18843 分钟前
【计算机视觉】OpenCV实战项目:基于Tesseract与OpenCV的字符识别系统深度解析
人工智能·opencv·计算机视觉
kovlistudio1 小时前
机器学习第三讲:监督学习 → 带答案的学习册,如预测房价时需要历史价格数据
人工智能·机器学习
嵌入式仿真实验教学平台1 小时前
「国产嵌入式仿真平台:高精度虚实融合如何终结Proteus时代?」——从教学实验到低空经济,揭秘新一代AI赋能的产业级教学工具
人工智能·学习·proteus·无人机·低空经济·嵌入式仿真·实验教学
Ronin-Lotus2 小时前
图像处理篇---MJPEG视频流处理
图像处理·python·opencv
正在走向自律2 小时前
Python 数据分析与可视化:开启数据洞察之旅(5/10)
开发语言·人工智能·python·数据挖掘·数据分析
LuvMyLife2 小时前
基于Win在VSCode部署运行OpenVINO模型
人工智能·深度学习·计算机视觉·openvino
fancy1661662 小时前
力扣top100 矩阵置零
人工智能·算法·矩阵