图像处理与视觉感知---期末复习重点(7)

文章目录

  • 一、图像压缩
    • [1.1 三种冗余](#1.1 三种冗余)
    • [1.2 模型](#1.2 模型)
    • [1.3 信息测量](#1.3 信息测量)
  • 二、无误差压缩
    • [2.1 哈夫曼编码](#2.1 哈夫曼编码)
      • [2.1.1 步骤](#2.1.1 步骤)
      • [2.1.2 例题](#2.1.2 例题)
    • [2.2 算术编码](#2.2 算术编码)
  • 三、变换编码

一、图像压缩

1.1 三种冗余

1. 三种基本的是数据冗余为:编码冗余、像素间冗余、心理视觉冗余。

2. 编码冗余:如果一个图像的灰度级编码使用了多于实际需要的编码符号,就称该图像包含了编码冗余。

3. 像素间冗余:对于一幅图像,很多单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测。

4. 心理视觉冗余:有些信息在通常的视觉过程中与另外一些信息相比并不那么重要,这些信息被认为是心理视觉冗余的,去除这些信息并不会明显降低图像质量。

由于消除心理视觉冗余数据会导致一定量信息的丢失,所以这一过程通常称为量化。心理视觉冗余压缩是不可恢复的,量化的结果导致了数据有损压缩。

1.2 模型

1. 图像压缩模型由编码器和解码器组成。

2. 信源编码器:减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余。组成图:

(1) 转换器:减少像素间冗余。

(2) 量化器:减少心理视觉冗余,该步操作是不可逆的。

(3) 符号编码器:减少编码冗余。

注:并不是每个图像压缩系统都必须包含这 3 3 3 种操作,如进行无误差压缩时,必须去掉量化器。

3. 信源解码器组成图:

(1) 符号解码器:进行符号编码的逆操作。

(2) 反向转换器:进行转换器的逆操作。

1.3 信息测量

1. 对一个随机事件 E E E,如果它的出现概率是 P ( E ) P(E) P(E),那么它包含的信息如下公式所示。 I ( E ) I(E) I(E) 称为 E E E 的自信息。如果 P ( E ) = 1 P(E)=1 P(E)=1,那么 I ( E ) = 0 I(E)=0 I(E)=0。

2. 压缩比 r r r 如下公式所示。一般情况下 r ≥ 1 r≥1 r≥1, r r r 愈大则压缩程度愈高。

3. 图像熵 H H H 公式如下。令 p ( d i ) p(d_i) p(di) 为数字图像第 i i i 个灰度级 d i d_i di 相应出现概率。

4. 平均码字长度公式如下所示。令 L i L_i Li 为数字图像第 i i i 个灰度级 d i d_i di 的编码长度。

5. 编码效率 η η η 公式如下所示。如果平均码字长度接近 H H H,则编码效果为佳。

二、无误差压缩

1. 采用变字长编码,变字长编码是每个符号的码字长度随字符出现概率而变化。

2. 若编码时,对出现概率较大的符号用较少比特数(短码)表示,对出现概率较少的符号用较多比特数(长码)表示,则其平均码字长度要比等长编码时所需码字少。

2.1 哈夫曼编码

2.1.1 步骤

哈夫曼编码步骤如下:

2.1.2 例题

2.2 算术编码

1. 算术编码从整个符号序列出发,采用递推形式连续编码。在算术编码中,信源符号(灰度值)和码字之间不存在一一对应的关系。

2. 算术编码用到的两个基本的参数:符号的概率和它的编码间距。

3. 算法编码包括编码和解码过程。编码本质就是按给的码的顺序找区间划分;解码本质就是按给的实数反向找区间,再将每一次找到的区间对应成码。例题如下:

三、变换编码

1. 用可逆的线性变换(如傅里叶变换)将图像映射成一组变换系数,然后将这些系数量化和编码。大多数图像变换得到的系数值都很小,这些系数可以较粗地量化,或忽略不计。虽然失真很小,信息仍不能完全复原,所以还是有损压缩。

2. 变换编码系统组成:

3. 离散傅里叶变换和离散余弦变换比较:

(1) 相同:都是图像变换,对信息进行集中。

(2) 异同:离散傅里叶变换涉及复数运算,而离散余弦变换涉及实数运算,离散余弦变换是离散傅里叶变换的一种特殊形式。

相关推荐
昨日之日20061 小时前
Wan2.2-S2V - 音频驱动图像生成电影级质量的数字人视频 ComfyUI工作流 支持50系显卡 一键整合包下载
人工智能·音视频
SEO_juper3 小时前
大型语言模型SEO(LLM SEO)完全手册:驾驭搜索新范式
人工智能·语言模型·自然语言处理·chatgpt·llm·seo·数字营销
攻城狮7号4 小时前
腾讯混元翻译模型Hunyuan-MT-7B开源,先前拿了30个冠军
人工智能·hunyuan-mt-7b·腾讯混元翻译模型·30个冠军
zezexihaha4 小时前
从“帮写文案”到“管生活”:个人AI工具的边界在哪?
人工智能
算家云4 小时前
nano banana官方最强Prompt模板来了!六大场景模板详解
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
暴躁的大熊4 小时前
AI助力决策:告别生活与工作中的纠结,明析抉择引领明智选择
人工智能
Gyoku Mint4 小时前
提示词工程(Prompt Engineering)的崛起——为什么“会写Prompt”成了新技能?
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·nlp
AndrewHZ4 小时前
【图像处理基石】图像在频域处理和增强时,如何避免频谱混叠?
图像处理·计算机视觉·傅里叶分析·图像增强·频域处理·摩尔纹·频谱混叠
梁小憨憨4 小时前
zotero扩容
人工智能·笔记
大数据张老师4 小时前
AI架构师的思维方式与架构设计原则
人工智能·架构师·ai架构·后端架构