信息隐藏与数字水印

信息隐藏

定义

信息隐藏是集多学科理论与技术于一身的新兴技术,它利用人类感觉器官对数字信号的感觉冗余和图象、语音等信源的数字冗余特性,将一个消息(称为待隐消息或秘密消息)隐藏在另一个消息(称为遮掩消息或载体)中进行传递,使观察者和监视系统无法觉察到信息的存在,以实现版权保护、隐蔽通信等功能。

基本特征

不易察觉性(透明性):密码信息的嵌入不改变原数字载体的主观质量和统计规律,不易被察觉

鲁棒性:嵌入方法又一定的秘密性,具有对非法检测和非法解密等对抗能力

隐藏容量:满足不易察觉性的前提下,数字载体中可以隐藏秘密信息的最大比特数

信息隐藏技术模型

分类

根据载体分:图像、视频、音频、文本、软件、通信协议

按密钥分:对称、公钥隐藏算法

按嵌入域分:空域隐写、变换域隐写

按保护对象分:隐写术(不被检测,大容量)、数字水印(鲁棒性、不可感知性)

应用

数据保密

数据的不可抵赖性

数字作品的版权保护

防伪

囚犯模型

隐写系统的安全性

把载体对象误认为隐密载体称之为虚警

把隐密载体误认为载体对象称之为漏检

隐写方法

空域隐写方法

LSB替换隐写

用欲嵌入的秘密信息取代载体图像的LSB,原来图像的7个高位平面与代表秘密信息的LSB平面组成隐密图像

嵌入位置:连续/随机间隔法

MLSB替换隐写

用秘密信息替换载体图像像素的最低多位(MLSB)

±K隐写

当秘密信息与像素值的LSB不同时,对像素值进行随机加或减1操作,此时称为LSB 匹配(或±1 )隐写。将加减幅度推广至正整数K,可得到±K隐写:当K等于奇数时,使像素值的LSB等于秘密信息;当K等于偶数时总是使像素值的次低比特位等于秘密信息。

变换域隐写

DCT域隐写方法(matlab实现)

离散余弦变换(Discrete Cosine Transform,DCT)是一种实数域变换,其变换核为实数余弦函数。对一幅图像进行离散余弦变换后,许多有关图像的重要可视信息都集中在DCT变换的一小部分系数中。因此,离散余弦变换(DCT)是有损图像压缩JPEG的核心,同时也是所谓"变换域信息隐藏算法"的主要"变换域(DCT域)"之一。因为图像处理运用二维离散余弦变换,所以直接介绍二维DCT变换

JSteg

用秘密信息比特直接替换JPEG图像中量化后DCT系数的最低比特位,但若量化后DCT系数为0或者1,则不进行处理。

F3隐写

Ø信息嵌入时,若DCT系数的LSB与要嵌入的秘密信息比特相同,则不做改动;否则,将该DCT系数的绝对值减1;

Ø秘密信息嵌入在非0的DCT系数上,为0的系数不嵌入信息。当在绝对值为1的系数上嵌入比特0时,会产生新的0系数,则此次嵌入无效,在下一个系数中重新嵌入。

隐写分析

是否隐写、隐写量是多少、提取隐写信息

无载体隐写

概念:无需其他载体,以隐藏信息为驱动直接生成/获取含密对象

主要优势:与网络中的政策不含密多媒体数据、行为不可区分

隐写分析方法

感官分析

优点:直接、简单

弱点:自动化程度弱、可靠性弱

特征分析

基于文件结构的隐写特征:文件大小、颜色等

软件特征

统计分析

卡方、RS检测、JPEG检测

通用分析

自然信号与其去噪信号的"距离",隐写信号与其去噪信号的"距离",两者不同

两个步骤:

特征量提取:常用方差分析来选取特征量

分类问题:通常使用支持向量机(线性和非线性)

找阈值,与阈值对比,可能会虚警或漏警

隐写方法对比

内容认证

水印解决方案特点

不需要额外的数据存储认证信息

传输过程中,水印经受与载体相同的处理

完全内容认证

概念:用于验证作品是否一点没变

用途:医学图像、法庭证物

方法:

脆弱水印:算法设计,作品仅被微小改变,水印也会消失

使用LSB将水印嵌入作品

传输过程若有噪声、滤波、压缩编码等环节,水印将会消失

特点:水印与载体无关

安全问题:可以搜集多幅水印图像,拼凑出篡改图像或者修改非水印区域通过认证

嵌入签名:用密码技术产生的签名作为水印嵌入到载体中

方法:P.W.Wong水印系统

基于公钥的图像认证和完整性数字水印系统

利用哈希函数的单向性和"雪崩效应"定位篡改

借助公钥系统的便利性,公钥的用户完成对图像的完整性检测和身份认证

P.W.Wong水印算法流程

项目 本方案(认证型水印) LSB 脆弱水印
水印内容 图像特征 + 加密/签名信息 原始比特或简单校验
认证方式 哈希/签名验证 位级一致性检测
安全性 高(密码学保障) 低(易伪造)
攻击抵抗 抗拷贝、抗伪造 易被重嵌水印攻击

选择认证系统

预定义引入合法失真的处理集,和引入非法失真的处理集,当作品经受前者而没有后者处理时,可以通过系统认证

基本方法

半脆弱水印:遭遇合法处理时,水印可以生存。遭遇非法处理,水印消失

半脆弱签名:以不受合法处理影响,但遭受非法处理时回发生改变的载体的特征为水印嵌入,水印算法可选稳健算法或半脆弱算法

Telltale水印:用于研究载体经受哪些操作。通过研究水印的变换,推断载体经受哪些操作,最终判断是否能通过认证

半脆弱水印

与JPEG 相结合的半脆弱数字水印算法:

这类水印认证算法一般是根据JPEG编、解码器的特点而设计的,故水印算法通常对JPEG压缩具有较好的鲁棒性,而对其他的图像操作反应敏感

鲁棒水印算法演变而来的半脆弱水印算法:

该类算法主要是借鉴鲁棒图像水印算法的一些经典方法(如扩频水印)来设计相应的认证算法

基于视觉掩蔽模型的半脆弱水印算法:

将人眼视觉掩蔽模型应用于数字水印系统,会使嵌入水印后的图像具有更好的主观视觉质量

基于小波域的半脆弱水印算法:

由于小波变换是一种空间---频率分析方法,能同时反映图像的空间位置和频率

小波变化的局部化作用能够检测到图像被篡改的区域

小波变化的频率域则反映了被篡改的尺度(频带)

音频信息隐藏技术

音频信号特点

一维信号

人耳听觉系统(HAS)比人眼视觉系统(HVS)灵敏得多

对音频信息隐藏技术的要求

透明性

鲁棒性

同步要求

盲检测

时间域音频算法

最低有效位方法

LSB:去掉低2比特位的语音信号(声音信号听不出差别)

去掉低4比特位的语音信号(声音信号听不出差别)

​​​​​​​ ​​​​​​​ 去掉低6比特位的语音信号(声音中有极少的背景噪音,不易被察觉)

​​​​​​​ ​​​​​​​ 去掉低8比特位的语音信号(声音中有较明显的背景噪音)

​​​​​​​ ​​​​​​​ 去掉低10比特位的语音信号(声音中有很强的噪音,但话音仍较清晰)

数字化音频中,低有效比特对音质贡献弱。

改变低有效比特不会显著影响音质。

LSB:透明度高、容量大、鲁棒性差

回声隐藏

掩蔽效应:强信号的存在会使其附近的弱信号难以被感知。

当回声与原声的间隔充分接近时,人耳难以区别回声和原声。可以人为添加不同延迟的回声

隐藏方法:回声延迟为1毫秒代表比特"1",回声延迟为2毫秒代表比特"0",这样,要隐藏0,那么我们在原声上添加延迟为2毫秒的回声。

变换域音频水印

傅里叶变换(FFT)

DCT变换

小波变换

方法 表示的是什么 本质含义
FFT 整帧频谱 只知道"有哪些频率"
DCT 能量排序的频率分量 知道"哪些频率重要"
小波 时间 × 频率 知道"什么时候出现什么频率"
攻击 FFT DCT 小波
MP3 压缩 ✔✔ ✔✔✔
剪切
滤波 ✔✔ ✔✔
重采样 ✔✔

数字图像取证

篡改事件

政治风波、新闻失实、恐怖分子秘密通信、金融诈骗、科学欺骗、个人名誉损失

数字图像取证技术

通过对图像统计特性的分析来判断数字图像内容的真实性、完整性和原始性,也就是判断数字图像从被数码相机拍摄以后有没有经过篡改的技术

主动取证

提前向原始数字照片中嵌入验证信息实现的,属于主动取证

被动取证

主动取证技术由于受到应用条件的限制,已经无法从根本上遏制图像篡改发展,现在数字图像取证更注重被动取证技术研究

取证分类:

基于数字水印得图像认证:

在被保护的图像中预先嵌入脆弱水印,篡改图像将破坏水印而暴露篡改行为

基于数字签名的图像认证:

利用图像内容得到长度很短的认证码、数字签名或视觉摘要(Visual Hash)。属于半主动方法,虽然没有改动图像,但需预先产生辅助数据

认证码与数字签名:对任何改动都很敏感

视觉摘要(感知hash):仅对恶意篡改比较敏感,对压缩、滤波等合法处理不敏感

完全被动认证:

这类方法既不需要事先在图像中嵌入水印,也不依赖辅助数据,仅根据待认证的图像本身判断其是否经过篡改、合成、润饰等伪造处理

数字图像篡改

真实性篡改:合成、变种、润饰、增强、生成、绘画

完整性篡改

原始性篡改

版权篡改

数字图像盲取证

不依赖任何预签名提取或预嵌入信息的前提下,对图像的真伪和来源进行鉴别和取证

分类

图像内容真实性鉴别(也称为防伪检测): 判断数字图像在最初获取之后是否遭受了任何形式的修改或处理

图像来源鉴别:判断生成图像的获取设备。这一类技术将图像与一系列具有共同特性的像源联系起来,以便于将图像匹配给某一类型的来源设备

图像隐密分析取证:针对图像的完整性篡改(隐写术)进行取证本是信息安全技术的一个分支

图像篡改检测

复制粘贴检测:同一幅/不同图像的复制粘贴,光照方向不一致,边界不连续

遍历搜寻法:首先将图像分块,把每一图像块当成一个模板,遍历图像剩余部分,看是否存在跟模板完全一样的图像块,若存在,则增大图像块的大小,重新搜索,直到搜索不到完全相同的图像块为止

优点:理论简单,精确度高

缺点:运算量太大,对自然图像噪声的鲁棒性不好

图像块自相关矩阵法:根据两个复制粘贴的图像块完全相同而具有很强的自相关性的原理进行搜寻。首先设定自相关判别阈值,再遍历搜寻所有图像块,如果搜寻到超过设定阈值的两个图像块,则认为这两个图像块中的一块是另一块的复制粘贴块

优点:运算量相对遍历搜寻法小

缺点:只能检测出较大复制-粘贴图像块(很多文献提出约为原图1/4大小的图像块)

图像块匹配法:首先将图像分成若干图像块,每一个图像块用一个矩阵表示,比较所有图像块矩阵,找出相同的图像块。分为精确匹配和模糊匹配两种

运算量比前面两种都小

重采样、模糊润饰操作检测:经重采样后篡改图像块的像素与其周围像素之间会产生周期性的线性关系。模糊操作的基本原理是对图像的局部邻近像素值进行邻域灰度平均,其目的是为了将图像伪造所造成的拼接边缘淡化甚至消除。

单次JPEG压缩后图像的DCT系数的直方图呈现类高斯分布,而双重JPEG压缩后,其DCT系数的某些值就会周期性的减少或消失,而且这些DCT系数值消失的规律与质量因子有关。

多次压缩后DCT系数分布图中DCT系数的1,3,5,7等奇数位置上的系数为零或者出现多峰

JPEG重压缩检测:由于双重JPEG压缩对图像数据进行了两次量化,引入了一些单次JPEG压缩所没有的特征。若原始图像是JPEG格式,修改后仍旧保存为JPEG格式,则图像就经过了双重JPEG压缩,这是一种不可逆的有损压缩过程

图像来源认证

在不明图像来源的情况下,单从数字图像本身来判别它的生成设备(如数码相机、扫描仪、计算机)

为确保和鉴定数字图像内容的真实性以及来源的可靠性,对数码照片、计算机生成图像以及扫描图像的分类识别成为数字图像取证中需要研究的重要技术

两类

数码照片、计算机生成图、扫描图像的分类识别

不同品牌、不同类型的数码相机生成照片的分类识别

图像隐密分析检测

这幅图像是完整的吗?是否被嵌入了看不见的秘密信息?

数字水印

应用

广播监控、版权保护、盗版追踪、内容认证、拷贝控制、设备控制、标注

数字水印系统三要素

数字水印

水印嵌入算法

水印检测算法

构成方式

有意义的水印:文本+图片信息

无意义水印:伪随机序列、随机噪声等

水印算法性能指标

安全性:抵抗恶意攻击的能力(非授权嵌入、提取、去除)

稳健性:鲁棒性、健壮性(滤波、去噪、格式转换、重采样、有损压缩等)

透明性:不可感知性

容量:容量大小

计算量:计算成本

分类

载体分:图像水印、视频水印、音频水印、软件水印、文档水印

透明性分:不可见水印、可见水印

嵌入方式分:空间域水印、变换域水印

检测方法分:(非)盲水印、(私)公钥水印

稳健性分:健壮性、脆弱性(完全/半)

性能评价

容量

可感知性

健壮性

鲁棒水印

增强鲁棒性通常会牺牲其他性能,例如计算开销增大,容量降低,透明性下降,甚至牺牲对于其他操作的稳健性。

因此,通常不会在一个算法中抵抗所有处理。

例如:用于监测广告的水印需要抵抗广播过程中的信号处理,包括数模转换,有损压缩等等,但这个过程不会出现旋转或半色调处理。