图像色彩迁移技术算法及基本原理

算法设计

去相关的色彩空间

为什么不用 RGB

在论文中指出了RGB空间的缺陷:

各个颜色通道之间存在极强的相关性 ,意味着如果我们在 RGB 空间中修改某一个通道,会引起其他通道的不自然变化,必须同步修改所有通道,这让色彩迁移变得非常复杂,否则会产生严重的色彩失真或伪影

引入 lαβl\alpha\betalαβ 去相关色彩空间

所以需要引入一个新的色彩空间lαβl\alpha\betalαβ

在这个空间里,三个轴(亮度 lll、黄蓝 α\alphaα、红绿 β\betaβ)几乎没有相关性(Decorrelated),这意味着我们可以独立地对这三个通道进行加减乘除的数学操作,而不用担心它们互相干扰

统计特征迁移

这个新引入的lαβl\alpha\betalαβ空间通道为正交且去相关 的,可以独立对每个通道应用非常简单的线性统计变换,不用担心产生跨通道的伪影

算法只需计算两张图像在 lll、α\alphaα、β\betaβ 三个通道上的均值(μ\muμ)和标准差(σ\sigmaσ)

对数特征

空间转换中使用了对数,意味着通道强度的均匀变化在人类视觉上有相等的感知度

核心迁移公式

对于通道 c∈{l,α,β}c \in \{l, \alpha, \beta\}c∈{l,α,β},假设目标图像(要被修改的图像)的数据点为 xtx_txt,源图像(提供色彩的图像)的数据点为 xsx_sxs:xnew=σsσt(xt−μt)+μsx_{new} = \frac{\sigma_{s}}{\sigma_{t}} (x_t - \mu_{t}) + \mu_{s}xnew=σtσs(xt−μt)+μs该公式先将目标图像的数据减去自身的均值 ,然后乘以源图像与目标图像标准差的比值进行缩放 ,最后加上源图像的均值 。经过这一步,新图像的像素分布就会具有与源图像相同的一阶和二阶统计矩

算法步骤

正向转换 (RGB →\rightarrow→ lαβl\alpha\betalαβ)

以下为从 RGB 到 LMS 空间的转换矩阵

由于自然场景的数据存在很大的偏度,做对数化处理转换为对数空间

通过矩阵乘法,将对数 LMS 空间最终转换到lαβl\alpha\betalαβ空间

使用主成分分析 (PCA)推导出的一个特定正交变换矩阵(等式6),将数据投影到 lαβl\alpha\betalαβ 轴上

核心色彩迁移(统计量匹配)

算法的目标是让目标图像在 lαβl\alpha\betalαβ 空间中的数据点分布特性,变得和源图像一样 。它只用到了两个基础统计量:均值(mean)和标准差(standard deviation)

这两个等式分别进行了"中心化"和"方差缩放",最后再加上原图像的均值

逆向转换 (lαβl\alpha\betalαβ →\rightarrow→ RGB)

处理完数据之后,将数据还原为屏幕能够显示的格式

先从 lαβl\alpha\betalαβ 乘矩阵回到对数 LMS 空间

然后从线性 LMS 回到最终的 RGB 空间

这是一个完全可逆 的过程。

首先用等式(8)的逆矩阵把修改后的 lαβl\alpha\betalαβ 值换算回对数 LMS 值

然后,作者提到需要将像素值设为 10 的次幂来还原到线性空间

最后,使用等式(9)的矩阵将数据最终变回常用的 RGB 格式

相关推荐
BothSavage3 小时前
Trae远程开发中DeepSeek自定义模型4054错误的排查与修复
算法
小林ixn4 小时前
从暴力到KMP:一道题彻底搞懂字符串匹配的前世今生
算法
烬羽5 小时前
字符串算法入门:从反转字符串到回文判断,面试不再慌
算法·面试
先吃饱再说21 小时前
判断回文字符串,从一行代码到双指针优化
算法
黄敬峰1 天前
深入理解算法核心:从递归思想、数组扁平化到快速排序
算法
得物技术1 天前
从狂野代码到按目标生产:得物推荐 AI Harness 的工程化实践|AICon 演讲整理
人工智能·算法·架构
AI小老六1 天前
SkillOpt 架构拆解:把 Skill 文本当参数,用执行轨迹训练 Agent
后端·算法·ai编程
胡萝卜术1 天前
从“分数打架”到“排名投票”:为什么你的ChatBI必须用RRF?
算法·设计模式·面试
Asize1 天前
初识DFS 与 BFS:递归、队列与图遍历
算法