HDR视频技术之八：色域映射

在之前的色调映射章节中提到：在色调映射环节，为了便于操作，且不使图像颜色产生巨大失真，色调映射算法通常会仅处理图像亮度信息，将 HDR 图像亮度映射到 SDR图像亮度域中，通过原 HDR 图像的颜色信息，恢复并重建 SDR 图像的颜色信息。由于前面的主题是色调映射，因此颜色转换相关技术没有深入介绍。但颜色转换或色域映射问题（ Color Transfer or Gamut Mapping），也是 HDR 的重要环节。本章将介绍 HDR 中颜色转换(或色域映射)技术。本章分为两个部分，第一部分介绍色域映射的定义以及相关背景知识；第二部分将介绍代表性的色域映射算法，特别对 ITU 中相关标准进行浅析。

1 色域映射概述

在日常生活中，人们会在多种场景和设备上观看图像或视频。由于显示设备的多样性，自然会引发一个问题：给定一幅图像，如何能够保证人们在这些不同的显示设备上看到的图像是一致的？更进一步，如何使得不同显示设备上看到的图像，与这幅图像的原场景是一致的？

由于不同显示设备原理、设计、颜色标准不尽相同，想要实现这一目标是非常困难的。如果希望不同的人在不同的显示设备上看到的图像一致，首先需要了解哪些原因造成不一致。原因可以大致分为三类：

不同人视觉特性不同。不同的人，对于进入眼睛的光线的响应是存在轻微的不同的，因此，即使在同一场景下观察同一图像，不同的人对于图像的感知（例如颜色，对比度，饱和度等）都是不同的。
观测场景不同。同样的图像，在不同的场景下观测，同样观测者感受也是不同。
显示方式不同。对于一幅数码相机拍摄的图像，将存储的图像文件使用不同的显示设备显示，人们观察到的图像也是不同的。

色域，来用于描述不同显示设备，或者不同标准所使用或规定的颜色范围。而在两个不同色域之间构建的映射，称为色域映射。由于视觉特性以及场景原因带来的差异难以建模并且处理，因此色域映射问题通常是指显示设备的显示方式不同产生的色域差异。一般来说，可以通过改变像素值将两个色域中均含有的颜色进行映射，以实现颜色的一致。但当两个色域范围有差别，也就是说一个色域中包含了另一个色域没有的颜色时，色域映射就比较复杂，通常的做法是选择最接近于原图像颜色的颜色，进行显示。

在 CIE(2004d) [2]标准中，给出色域映射及其相关内容的官方定义：

色域映射：一种将待显示媒介的颜色用原始图像或媒介中的颜色表示的方法
图像：一种包含了图形与形象的二维视觉刺激。重新生成的图像可以通过某些特征与原始图像进行比较。
颜色媒介：能够显示或者获取颜色的媒介物。例如 CRT 显示器，数码相机。色域：在给定的观测条件下，一个给定的颜色媒介能够显示或获取的颜色范围。

由此可以明确， 色域映射是将两种不同的色域联系起来的核心方法。色域映射的分类主要包括四大类：独立（两个色域之间没有交集），交叉（两个色域相交，但不包含），缩小（目标色域小于原色域），扩张（目标色域大于原色域），具体见图 1。其中 S 表示原色域， D 表示目标色域。

前面部分介绍了色域映射的基础，后续部分中将把注意力转向 HDR 中是如何进行色域映射的。更多关于传统色域映射的的内容与算法，可参阅文献 [1]，该书包含了关于传统色域映射（即不同显示设备之间）的丰富内容。

图 8-1 色域映射的分类[1]

2 HDR 中的色域映射标准与算法

在 HDR 技术中，色域映射的目的有所不同。传统的色域映射方法，是为了解决不同显示设备之间色域不同的问题，但是归根结底，传统显示设备的色域都在 BT.709 (ITU,1990)标准范围内。而在 HDR 中，由于 HDR 图像的亮度与颜色是与场景亮度与颜色一致的，因此理论上来说， HDR 图像显示在不同的 HDR 显示设备上时，颜色与亮度也不会存在差异，因此 HDR 的色域映射方法并不是用于解决不同显示设备的颜色不一致问题的，而是主要用于色调映射过程中的颜色处理。由于色调映射过程中， HDR 图像映射成了 SDR 图像，因此，图像的亮度与颜色都发生了较大的改变。而对于颜色来说，由于HDR 图像的色域标准遵循 BT.2020 (International Telecommunication Union, 2015)标准，而SDR 图像遵循 BT.709 标准，因此，本质上来说， HDR 中的色域映射问题，实际上就是BT.2020 色域与 BT.709 色域之间的转换问题。下面，我们将从 ITU 标准入手，介绍 HDR的色域映射标准与相关算法。

2.1 BT.709 与 BT.2020 颜色空间

在 1931 年， CIE 根据相关实验，测定了人眼能够观察到的颜色范围，由此确定了" CIE 1931 标准观察者标准"，也被称为 CIE-XYZ 表示法。而在图像与视频处理领域，显示设备所能显示的颜色，远少于自然界中的颜色范围，由于技术的限制以及显示设备的制作原理的限制，现在的显示设备无法显示出自然界中存在的所有颜色，而只能选择其中的一部分颜色进行显示。

在 HDR 技术中，通常使用的颜色标准是 ITU-R BT.2020 标准。 BT.709 是 HDTV 的标准，也是目前运用最为广泛的颜色标准。 BT.2020 是 UHDTV 的颜色标准，也是 HDR 技术所支持的颜色标准。 HDR 中的色域映射，就发生在这两个色域之间。

图 8-2 CIE-XYZ 1931

BT.709 色域

BT.709 标准中定义了 SDR 图像的编码方式。具体分为𝑅′𝐺′𝐵′和𝑌′𝐶𝑏𝐶𝑟的两种编码模式，每种模式的各通道都有 8 或 10 比特两种类型，在 8 位编码中， 𝑅′𝐺′𝐵′通道和𝑌′通道的标称范围是 16～235， Cb 和 Cr 通道的标称范围是 16～240，中性值为 128。因此，在𝑅′𝐺′𝐵′中，黑色的值是(16,16,16)，白色的值是(235,235,235)；在𝑌′𝐶𝑏𝐶𝑟中黑色的值是(16,128,128)，白色的值是(235,128,128)。标准 RGB 空间的 0 和 255 仍保留作为定时参考，可能不包含颜色数据。 BT.709 色域的范围见图 3。

BT.709 标准同时支持模拟信号与数字信号，因此在 BT.709 标准内部，存在两个重要的转换： 𝑅′𝐺′𝐵′ 编码到𝑌′𝐶𝑏𝐶𝑟 编码的转换，以及模拟信号到数字信号的转换。

𝑅′𝐺′𝐵′编码下的模拟信号到𝑌′𝐶𝑏𝐶𝑟编码下的模拟信号之间的转换为：
E y = 0.2126 E R + 0.7152 E G + 0.0722 E B E C B = − 0.2126 E R − 0.7152 E G + 0.9278 E B 1.8556 E C B = 0.7874 E R − 0.7152 E G + 0.0722 E B 1.5748 (1) E_y=0.2126E_R+0.7152E_G+0.0722E_B\\E_{CB}=\frac{-0.2126E_R-0.7152E_G+0.9278E_B}{1.8556}\\E_{CB}=\frac{0.7874E_R-0.7152E_G+0.0722E_B}{1.5748}\tag{1} Ey=0.2126ER+0.7152EG+0.0722EBECB=1.8556−0.2126ER−0.7152EG+0.9278EBECB=1.57480.7874ER−0.7152EG+0.0722EB(1)

其中𝐸𝑌, 𝐸𝐶𝐵, 𝐸𝐶𝑅分别表示亮度信号和两种色差信号， 𝐸𝑅, 𝐸𝐺, 𝐸𝐵分别表示𝑅′, 𝐺′, 𝐵′三个通道的模拟信号值。

两种编码方式的数字图像的量化方法是：
D R , G , B = I N T [ ( 219 E R , G , B + 16 ) ⋅ 2 n − 8 ] D Y = I N T [ ( 219 E Y + 16 ) ⋅ 2 n − 8 ] D C B = I N T [ ( 224 E C B + 128 ) ⋅ 2 n − 8 ] D C R = I N T [ ( 224 E C R + 128 ) ⋅ 2 n − 8 ] (2) D_{R,G,B}=INT[(219E_{R,G,B}+16)\cdot 2^{n-8}]\\ D_{Y}=INT[(219E_{Y}+16)\cdot 2^{n-8}]\\ D_{CB}=INT[(224E_{CB}+128)\cdot 2^{n-8}]\\ D_{CR}=INT[(224E_{CR}+128)\cdot 2^{n-8}]\tag{2} DR,G,B=INT[(219ER,G,B+16)⋅2n−8]DY=INT[(219EY+16)⋅2n−8]DCB=INT[(224ECB+128)⋅2n−8]DCR=INT[(224ECR+128)⋅2n−8](2)

其中 n 表示量化信号的比特长度， INT 作为将小数化整的四舍五入功能。因此可以得出𝑅′𝐺′𝐵′编码下的数字信号到𝑌′𝐶𝑏𝐶𝑟编码下的数字信号之间的转换方法：
D Y = I N T [ 0.2123 D R + 0.7152 D G + 0.0722 D B ] D C B = I N T [ ( − 0.2123 1.8556 D R − 0.7152 1.8556 D G + 0.9278 1.8556 D B ) ⋅ 224 219 + 2 n − 1 ] D C B = I N T [ ( 0.7874 1.5748 D R − 0.7152 1.5748 D G − 0.0722 1.5748 D B ) ⋅ 224 219 + 2 n − 1 ] (3) D_Y=INT[0.2123D_R+0.7152D_G+0.0722D_B]\\ D_{CB}=INT\Big[\Big(-\frac{0.2123}{1.8556}D_R-\frac{0.7152}{1.8556}D_G+\frac{0.9278}{1.8556}D_B\Big)\cdot\frac{224}{219}+2^{n-1}\Big]\\ D_{CB}=INT\Big[\Big(\frac{0.7874}{1.5748}D_R-\frac{0.7152}{1.5748}D_G-\frac{0.0722}{1.5748}D_B\Big)\cdot\frac{224}{219}+2^{n-1}\Big]\tag{3} DY=INT[0.2123DR+0.7152DG+0.0722DB]DCB=INT[(−1.85560.2123DR−1.85560.7152DG+1.85560.9278DB)⋅219224+2n−1]DCB=INT[(1.57480.7874DR−1.57480.7152DG−1.57480.0722DB)⋅219224+2n−1](3)

BT.2020 色域

ITU-R BT.2020 定义了 UHDTV 的各个方面，比如显示分辨率、帧速率、色度子采样、比特深度和色彩空间，它是由 ITU 在 2012 年发布的。相比于 BT.709， BT.2020 提供了更加广泛的颜色范围， BT.2020 也是 HDR 技术的颜色空间。

BT.2020 标准的重要性是毋庸置疑的，正如 BT.709 对于高清视频传输与高清显示设备制造方面起到的引导性作用， BT.2020 标准同样也深刻地影响着消费领域超高清显示设备的设计与制造，例如目前绝大部分的 4K 平板电视的物理分辨率都是采用 BT.2020 标准的 3840× 2160，但 BT.2020 标准绝不仅仅在分辨率方面有所提升，在色彩和刷新频率和信号格式与分析等方面也进行了相关的规定。本文仅关注 BT.2020 标准中关于颜色空间的定义。

相对于 BT.709 标准， BT.2020 标准大幅度提升了视频信号的性能规范，色彩深度方面提高至 10bit 或 12bit，很大程度上增强了整个影像的色彩层次，色域的广度也大大增强，两种标准的色域范围对比如图 3 所示。

图 8-3： BT.709 与 BT.2020 对比

与 BT.709 一致， BT. 2020 也支持了𝑅′𝐺′𝐵′和𝑌′𝐶𝑏𝐶𝑟两种编码模式，以及支持模拟与数字两种信号。同样的， BT.2020 标准内部也存在两个重要的转换：两种编码模式之间的转换以及模拟信号到数字信号的转换。

𝑅′𝐺′𝐵′编码下的模拟信号到𝑌′𝐶𝑏𝐶𝑟编码下的模拟信号之间的转换：
E Y = 0.2126 E R + 0.6780 E G + 0.0593 E B E C B = − 0.2627 E R − 0.6780 E G + 0.9407 E B 1.8556 E C B = 0.7373 E R − 0.6780 E G + 0.0593 E B 1.4746 (4) E_Y=0.2126E_R+0.6780E_G+0.0593E_B\\E_{CB}=\frac{-0.2627E_R-0.6780E_G+0.9407E_B}{1.8556}\\E_{CB}=\frac{0.7373E_R-0.6780E_G+0.0593E_B}{1.4746}\tag{4} EY=0.2126ER+0.6780EG+0.0593EBECB=1.8556−0.2627ER−0.6780EG+0.9407EBECB=1.47460.7373ER−0.6780EG+0.0593EB(4)

𝑅′𝐺′𝐵′编码下的数字信号到𝑌′𝐶𝑏𝐶𝑟编码下的数字信号之间的转换：
D Y = I N T [ 0.2627 D R + 0.6780 D G + 0.0593 D B ] D C B = I N T [ ( − 0.2627 1.8814 D R − 0.6780 1.8814 D G + 0.9407 1.8814 D B ) ⋅ 224 219 + 2 n − 1 ] D C B = I N T [ ( 0.7373 1.4746 D R − 0.6780 1.4746 D G − 0.0593 1.4746 D B ) ⋅ 224 219 + 2 n − 1 ] (5) D_Y=INT[0.2627D_R+0.6780D_G+0.0593D_B]\\ D_{CB}=INT\Big[\Big(-\frac{0.2627}{1.8814}D_R-\frac{0.6780}{1.8814}D_G+\frac{0.9407}{1.8814}D_B\Big)\cdot\frac{224}{219}+2^{n-1}\Big]\\ D_{CB}=INT\Big[\Big(\frac{0.7373}{1.4746}D_R-\frac{0.6780}{1.4746}D_G-\frac{0.0593}{1.4746}D_B\Big)\cdot\frac{224}{219}+2^{n-1}\Big]\tag{5} DY=INT[0.2627DR+0.6780DG+0.0593DB]DCB=INT[(−1.88140.2627DR−1.88140.6780DG+1.88140.9407DB)⋅219224+2n−1]DCB=INT[(1.47460.7373DR−1.47460.6780DG−1.47460.0593DB)⋅219224+2n−1](5)

BT.2020 色域到 BT.709 色域的转换

HDR 中的色域转换问题，特别是色调映射之后的色域映射，主要是 ITU-R BT.2020色域到 ITU-R BT.709 色域的颜色转换。理想情况下转换应该满足以下要求： 1. BT.709色域内的颜色应该保持不变； 2. 转换方法适用于 BT.2020 和 BT.709 之间的多次转换；3. 能够感知到的色调变化必须尽可能小； 4. 空间细节没有重大损失； 5. 不会在颜色上引入可见的不连续性； 6. 映射方法在数学上是可定义的。

需要注意的是，没有可以同时满足上述这些要求的通用色域映射方法。在从更广泛的色域转换到更小的色域时， BT.709 色域外的颜色出现改变是不可避免的。不同的转换方式会在不同要求之间进行妥协，具体的做法可能因应用场景而异。下面介绍一种ITU-R BT.2407 [5]标准中介绍的基于线性矩阵的从 BT.2020 到 BT.709 的简单变换。

图 8-4 基于线性矩阵变换从 BT.2020 到 BT.709 的颜色转换

ITU-R BT.2407 中的简单色域映射方式

图 4 是从 BT.2020 到 BT.709 的基于线性矩阵变换的颜色转换的框图。除了输出信号被严格限制之外，这是 ITU-R BT.2087 [6]标准中对从 BT.709 转换到 BT.2020 所规定的操作的逆操作。这种方法在条件限制的情况下是最直接简单的。

这种方法首先使用 ITU-R BT.2087 中规定的两个非线性到线性的传递函数（一种是电光转换功能函数（ EOTF），一种是逆光电转移函数（ OETF））之一将归一化的非线性RGB 信号转换为归一化的线性 RGB 信号。接着通过矩阵运算，将 BT.2020 颜色空间的RGB 信号转换到 BT.709 颜色空间的 RGB 信号。最后再通过使用 ITU-R BT.2087 建议书规定的两种线非线性传递函数（一种是逆 EOTF 方法，另一种是使用 OETF）之一将线性RGB 信号转换为非线性 RGB 信号。从归一化线性 RGB 信号（ EREGEB）到归一化非线性 RGB信号（ E′RE′GE′ B）的转换。

该方法具有非常理想的特性，即使在 BT.2020 和 BT.709 之间进行多次转换之后，它也不会改变 BT.709 色域内的颜色。然而， BT.709 色域之外的色彩是硬限幅的，即小于零或大于 1 的 RGB 信号（ EREGEB）会被限幅为零或 1，这会导致明显的色调偏移和空间细节的损失。虽然大多数内容看起来都很好，但色调和空间细节方面还是会有所损失。

ITU-R BT.2407 中规定的色域映射算法原则

为了提升简单色域映射算法的结果， BT.2407 提供了一套色域映射算法的设计流程与设计原则。图 5 显示了从 BT.2020 色域到 BT.709 色域的算法抽象框图。首先，选定一个映射颜色空间，然后在算法的第一步，将输入的符合 BT.2020 标准的 RGB 表示的图像转换为映射颜色空间的形式。接着，使用色域映射算法，将映射颜色空间表示的颜色转换到 BT.709 色域内。最后，再将颜色空间转换为 RGB 表示。到此，色域映射流程结束。

图 8-5 BT.2020 色域到 BT.709 色域转换算法流程图

其中，映射颜色空间的选取是算法的一个重要方面，可供选择的映射颜色空间包括：

CIE xyY
CIE u'v'Y
CIE 𝐿∗𝑎∗𝑏∗
简化版 Lab
基于 CIECAM02 的 Uniform Color Space

BT.2020 色域与 BT.709 色域的 RGB 值(𝐸𝑅, 𝐸𝐺, 𝐸𝐵)可以通过线性转换与投影，转换到到 CIE xyY 以及 CIE u'v'Y 的颜色空间中。 CIE xyY 表示法中的 xy 平面代表传统的色度（ Chromaticity）， CIE u'v'Y 表示法中的 u'v' 平面也表示色度，但是当 Y一定时，相对于 xy 平面来说， u'v' 表示法下的色度更加的一致（ Uniform）。

当使用 CIE xyY 以及 CIE u'v'Y 作为映射颜色空间时，可以通过线性变换来简化色域映射算法。但是，需要注意的是，简化后的某条映射路径（即从 BT.2020 色域的某一个颜色映射到 BT.709 色域的某一个颜色）是直线时，颜色的色度，色相和明度会同时出现改变。

CIE 𝐿∗𝑎∗𝑏∗颜色空间相对于 CIE xyY 以及 CIE u'v'Y 颜色空间说，提供了更加优秀的视觉统一性。而简化版 Lab 是 CIE 𝐿∗𝑎∗𝑏∗的简化版。但是将 BT.2020 与 BT.709 的RGB 值转换到这两种表示法时，相对于 CIE xyY 以及 CIE u'v'Y 表示法来说，需要使用更加复杂与非线性的操作。这两种颜色空间的优势在于由于将明度纳入了表示法的设计当中，因此他们在感知上提供了更好的一致性。当使用这两种表示法时，线性映射路径能够保留色度，色相以及明度中的一个或两个属性。通过这些映射路径， BT.2020 的颜色就能够映射为 BT.709 的颜色。这种颜色的修改过程会使用到线性或非线性的方程。

在从 BT.2020 到 BT.709 的转换过程中，一些色域映射算法将 BT.709 色域内的颜色完全保留，不加改变，所做的颜色映射只针对那些在 BT.709 之外， BT.2020 之内的颜色。但是另外一下算法对 BT.709 内部的颜色也作了一些改变，特别是对处于 BT， 709色域边缘的颜色。而当颜色在 BT.709 色域与 BT.2020 色域之间不断循环转换时，这种对 BT.709 色域内部颜色也做出改变的算法就会产生非常严重的人工痕迹。

从上述内容可以发现， BT.2407 标准提供了一种简单的色域映射的算法，同时，也给出了一套设计流程。不同的设计者可以通过选择不同的色域表示法，设计不同的色域映射算法，来实现 BT.2020 色域与 BT.709 色域之间的转换。

ITU-R BT.2407 中的其他色域映射方法

BT.2407 中提供了 6 种较新的，效果更好的色域映射方法，本文中只给出这些色域映射方法的算法流程图或算法思路以供参考。算法的具体实现方法以及具体细节，可以参见 [5]。
算法 1

这种算法在三个步骤中，分别对源 HDR 图像的色相，亮度与色度进行映射。算法框图如下：

图 8-6 算法 1 框图

算法 2

这种算法对图像的色相，亮度与色度同时进行映射。同时，在使用算法时，需要将图像使用 CIECAM02 表示法进行表示。
算法 3

算法 3 可以看做算法 1 的简化版本。它的算法流程图与图 6 中算法 1 的流程图一致，两者的区别是算法 3 在 CIE LAB 颜色空间中进行，同时利用简单的线性化操作来简化计算量，从而实现运算效率的加强。
算法 4

算法 4 提供了一种自适应的色域映射算法，这种算法的目的是尽可能保留原图的整体感知。具体流程图见图 4.

图 8-7 算法 4 流程图

算法 5

算法 5 是一种保留亮度信息的色域转换。通过改变图像的颜色空间，将图像的色度信息与亮度信息分开，从而仅仅处理图像的色度信息
算法 6

算法 6 的设计思路是在考虑显示设备色域的基础上，实现 BT.2020 空间中的颜色到BT.709 空间中的颜色的比色法转换

BT. 709 色域到 ITU-R BT. 2020 色域的转换

HDR 色域转换的另外一个角度就是从 BT.709 色域到 BT.2020 色域的转换。在将 SDR内容适配到 HDR 显示设备上播放的过程中，通常需要将 BT.709 色域中的颜色转换到BT.2020 色域中。

BT.709 到 BT.2020 的转换有一个重要的限制，即 BT.709 标准下的颜色，在 BT.2020标准下要是同样的颜色。换句话说，如果这个颜色是两种色域中都存在的，那么这个颜色在转换过程中应当保持不变；而如果这个颜色是 BT.2020 中独有的，这就需要进行颜色转换。 BT.709 到 BT.2020 的转换可以大致分为三个主要步骤：第一个步骤是逆量化，得到 BT.709 标准下的模拟信号值𝐸𝑅, 𝐸𝐺 , 𝐸𝐵。第二个是色域转换，将 BT.709 下的模拟信号值，转换为 BT.2020 标准下的模拟信号值。最后一个步骤是量化，得到 BT.2020 标准下的数字信号。选择在模拟信号域进行色域转换而不是直接在数字信号域进行色域转换的原因是为了保留更多的信息与细节。由于量化过程会存在信息的丢弃，并且 BT.709的色域比 BT.2020 小，如果直接用数字信号进行转换，会使得 BT.2020 色域下的图像效果变差。因此，通过逆量化过程，恢复图像的相关细节，然后进行模拟信号的色域转换，就可以解决这个问题。

BT.709 色域到 BT.2020 色域的转换标准遵循 BT.2087 标准 [6]。标准中根据信号源的亮度是否恒定，将转换方式分为以下两种：

非恒定亮度信号的转换

图 8-8. BT.709 到 BT.2020 在非恒定亮度信号格式下的转换过程

上图是非恒定亮度信号的转换流程图。由于 BT.709 与 BT.2020 均支持两种编码方式： 𝑅′𝐺′𝐵′和𝑌′𝐶𝑏𝐶𝑟，因此逆量化过程的输入与量化过程的输出均有两条路径。根据需求的不同，可以选择不同的输入输出模式。

每一个区块的具体实现过程以及相关函数定义，可以参考 [6]。

恒定亮度信号转换

图 8-9. BT.709 到 BT.2020 在恒定亮度信号格式下的转换过程

上图是恒定亮度信号的转换流程图。由于 BT.709 与 BT.2020 均支持两种编码方式：𝑅′𝐺′𝐵′和𝑌′𝐶𝑏𝐶𝑟，因此逆量化过程的输入与量化过程的输出均有两条路径。根据需求的不同，可以选择不同的输入输出模式。