GPU PRO 5 - 1.2 Reducing Texture Memory Usage by 2-Channel Color Encoding 笔记

本笔记仅为个人的理解,如果有误欢迎指出。

Reducing Texture Memory Usageby 2-Channel Color Encoding

使用双通道颜色编码改善纹理内存

一般纹理上一个像素的颜色信息是存在RGB三个通道里,本篇文章将纹理通过一些前置条件把三个通道的信息有损压缩到两个通道上。

RGB颜色空间可以表示为一个三维表示的立方体,一张纹理的所有颜色都分布在这个立方体之内,但是普通的纹理他所有像素在这个立方体中存在一定的空间关联性,具体来说在三维空间中可以找到一个平面,他与这张纹理的所有像素点都相对较近。这个技术的实现的核心就是如何找到这个平面,并将这个平面用一个维度去表示。

文章将RGB颜色信息拆成了两个部分,一个是亮度信息,一个是色调/饱和度信息。这两个信息被两个通道所存储,通过这两个通道的信息最终得到一个在该平面上的颜色。

首先是如何计算出这个颜色平面。

第一步:将原始的RGB信息通过权重计算转换到一个新的RGB值。

这一步主要是为了调整各颜色在最终颜色平面的的影响,在文章中权重RGB的权重选择了1/2,1/4,1/2。γ表示从输入颜色空间转换到线性空间的 gamma 值

第二步:计算转换后的RGB到颜色平面的误差。

因为规定了平面是经过原点(0,0,0),所以颜色平面可以用一个法向量表示。转换后的点到平面的距离可以表示为点到法向量的点积

所以在这一步的目标是找到一个法向量使得各RGB点到该法向量的距离平方和最小,也就是:

而法向量如何选择文章中并没有给出详细说明,文章中说穷举候选法向量的方式来比较每个法向量的err,再选出误差最小的那个。但具体候选的法向量怎么来的:

第三步:将第一步的权重转换转换回来,这里直接用一个逆转置矩阵进行变换。

这个颜色平面在RGB颜色空间中与边界交叉可以获得几个顶点,一个顶点是(0,0,0),与顶点相邻的两个顶点(bc1,bc2)则定义为该颜色平面的基色。也就是平面的两个基向量。

平面上的所有颜色都位于原点和这两个基色点所构成的夹角范围内,而夹角则是最后所需要存储的数据。

夹角计算步骤如下:

1,将线RGB空间中的颜色点投影到该颜色平面上。

2,计算该点在平面上的二维坐标。

3,找到一条从原点开始经过该点的二维直线。

4,计算这条直线与两个基色之间的二维线段的交点比例,即得到基色的混合系数。

这个步骤将夹角映射到bc1 到 bc2 的线段上,用线段的比例表示这个夹角。

两个通道,一个通道存储基色的混合系数,表示色调。另一个通道存储亮度。

亮度由一个固定的公式从RGB信息计算得到:

颜色还原代码如下:


文章主要的思想其实还是如何用一个颜色平面拟合一张在RGB空间下的纹理,这个平面才是能够双通道存储的核心,这里用的是最小二乘法进行的拟合。

而每个颜色在映射到平面上后,已经可以用一个二维坐标表示,这个时候其实已经是实现了双通道存储数据的基础。但文章将xy坐标这个二维信息转换为了亮度和色调这两个信息,这应该是为了抽出亮度这个信息,方便在实际应用中调整图片效果。毕竟调整通道中xy的值会导致颜色失准,而调整亮度值并不会。

文章中的压缩示例:

参考链接:

[GPU Pro5] 渲染篇

相关推荐
IT19952 小时前
Docker笔记-对docker-compose.yml基本认识
笔记·docker·容器
猹叉叉(学习版)2 小时前
【系统分析师_知识点整理】 1.计算机系统
笔记·软考·系统分析师
CryptoPP3 小时前
开发者指南:构建实时期货黄金数据监控系统
大数据·数据结构·笔记·金融·区块链
天理小学渣4 小时前
JavaScript_基础教程_自学笔记
开发语言·javascript·笔记
chushiyunen4 小时前
uv使用笔记(python包的管理工具)
笔记·python·uv
sheeta19985 小时前
LeetCode 每日一题笔记 日期:2025.03.23 题目:1594.矩阵的最大非负积
笔记·leetcode·矩阵
ysa0510305 小时前
二分+前缀(预处理神力2)
数据结构·c++·笔记·算法
8Qi85 小时前
Hello-Agents阅读笔记--智能体经典范式构建--ReAct
人工智能·笔记·llm·agent·智能体
伏 念6 小时前
大模型技术之LLM
人工智能·笔记·python·aigc