RLE算法在PS2中的应用

RLE算法介绍

RLE(Run Length Encoding,行程长度编码)算法,是把文件内容用"重复次数x数据"的形式来表示的压缩方法。比如:有AAAAAABBCDDEEEEEF这样一段数据,在字符后面加上重复出现次数,就可以用6A2B1C2D5E1F来表示。可以看到原始数据是17字节,编码后是12字节,因此压缩是成功的。

让我们再看一串数据:ABCDE,如果按照上面的算法,编码后为1A1B1C1D1E,原始数据是5字节,编码后是10字节,毫无疑问这种压缩方式是失败的。

为什么第二种字符串压缩会失败呢?细心的朋友一定看出来是因为它的字符重复出现的次数很少,因此使用"重复次数x数据"反而增加了数据长度。那有没有办法解决这个"缺陷"呢?答案是有的。我们接下来介绍在PS2游戏机中,是如何使用RLE算法来压缩图片的。

RLE算法在PS2中的应用

PS2中,图片文件的前4个字节指示了压缩后文件的大小。接下来的数据按照rle_code + 数据块的格式重复排列。需要注意的是,在PS2这里,rle_code数据块中的每个数据,都是2字节,这点是与其它传统的RLE算法普遍为1字节最大的不同。

rle_code的最高位是标识位,如果这一位是1,则表示后面紧跟着的数据块是"非重复数据",类似于上面的ABCDE。此时将0x8000减去rle_code的后7位,得到的是数据块的长度。此时只需取出后面紧跟的该长度的数据块即可。

如果标识位为0,则表示后面紧跟着的数据块是"重复数据",类似于AAAAA,此时rle_code就是重复次数,只要取出后面紧跟着的一个数据块,重复rle_code次即可。

伪代码如下:

python 复制代码
while rle_offset < compressed_size:
    rle_code = rle_code_struct.unpack_from(self.byte_val, rle_offset)[0]
    rle_offset += 2
    if rle_code & 0x8000:
        next_bytes = 0x8000 - (rle_code ^ 0x8000)
        texture_buf += self.byte_val[rle_offset: rle_offset + next_bytes * 2]
        rle_offset += next_bytes * 2
    else:
        times = rle_code
        if times > 0:
            next_byte = self.byte_val[rle_offset: rle_offset + 2]
            for _ in range(times):
                texture_buf += next_byte
            rle_offset += 2

总结

如果在一个文件中,能连续遇到大量重复的数据,RLE算法可以提供很好的压缩效果。但对于出现连续的"非重复数据",需要使用改良过的算法进行优化。PS2使用的是众多改良算法的一种,比较简单,也很方便初学者对该算法的学习。

本篇文章使用的代码摘自我的一个github项目:ps2mc-browser,欢迎有兴趣的小伙伴一起研究那个古老的PS2游戏机。

相关推荐
LYFlied21 小时前
【每日算法】LeetCode 25. K 个一组翻转链表
算法·leetcode·链表
Swizard21 小时前
别再迷信“准确率”了!一文读懂 AI 图像分割的黄金标尺 —— Dice 系数
python·算法·训练
s090713621 小时前
紧凑型3D成像声纳实现路径
算法·3d·声呐·前视多波束
可爱的小小小狼21 小时前
算法:二叉树遍历
算法
d111111111d1 天前
在STM32函数指针是什么,怎么使用还有典型应用场景。
笔记·stm32·单片机·嵌入式硬件·学习·算法
AI科技星1 天前
质量定义方程常数k = 4π m_p的来源、推导与意义
服务器·数据结构·人工智能·科技·算法·机器学习·生活
摇摆的含羞草1 天前
哈希(hash)算法使用特点及常见疑问解答
算法·哈希算法
仰泳的熊猫1 天前
1077 Kuchiguse
数据结构·c++·算法·pat考试
LYFlied1 天前
【每日算法】LeetCode 19. 删除链表的倒数第 N 个结点
算法·leetcode·链表
踏浪无痕1 天前
计算机算钱为什么会算错?怎么解决?
后端·算法·面试