文本和二进制混合存储

要想让文本和二进制混合存储,有两套方案:

①以文本为主,插入二进制数据

②以二进制为主,区分文本和二进制数据段

第一套方案的例子:
时间戳=[....],这是一段64位二进制数据。

在这句话中,以二进制形式储存时间戳,紧凑。

对UTF-8编码进行修改,得到能够混合存储的编码。
0×××××××,UTF-8一字节模式
110××××× 10××××××,UTF-8双字节模式
1110×××× 10×××××× 10××××××,UTF-8三字节模式
11110××× 10×××××× 10×××××× 10××××××,UTF-8四字节模式

以上是字符模式。
111110×× ×××××××× [data],立即数模式

10个×能表达[0, 1K),将它加一,能表达[1, 1K]的范围。在立即数模式下,用2字节记录长度len-1,再写下长度为len的data。data最长为1KB。
111111××,这里还有4个码位,保留。

既然设计为保存1KB数据,这套方案可以命名为UTF-8_1KB。

相关推荐
颜酱28 分钟前
二叉树分解问题思路解题模式
javascript·后端·算法
qianpeng8972 小时前
水声匹配场定位原理及实验
算法
董董灿是个攻城狮13 小时前
AI视觉连载8:传统 CV 之边缘检测
算法
AI软著研究员20 小时前
程序员必看:软著不是“面子工程”,是代码的“法律保险”
算法
FunnySaltyFish21 小时前
什么?Compose 把 GapBuffer 换成了 LinkBuffer?
算法·kotlin·android jetpack
颜酱1 天前
理解二叉树最近公共祖先(LCA):从基础到变种解析
javascript·后端·算法
地平线开发者2 天前
SparseDrive 模型导出与性能优化实战
算法·自动驾驶
董董灿是个攻城狮2 天前
大模型连载2:初步认识 tokenizer 的过程
算法
地平线开发者2 天前
地平线 VP 接口工程实践(一):hbVPRoiResize 接口功能、使用约束与典型问题总结
算法·自动驾驶
罗西的思考2 天前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习