OrioleDB: 新一代PostgreSQL存储引擎

PostgreSQL 12 引入了可插拔式的表存储方法接口,允许为不同的表选择不同的存储机制,例如用于 OLTP 操作的堆表(HEAP、默认)、用于 OLAP 操作的列式表(Citus),以及用于超快速搜索处理的内存表。

PostgreSQL 这一特性类似于 MySQL 的插件式存储引擎,例如 InnoDB、MyISAM。

今天给大家介绍一个云原生的 PostgreSQL 存储引擎:OrioleDB

功能特性

OrioleDB 旨在解决 PostgreSQL 默认 HEAP 表在 OLTP(在线事务处理)场景中的一些性能瓶颈,并引入现代数据库存储技术的设计理念,提供更高的并发性能、更低的延迟,并减少存储开销。

OrioleDB 以扩展插件形式提供,基于 PostgreSQL 协议发布,提供的核心特性包括:

  • 基于现代存储技术(SSD、NVRAM)设计,优化多核 CPU 和 NUMA 架构下的资源分配,提升吞吐量。
  • 基于 Undo Log 的 MVCC,将旧版本数据存储在独立的 Undo Log 而不是主表中。事务回滚或旧版本清理时直接操作 Undo Log,避免主表数据膨胀。同时还支持 64 位事务 ID,避免了回卷问题。
  • 聚簇索引,默认使用聚簇索引(类似 MySQL/InnoDB),数据按主键顺序存储,减少随机 I/O,提升范围查询性能。
  • 压缩存储,支持页级数据压缩,降低存储成本。
  • 分布式支持,Copy-on-Write 检查点提供结构一致的数据快照,兼容 SSD 特性,并支持紧凑的行级 WAL 记录。基于行级 WAL 日志和 Raft 共识算法,支持并行回放和 Active-Active 多主架构,适合分布式部署。

使用示例

目前,OrioleDB 还处于 Beta 阶段,最简单的使用方法就是利用 Docker:

bash 复制代码
docker run -d --name orioledb -p 5432:5432 orioledb/orioledb

然后安装扩展插件并创建数据表:

sql 复制代码
-- 创建扩展插件
CREATE EXTENSION orioledb;

-- 创建表
CREATE TABLE blog_post
(
    id int8 NOT NULL,
    title text NOT NULL,
    body text NOT NULL,
    author text NOT NULL,
    published_at timestamptz  NOT NULL DEFAULT CURRENT_TIMESTAMP,
    views bigint NOT NULL,
    PRIMARY KEY(id)
) USING orioledb; -- 使用OrioleDB存储引擎

-- 创建索引
CREATE INDEX blog_post_published_at ON blog_post(published_at);

OrioleDB 使用聚簇索引,因此主键的选择对于性能至关重要;如果没有指定主键字段,数据库会基于 ctid 字段创建一个隐藏的替代主键。

接下来就可以执行一些 DML 操作:

sql 复制代码
INSERT INTO blog_post (id, title, body, author, views)
VALUES (1, 'Hello, World!', 'This is my first blog post.', 'John Doe', 1000);

SELECT * FROM blog_post ORDER BY published_at DESC LIMIT 10;

更详细的使用介绍和注意事项可以参考以下官方文档:

https://www.orioledb.com/docs

性能比较

以下是一些 OrioleDB 和默认 HEAP 存储引擎的性能比较:

测试一:只读测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4 倍。

测试二:读写测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4.5 倍。

测试三:OrioleDB 存储引擎的磁盘读取(IOPS)是 PostgreSQL 默认引擎的 1/6。

测试四:OrioleDB 存储引擎的磁盘写入比 PostgreSQL 默认引擎大幅减少。

相关推荐
TDengine (老段)35 分钟前
基于 TSBS 标准数据集下 TimescaleDB、InfluxDB 与 TDengine 性能对比测试报告
java·大数据·开发语言·数据库·时序数据库·tdengine·iotdb
TDengine (老段)38 分钟前
TDengine 在金融领域的应用
大数据·数据库·物联网·金融·时序数据库·tdengine·涛思数据
标贝科技1 小时前
标贝科技:大模型领域数据标注的重要性与标注类型分享
数据库·人工智能
野木香1 小时前
mysql8常用sql语句
数据库·sql·mysql
hycccccch1 小时前
Redis的IO多路复用
数据库·redis·缓存
kngines1 小时前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】金融风控分析案例-10.1 风险数据清洗与特征工程
postgresql·z-score·缺失值处理·levenshtein·信用评分波动率·分箱处理·woe编码
不再幻想,脚踏实地1 小时前
Spring Boot配置文件
java·数据库·spring boot
_extraordinary_1 小时前
MySQL 事务(二)
android·数据库·mysql
fmdpenny2 小时前
SQL中联表的运用
数据库·sql
不剪发的Tony老师2 小时前
互联网SQL面试题:用户会话时长分析
数据库·sql