OceanBase 系统架构初探

如图,Oceanbase数据库的存储引擎基于LSM Tree(结构日志合并) 架构。

从名字上来看,说明它是基于日志,有序存放的。

动态增量数据(放在MemTable中),还有个名词时memstore,在租户中,包括memstore和KVcache。

memtable可以理解为存放的时候是基于表的存放,是一种增量的数据

如:DML操作,在OB中update 有自己的特点与PG有相同点。

在PG中做update操作会先删除再插入,但数据不会真正删除,会标记为delete状态。

OB中做update操作与PG类似,直接插入一条新的数据,然后带上一条时间戳。不会像oracle一样直接在原来的行进行修改。

如上图,数据不会一直放在内存中,会放在静态基线数据,放在SSTable(Sorted String)中,看名字就知道它在底层是以排序好的字符串的形式。

为了持久化考虑,OB的默认事务级别和oracle一样,也是RC,提交后会把日志写到redo log中,在ob中也叫clog(commit log)。

日志如何同步?

1.如果本机是leader,它会把日志落到本地,同时把日志同步到另外两个副本。

2.如果本机不是leader,会接受leader产生的redo,然后落盘。

memtable结构:

1.Row-Level:

2.Redo/MVCC

3.内存存储引擎

OB是一个准内存数据库,内存会很大,要操作这么大的内存,如何快速找到我们想要的数据?

OB中有两种方式:

1.hash 2.B树

如果DML语句是一个范围操作,就会使用B树,如果是一个单行查询,就会使用hash。

4.数据读取内存区域

select操作会怎么读取?

1.由于写内存区域(memtable)的数据是最新的,所以会先读memtable

2.如果memtable里面没有,就需要去读转储SSTable,再把数据写到Block Cache。

3.如果转储SSTable也没有,就会去找基线SSTable

Block Cache和Row Cache有什么区别?

在OB中磁盘中存放的单位是宏块------2M,类似于oracle中的extent。

在宏块底层是微块------16k。

需要做全表扫描的时候,读Block Cache即可,Block Cache适合OLAP。

ROW 我理解为像一个缓冲池,适合OLTP系统,把热点行数据缓存在ROW Cache,下次select直接访问row cache即可。

在OB中只有一个基线文件,随着合并,这个基线文件会很大。

如果SSTable所在的磁盘有2T,那么会默认分配2T*90=1.8T给到这个文件。

所以要做RAID 5不做RAID 0 并且使用lvm逻辑卷管理。

相关推荐
枫叶20001 小时前
OceanBase数据库-学习笔记1-概论
数据库·笔记·学习·oceanbase
OceanBase数据库官方博客4 天前
向量检索新选择:FastGPT + OceanBase,快速构建RAG
人工智能·oceanbase·分布式数据库·向量数据库·rag
胖头鱼的鱼缸(尹海文)13 天前
数据库管理-第313期 分布式挑战单机,OceanBase单机版试玩(20250411)
数据库·分布式·oceanbase
GottdesKrieges15 天前
OceanBase企业版单机部署:obd命令行方式
数据库·oceanbase
好记忆不如烂笔头abc15 天前
oceanbase开启内存大页
linux·服务器·oceanbase
OceanBase数据库官方博客16 天前
OceanBase 推出单机版 ,为中小规模业务提供高性价比方案
oceanbase·单机数据库
OceanBase数据库官方博客17 天前
OceanBase V4.3.5 上线全文索引功能,让数据检索更高效
全文检索·oceanbase·分布式数据库·产品特性
OceanBase数据库官方博客17 天前
多点:分布式升级助力新零售转型,成本节省超80% | OceanBase 案例
oceanbase·零售·架构选型·布道师计划·电商与零售
OceanBase数据库官方博客18 天前
火山模型的优缺点与优化实践 | OceanBase SQL优化
sql·oceanbase·分布式数据库
ActionTech1 个月前
ChatDBA VS DeepSeek:快速诊断 OceanBase 集群新租户数据同步异常
oceanbase·deepseek·chatdba·爱可生