【数据库】聊聊一颗B+树 可以存储多少数据

我们知道数据库使用的数据结构是B+树,但是B+树可以存储多少数据呢,在面试中也是经常会问的问题,所以我们从根上理解这个问题。

操作系统层面

数据都是存储在磁盘中的,而磁盘中的数据都是以最新单位扇区进行分割。一个扇区的大小是512字节,也就是0.5KB

文件系统块中的块通常是8个扇区构成,所以一个文件系统块大概是4K,而存储引擎中最小存储单元是页,一个页是4个文件块组成,也就是16K

InnoDB引擎

java 复制代码
show variables like 'innodb_page_size';

从中可以看到,InnoDB的存储引擎一页是16KB,因为本身是用B+树存储数据的,除了存储数据本身,还需要维护索引组织表。

查询过程大概如下:

1.根据索引找到对应位置的根页,因为根页在表空间中是固定的,所以说也就是page 3

2.找到根页后,通过二分查找的方式,找到id=3 在page4中

3.根据p4的指引,查找对应索引page 4的数据,找到数据ID=3的数据。

所以你看数据库有多强大,通过对外抽象成SQL进行操作,而内部维护事务、SQL解析、连接、存储、查询等功能。

一颗树可以存放多少行数据

假设一个主键为bigint类型,长度是8字节,而指针大小在源码中是6字节,那么一条数据就是14字节。一页16KB 16384/14 1170条数据。一个高度为2的B+树 可以存放 1170 * 16 = 18720条数据。

一个高度为3的B+树 可以存放 1170 * 1170 * 16 = 21902400条数据。

所以千万级别的数据,页只需要3层B+树就可以。

相关推荐
廿一夏7 小时前
MySql存储引擎与索引
数据库·sql·mysql
绝知此事8 小时前
【算法突围 01】线性结构与哈希表:后端开发的收纳术
java·数据结构·算法·面试·jdk·散列表
lzhdim8 小时前
SQL 入门 15:SQL 事务:从 ACID 到四种常见的并发问题
数据库·sql
瀚高PG实验室9 小时前
瀚高企业版V9.1.1在pg_restore还原备份文件时提示extract函数语法问题
数据库·瀚高数据库
TDengine (老段)9 小时前
TDengine Tag 设计哲学与 Schema 变更机制
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
LuminousCPP10 小时前
数据结构 - 线性表第四篇:C 语言通讯录优化升级全记录(踩坑 + 思考)
c语言·开发语言·数据结构·经验分享·笔记·学习
YOU OU10 小时前
Spring IoC&DI
java·数据库·spring
AI算法沐枫10 小时前
深度学习python代码处理科研测序数据
数据结构·人工智能·python·深度学习·决策树·机器学习·线性回归
Muscleheng11 小时前
Navicat连接postgresql时出现‘datlastsysoid does not exist‘报错
数据库·postgresql
罗超驿12 小时前
18.事务的隔离性和隔离级别:MySQL面试高频考点全解析
数据库·mysql·面试