【数据库】聊聊一颗B+树 可以存储多少数据

我们知道数据库使用的数据结构是B+树,但是B+树可以存储多少数据呢,在面试中也是经常会问的问题,所以我们从根上理解这个问题。

操作系统层面

数据都是存储在磁盘中的,而磁盘中的数据都是以最新单位扇区进行分割。一个扇区的大小是512字节,也就是0.5KB

文件系统块中的块通常是8个扇区构成,所以一个文件系统块大概是4K,而存储引擎中最小存储单元是页,一个页是4个文件块组成,也就是16K

InnoDB引擎

java 复制代码
show variables like 'innodb_page_size';

从中可以看到,InnoDB的存储引擎一页是16KB,因为本身是用B+树存储数据的,除了存储数据本身,还需要维护索引组织表。

查询过程大概如下:

1.根据索引找到对应位置的根页,因为根页在表空间中是固定的,所以说也就是page 3

2.找到根页后,通过二分查找的方式,找到id=3 在page4中

3.根据p4的指引,查找对应索引page 4的数据,找到数据ID=3的数据。

所以你看数据库有多强大,通过对外抽象成SQL进行操作,而内部维护事务、SQL解析、连接、存储、查询等功能。

一颗树可以存放多少行数据

假设一个主键为bigint类型,长度是8字节,而指针大小在源码中是6字节,那么一条数据就是14字节。一页16KB 16384/14 1170条数据。一个高度为2的B+树 可以存放 1170 * 16 = 18720条数据。

一个高度为3的B+树 可以存放 1170 * 1170 * 16 = 21902400条数据。

所以千万级别的数据,页只需要3层B+树就可以。

相关推荐
hutengyi13 小时前
保姆级JavaWeb项目创建、部署、连接数据库(tomcat)
数据库·tomcat·firefox
yuanyuan2o213 小时前
你可能需要的算法思想——动态规划
数据结构·python·算法·动态规划
寰宇的行者13 小时前
深入理解 Django 异步视图中的 `sync_to_async` 与协程
数据库·django
草莓熊Lotso13 小时前
MySQL 索引特性与性能优化全解
android·运维·数据库·c++·mysql·性能优化
Alicx.13 小时前
map容器是个好东西
数据结构·算法·蓝桥杯
薛定谔的悦13 小时前
站控显示下级从控EMS的版本信息开发(设计多线程和TCP通讯)
linux·网络·数据库·网络协议·tcp/ip·ems
bcbobo21cn13 小时前
C#使用一维数组作为参数传递
开发语言·数据库·c#·一维数组
荒川之神13 小时前
Hive 拉链表实例
开发语言·数据库
ZzzZZzzzZZZzzzz…13 小时前
MySQL备份还原方法1---mysqldump
linux·运维·数据库·mysql·还原备份
麦聪聊数据13 小时前
企业数据流通与敏捷API交付实战(二):微服务取数与冗余CRUD
数据库·sql·低代码·微服务·restful