PostgreSQL存储管理体系结构学习笔记2

1.表 和元组的组织方式

在PostgreSQL中,同一个表中的元组按照创建顺序依次插入到表文件中。元组之间不进行关联,这样的表文件称之为堆文件。PostgreSQL系统中包含了四种堆文件:普通堆,临时堆,序列,TOAST表。尽管这几种堆文件功能各异,但在底层的文件结构却是相似的:每个堆文件都是由多个文件块组成,在物理磁盘中的存储形式如下图所示:

其中PageHeaderData是长度为20字节的页头数据,包含文件块的一般信息

Linp是ItemIdData类型的数组,ItemIdData类型由lp_off、lp_flags和lp_len三个属性组成。

Freespace是指未分配的空间。

Special space是特殊空间,用于存放与索引方法相关的特定数据。

2.磁盘管理器

磁盘管理器是SMGR的一种具体实现,它对外提供了管理磁盘介质的接口,其主要实现在文件md.c中。磁盘管理器并非对磁盘上的文件直接进行操作,而是通过VFD机制来进行文件操作。

3.VFD机制

在操作系统中,当一个进程创建或是打开一个文件时,操作系统会为该文件分配一个唯一文件描述符,并通过该文件描述符来唯一标识和操作该文件。由于每个操作系统都对一个进程能打开的文件数加以限制,因此进程能获得的文件描述符是有限的。对于经常需要打开很多文件的数据库进程来说,很容易就会超过操作系统对于文件描述符数量的限制。为了解决这个问题,在PostgreSQL中使用了虚拟文件描述符机制(VFD)。以下为Vfd的数据结构:

typedef struct vfd

{

int fd; /* current FD, or VFD_CLOSED if none */

unsigned short fdstate; /* bitflags for VFD's state */

ResourceOwner resowner; /* owner, for automatic cleanup */

File nextFree; /* link to next free VFD, if in freelist */

File lruMoreRecently; /* doubly linked recency-of-use list */

File lruLessRecently;

off_t fileSize; /* current size of file (0 if not temporary) */

char *fileName; /* name of file, or NULL for unused VFD */

int fileFlags; /* open(2) flags for (re)opening the file */

mode_t fileMode; /* mode to pass to open(2) */

} Vfd;

相关推荐
敲上瘾31 分钟前
MySQL数据库表的约束
linux·数据库·sql·mysql·数据库开发·数据库架构·数据库系统
努力的搬砖人.32 分钟前
SQLite 转换为 MySQL 数据库
数据库·mysql·sqlite
2301_803297751 小时前
Shell编程值正则表达式和文本处理器
数据库·mysql·正则表达式
TDengine (老段)2 小时前
基于 TSBS 标准数据集下 TimescaleDB、InfluxDB 与 TDengine 性能对比测试报告
java·大数据·开发语言·数据库·时序数据库·tdengine·iotdb
TDengine (老段)2 小时前
TDengine 在金融领域的应用
大数据·数据库·物联网·金融·时序数据库·tdengine·涛思数据
标贝科技2 小时前
标贝科技:大模型领域数据标注的重要性与标注类型分享
数据库·人工智能
野木香2 小时前
mysql8常用sql语句
数据库·sql·mysql
hycccccch2 小时前
Redis的IO多路复用
数据库·redis·缓存
kngines2 小时前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】金融风控分析案例-10.1 风险数据清洗与特征工程
postgresql·z-score·缺失值处理·levenshtein·信用评分波动率·分箱处理·woe编码
不再幻想,脚踏实地3 小时前
Spring Boot配置文件
java·数据库·spring boot