数据结构-文件

文件是性质相同的记录的集合。

记录是文件中存取的基本单位,数据项是文件可使用的最小单位。

操作系统研究的文件是一维的无结构连续字符序列,数据库中研究的文件是带有结构的记录集合。

文件在外存上的4种基本组织方式:顺序、索引、散列、链(多关键字)。

磁带和磁盘分别是顺序存取设备和直接存取设备。

<h1>顺序文件</h1>

顺序文件按记录进入文件的顺序存储。

顺序有序文件和顺序无序文件。

顺序文件多用在磁带上。

<h1>索引文件</h1>

索引表指明逻辑记录和物理记录的对应关系,索引表和主文件一起构成索引文件,在存储器上分为索引区和数据区。

主文件分为索引顺序文件和索引非顺序文件,索引非顺序文件适合随机存取,索引顺序文件适合于顺序存取。

索引表分为稠密索引和稀疏索引。

还可以对索引表建立索引,称为查找表。查找表可以有多级。

这种多级顺序表索引是一种静态索引。而动态索引采用二叉排序树、AVL树、B-树等树表结构,插入和删除方便。

<h1>索引顺序文件</h1>

两种常用的索引顺序文件:ISAM文件和VASM文件。

ISAM:索引顺序存取方法,为磁盘存取设计,采用静态索引结构。ISAM文件由多级主索引、柱面索引、磁道索引、主文件组成。

VSAM:虚拟存储存取方法,采用B+树作为动态索引结构。VSAM文件由索引集、顺序集、数据集组成。

<h1>散列文件</h1>

也称为直接存取文件,散列文件主要采用拉链法处理冲突。

散列文件只能按关键字随机存取,不能顺序存取。

<h1>多关键字文件</h1>

多重表文件,对每个次关键字也建立一个索引,并且将具有相同次关键字的记录的物理地址链接起来,次关键字索引表的一条记录包括次关键字、链表的头指针、链表长度。

倒排文件,与多重表文件相比,倒排文件把链表的物理地址放在了次关键字索引表中了。

与单关键字索引文件相比,倒排文件是按给定次关键字查找记录,而不是在已查找记录中找次关键字。

相关推荐
AL流云。4 小时前
【优选算法】分治
数据结构·算法·leetcode·排序算法
行驶4 小时前
数据结构 - 栈与队列
数据结构
haoly19894 小时前
数据结构篇--分离链表vs线性探测
数据结构
小贾要学习4 小时前
【数据结构】AVL树的实现
数据结构
andyweike5 小时前
数据结构-线性表
数据结构
思捻如枫14 小时前
C++数据结构和算法代码模板总结——算法部分
数据结构·c++
小猫咪怎么会有坏心思呢14 小时前
华为OD机考 - 水仙花数 Ⅰ(2025B卷 100分)
数据结构·链表·华为od
hn小菜鸡15 小时前
LeetCode 1356.根据数字二进制下1的数目排序
数据结构·算法·leetcode
SuperCandyXu18 小时前
leetcode2368. 受限条件下可到达节点的数目-medium
数据结构·c++·算法·leetcode