数据结构-文件

文件是性质相同的记录的集合。

记录是文件中存取的基本单位,数据项是文件可使用的最小单位。

操作系统研究的文件是一维的无结构连续字符序列,数据库中研究的文件是带有结构的记录集合。

文件在外存上的4种基本组织方式:顺序、索引、散列、链(多关键字)。

磁带和磁盘分别是顺序存取设备和直接存取设备。

<h1>顺序文件</h1>

顺序文件按记录进入文件的顺序存储。

顺序有序文件和顺序无序文件。

顺序文件多用在磁带上。

<h1>索引文件</h1>

索引表指明逻辑记录和物理记录的对应关系,索引表和主文件一起构成索引文件,在存储器上分为索引区和数据区。

主文件分为索引顺序文件和索引非顺序文件,索引非顺序文件适合随机存取,索引顺序文件适合于顺序存取。

索引表分为稠密索引和稀疏索引。

还可以对索引表建立索引,称为查找表。查找表可以有多级。

这种多级顺序表索引是一种静态索引。而动态索引采用二叉排序树、AVL树、B-树等树表结构,插入和删除方便。

<h1>索引顺序文件</h1>

两种常用的索引顺序文件:ISAM文件和VASM文件。

ISAM:索引顺序存取方法,为磁盘存取设计,采用静态索引结构。ISAM文件由多级主索引、柱面索引、磁道索引、主文件组成。

VSAM:虚拟存储存取方法,采用B+树作为动态索引结构。VSAM文件由索引集、顺序集、数据集组成。

<h1>散列文件</h1>

也称为直接存取文件,散列文件主要采用拉链法处理冲突。

散列文件只能按关键字随机存取,不能顺序存取。

<h1>多关键字文件</h1>

多重表文件,对每个次关键字也建立一个索引,并且将具有相同次关键字的记录的物理地址链接起来,次关键字索引表的一条记录包括次关键字、链表的头指针、链表长度。

倒排文件,与多重表文件相比,倒排文件把链表的物理地址放在了次关键字索引表中了。

与单关键字索引文件相比,倒排文件是按给定次关键字查找记录,而不是在已查找记录中找次关键字。

相关推荐
叼烟扛炮16 小时前
C++第二讲:类和对象(上)
数据结构·c++·算法·类和对象·struct·实例化
MegaDataFlowers19 小时前
206.反转链表
数据结构·链表
CN-Dust20 小时前
【C++】while语句例题专题
数据结构·c++·算法
xieliyu.1 天前
Java手搓数据结构:从零模拟实现无头双向非循环链表
java·数据结构·链表
如何原谅奋力过但无声1 天前
【灵神高频面试题合集01-03】相向双指针、滑动窗口
数据结构·python·算法·leetcode
jieyucx1 天前
Go 数据结构入门:线性表、顺序表、链表
数据结构·链表·golang
阿维的博客日记1 天前
zset为什么要用到skiplist+Dict的数据结构
数据结构·skiplist
编程之升级打怪1 天前
KMP查询算法的匹配串的前缀后缀相同的最大长度
数据结构
没文化的阿浩1 天前
【数据结构】排序(2)——直接选择排序、堆排序
数据结构·算法·排序算法
承渊政道1 天前
【动态规划算法】(子数组系列问题建模与解题思路精讲)
数据结构·c++·学习·算法·leetcode·动态规划·哈希算法