C/C++工程师面试题(数据库篇)

索引的优缺点

索引是一种支持快速查找特定行的数据结构,如果没有索引,就需要遍历整个表进行查找。用于提高数据检索的速度和效率。

好处:

  1. 提高检索速度: 索引可以加快数据的检索速度,因为它们允许数据库系统直接定位到存储数据的位置,而不必遍历整个数据表。

  2. 优化数据访问路径: 索引可以优化数据访问路径,使得查询更加高效。

坏处:

  1. 占用存储空间: 索引会占用额外的存储空间,特别是对于大型数据集来说,索引可能会占用相当大的空间。

  2. 影响写操作的性能: 当执行插入、更新和删除等写操作时,数据库系统需要更新索引,这可能会影响写操作的性能。

  3. 维护成本高昂: 维护索引需要额外的系统资源和时间成本。随着数据库的增长和索引的数量增加,维护成本可能会变得很高。

数据库索引的底层数据结构

**B+树。**在数据库中,B+树的高度一般都在2~4层,效率很高。

B+树中,所有记录节点都是按键值的大小顺序存放在同一层的叶子节点,各叶子节点通过指针进行链接。

非叶子节点只存储与搜索有关的key

叶子节点存储数据。从小到大有序,并且使用指针连接在一起。

B+树索引在数据库中的一个特点就是高扇出性 。B-tree将数据库拆分成了固定大小的块,通常为4K,块是内部读写的最小单元。这种设计更接近底层硬件,因为磁盘也是以固定大小 的块排列的。
**问题:**如果固定大小的块已经满了该怎么办、

**答案:**分裂多个块解决,空的空间使用空闲空间。

聚簇索引和非聚簇索引

两者主要区别是数据和索引是否分离。

  • 聚簇索引 是将数据与索引存储到一起,找到索引也就找到了数据;
    叶子节点存储真实数据
    非叶子节点存储查询需要的key
    一个表有且仅有一个聚簇索引,并且该索引是建立在主键 上的,如果没有主键,会建立在unique列上
  • 而非聚簇索引 是将数据和索引存储分离开,索引树的叶子节点存储了数据行的地址。
    其他索引项都是非聚簇索引
    叶子节点存储聚簇索引的key
    非叶子节点存储查询需要的key
    查找会先找到叶子节点,拿叶子节点的聚簇索引的key 再去搜索聚簇索引

索引为什么不用哈希表而用 B+ 树

哈希表的查询效率的确最高,时间复杂度O(1),但是它要求将所有数据载入内存,而数据库存储的数据量级可能会非常大,全部载入内存基本上是不可能实现的

索引为什么不用红黑树而用 B+ 树

索引的底层用的并不是二叉树红黑树 。因为二叉树和红黑树在某些场景下都会暴露出一些缺陷。
二叉树: 在某些场景下会退化成链表,而链表的查找需要从头部开始遍历,而这就失去了加索引的意义。
红黑树:当数据表很多时,会导致索引树的层数很高。索引从根节点开始查找,而如果我们需要查找的数据在底层的叶子节点上,那么树的高度是多少,就要进行多少次查找,并且数据存在磁盘上,访问还需要进行磁盘IO,这会导致效率过低。

提高查询效率的方法

提高查询效率的方法有很多,以下是一些常见的方法:

  1. 索引优化: 通过在经常查询的列上创建索引,可以加快查询速度。

  2. 优化查询语句: 编写高效的查询语句是提高查询效率的关键。避免使用SELECT *,只选择需要的列;避免使用不必要的子查询等。

  3. 内存缓存: 使用缓存技术将热点数据存储在内存中,可以减少数据库访问次数,提高查询速度。

  4. 合适的数据类型: 使用合适的数据类型可以减少存储空间并提高查询效率。例如,选择整数型而不是字符串型存储数字数据。

  5. 定期优化数据库: 定期清理无用数据、重建索引以及收集统计信息等可以提高数据库性能。

相关推荐
席万里5 分钟前
什么是事务?并发事务引发的问题?什么是MVCC?
数据库
泡泡Java26 分钟前
postgresql链接详解
数据库·postgresql
雾里看山43 分钟前
【MySQL】内置函数
android·数据库·mysql
程序媛_43 分钟前
【DBeaver】Oracle数据库连接报错:驱动程序 ‘Oracle‘ 的配置错误的解决办法
数据库·oracle
圆内~搁浅2 小时前
langchain本地知识库问答机器人集成本地知识库
数据库·langchain·机器人
早起的年轻人2 小时前
Docket Desktop 安装redis 并设置密码
数据库·redis·缓存
xlxxy_3 小时前
ABAP数据库表的增改查
开发语言·前端·数据库·sql·oracle·excel
清水加冰3 小时前
【MySQL】索引
数据库·mysql
qw9493 小时前
Redis(高阶篇)03章——缓存双写一致性之更新策略探讨
数据库·redis·缓存