索引的原理

一、索引的核心思想:空间换时间

  1. 代价 :索引需要占用额外的存储空间,并且会在数据增删改时引入额外的维护开销。

  2. 收益 :通过预先建立并维护一个更小的、针对性更强的数据结构 ,使得查询时能以远快于遍历全表的速度定位到目标数据。

二、索引的工作原理(类比字典)

以汉语字典为例:

  • 表数据:字典中所有的汉字及其解释(相当于数据库表中的所有行)。

  • 索引 :字典的拼音检字表部首笔画目录

  • 工作流程

    1. 你要查"张"字。

    2. 你不会从第一页开始逐页翻找(全表扫描)。

    3. 你会先查拼音索引 ,找到"zhang"对应的页码范围,或者查部首索引,找到"弓"部对应的页码。

    4. 然后直接翻到该页码附近,快速找到"张"字(索引定位)。

在数据库中,这个过程被抽象为:

  1. 索引创建 :数据库提取指定列(或列组合)的值,并根据特定的数据结构 (如B+树、哈希表)进行组织,形成一个独立的索引文件。每条索引记录包含:索引键值 + 指向对应数据行位置的指针

  2. 索引查询

    • 当执行带有查询条件的SQL时(如 WHERE name = '张三'),数据库优化器会先判断是否有可用的索引。

    • 如果有,则访问索引结构,利用其高效的查找算法(如在B+树中进行二分查找、在哈希表中直接计算地址)快速找到键值 '张三' 及其对应的数据行指针。

    • 最后,通过指针直接定位并读取磁盘上的完整数据行。

三、两种主要索引实现原理的简要对比

虽然索引的核心思想一致,但不同数据结构决定了其特性和适用场景。

索引类型 核心原理 工作方式类比
哈希索引 散列映射。对索引键值应用哈希函数,计算出一个唯一的(或近似唯一的)哈希码,直接映射到数据行的存储地址。 类似于电话簿的人名索引 。你知道"张三"的名字,通过名字的拼音(哈希计算)直接定位到其电话号码(数据地址)。只适合精确匹配
B+树索引 平衡多路搜索树 。所有键值在树中有序存储,非叶子节点存放键值和子节点指针,叶子节点存放键值、数据指针,并形成双向链表。 类似于教材的目录 。目录(索引)本身有章、节、小节的层级结构(树形),并且页码顺序排列。你可以快速定位到某一章(范围查找),也可以顺着链表翻到下一页。适合精确查找、范围查找和排序
相关推荐
马克Markorg2 小时前
常见的向量数据库和具有向量数据库能力的数据库
数据库
Coder_Boy_4 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
helloworldandy4 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
数据知道6 小时前
PostgreSQL 故障排查:如何找出数据库中最耗时的 SQL 语句
数据库·sql·postgresql
qq_12498707536 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
枷锁—sha6 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
Coder_Boy_6 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Gain_chance6 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
此生只爱蛋6 小时前
【Redis】主从复制
数据库·redis
马猴烧酒.7 小时前
【面试八股|JAVA多线程】JAVA多线程常考面试题详解
java·服务器·数据库