索引的原理

hgz07102025-12-26 17:12

一、索引的核心思想：空间换时间

代价：索引需要占用额外的存储空间，并且会在数据增删改时引入额外的维护开销。
收益：通过预先建立并维护一个更小的、针对性更强的数据结构 ，使得查询时能以远快于遍历全表的速度定位到目标数据。

二、索引的工作原理（类比字典）

以汉语字典为例：

表数据：字典中所有的汉字及其解释（相当于数据库表中的所有行）。
索引：字典的拼音检字表 或部首笔画目录。
工作流程：
1. 你要查"张"字。
2. 你不会从第一页开始逐页翻找（全表扫描）。
3. 你会先查拼音索引 ，找到"zhang"对应的页码范围，或者查部首索引，找到"弓"部对应的页码。
4. 然后直接翻到该页码附近，快速找到"张"字（索引定位）。

在数据库中，这个过程被抽象为：

索引创建 ：数据库提取指定列（或列组合）的值，并根据特定的数据结构 （如B+树、哈希表）进行组织，形成一个独立的索引文件。每条索引记录包含：索引键值 + 指向对应数据行位置的指针。
索引查询：
- 当执行带有查询条件的SQL时（如 WHERE name = '张三'），数据库优化器会先判断是否有可用的索引。
- 如果有，则访问索引结构，利用其高效的查找算法（如在B+树中进行二分查找、在哈希表中直接计算地址）快速找到键值 '张三' 及其对应的数据行指针。
- 最后，通过指针直接定位并读取磁盘上的完整数据行。

三、两种主要索引实现原理的简要对比

虽然索引的核心思想一致，但不同数据结构决定了其特性和适用场景。

索引类型	核心原理	工作方式类比
哈希索引	散列映射。对索引键值应用哈希函数，计算出一个唯一的（或近似唯一的）哈希码，直接映射到数据行的存储地址。	类似于电话簿的人名索引。你知道"张三"的名字，通过名字的拼音（哈希计算）直接定位到其电话号码（数据地址）。只适合精确匹配。
B+树索引	平衡多路搜索树。所有键值在树中有序存储，非叶子节点存放键值和子节点指针，叶子节点存放键值、数据指针，并形成双向链表。	类似于教材的目录。目录（索引）本身有章、节、小节的层级结构（树形），并且页码顺序排列。你可以快速定位到某一章（范围查找），也可以顺着链表翻到下一页。适合精确查找、范围查找和排序。

上一篇：git commit复合指令

下一篇：Nestjs 风云录：前端少侠的破局之道

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 年 AI 大模型 & AI 编程工具实战全总结 10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新