计算机十万个为什么--数据库索引

计算机十万个为什么--数据库索引

大家好,欢迎来到最新一期的无限大博客。

突然发现自己对数据库相关的内容掌握不够扎实,于是就去学习了一下,顺便也将自己的理解写成了一篇博客。

希望这篇文章能对大家有所帮助

数据库索引:给数据仓库装个"智能导航系统" 🧭

想象一下,你走进一个占地 1000 平方米的超级图书馆 📚,里面塞满了几十万本书,却连个分类牌都没有。老板忽然喊你找一本《数据库从入门到放弃》,你是不是当场想表演一个原地消失术?😱

这就是没有索引的数据库 的日常!每次查询都像蒙眼找书,全表扫描就是那个被蒙住眼睛的倒霉蛋,只能一本本摸过去。而今天我们要聊的 数据库索引 ,就是给这个混乱图书馆装上的智能导航系统 🧭,让你秒变图书馆馆长,想找哪本书就找哪本书!

为什么"like '%关键词%'"会让索引当场罢工?

先看个灵魂拷问:下面两条 SQL,性能可能差 1000 倍!你猜哪个快?

sql 复制代码
-- 语句 A
SELECT * FROM books WHERE title LIKE '数据库%';

-- 语句 B
SELECT * FROM books WHERE title LIKE '%数据库%';

答案是语句 A 可能快到飞起,语句 B 可能慢到想砸键盘

原因就藏在那个小小的百分号里。

🌰 蒙眼找书现场还原

假设我们给 title 字段建了索引,就像图书馆按书名首字母排序的分类架。当你执行 LIKE '数据库%' 时,索引会开心地带你直奔 "数" 字区,从 "数据库入门" 找到 "数据库原理",一气呵成 🚀。

但如果写成 LIKE '%数据库%',相当于你告诉图书管理员:"我要找所有书名里包含'数据库'的书,但我不告诉你它在开头还是结尾"。这时候索引直接懵了 😵,因为它的排序规则是按首字母来的,现在关键词可能出现在任何位置,就像让你在所有书里找 "包含'的'字的书" 一样------索引完全帮不上忙!

全表扫描警告 ⚠️:数据库只能开启"蒙眼摸书"模式,逐行检查每条记录。如果表中有 100 万条数据,就像让你在 100 万本书里一本本翻开找,画面太美我不敢看 🥶。

避坑指南:3 个让索引失效的经典操作

错误写法 🔴 正确姿势 🟢 性能差距
LIKE '%关键词%' LIKE '关键词%' 或使用全文索引 可能差 100~1000 倍
WHERE age + 1 = 25 WHERE age = 24 索引直接失效
WHERE SUBSTR(title, 3) = '数据库' WHERE title LIKE '__数据库%' 函数操作导致索引失效

B+树索引 vs 哈希索引:新华字典 vs 快递柜

现在你决定给图书馆装导航系统了,但市场上有两种方案:

  • 方案 A :像《新华字典》那样的目录 📖(B+树索引)
  • 方案 B :像快递柜那样的编号系统 📦(哈希索引)

到底选哪个?这得看你平时怎么找书!

📖 B+树索引:新华字典的智慧

翻开你的新华字典,会发现它有两种目录:拼音索引和部首索引。B+树索引就像拼音索引,它把数据按顺序排好,并且只在叶子节点存储完整数据,中间节点都是"指路牌"。

graph TD A[根节点] -->|1-100| B[中间节点] A -->|101-200| C[中间节点] B -->|1-50| D[叶子节点: 1,3,5...50] B -->|51-100| E[叶子节点: 51,53...100] C -->|101-150| F[叶子节点: 101...150] C -->|151-200| G[叶子节点: 151...200] D -->|链表指针| E E -->|链表指针| F F -->|链表指针| G

适用场景

  • 范围查询(比如找 "价格在 10-50 元的书")📊
  • 排序操作(比如 "按出版日期倒序排列")🔄
  • 前缀匹配(比如 LIKE '数据库%')🎯

📦 哈希索引:快递柜的暴力美学

哈希索引就像快递柜,每个 key 都通过哈希函数计算出一个唯一编号,直接定位到存储位置。比如查询 id=100 的数据,哈希函数算出来是 8 号柜,直接拉开 8 号柜就能找到!

适用场景

  • 等值查询(比如 WHERE id=100)⚡
  • 键值对数据库(如 Redis)🚀

灵魂对比表格 👇

特性 B+树索引 哈希索引
查找速度 O(log n) 稳定 O(1) 但有哈希冲突风险
范围查询 ✅ 天生支持 ❌ 完全不支持
排序 ✅ 叶子节点链表天然有序 ❌ 无序存储
内存占用 中等(可存磁盘) 较高(通常内存存储)
经典应用 MySQL InnoDB 主键索引 Redis、Memcached 键值存储

MySQL InnoDB 聚簇索引:叶子节点里藏着大秘密!

如果你用 MySQL 的 InnoDB 引擎,那你必须知道这个惊天大秘密 💣:

它的主键索引叶子节点直接存着整行数据!就像你查新华字典时,翻到 "数" 字不仅能看到拼音,还能直接把整页字典撕下来带走 📄。

聚簇索引 vs 非聚簇索引:冰箱 vs 储物柜

  • 聚簇索引 (主键索引):就像家里的冰箱 🧊,门(索引)打开直接看到食物(数据),不用再跑一趟。
  • 非聚簇索引 (二级索引):就像储物柜的标签 🏷️,上面写着"零食在冰箱第三层",你还得再去冰箱拿。
graph TD subgraph 聚簇索引 B+树 A[根节点: 主键范围 1-1000] B[中间节点: 1-500] C[中间节点: 501-1000] D[叶子节点: 1-100, 包含整行数据] E[叶子节点: 101-200, 包含整行数据] end A --> B A --> C B --> D B --> E D --> E --> F[...更多叶子节点]

实战:如何检测索引失效?

给大家分享一个我压箱底的索引失效检测 SQL 🕵️‍♂️,执行它就能知道查询有没有用到索引:

sql 复制代码
EXPLAIN
SELECT * FROM books
WHERE title LIKE '%数据库%'  -- 这个会失效
  AND price > 50;           -- 这个可能有效

结果解读 👇: -- 重点看 type 列: -- ✅ ref/range/index:索引有用 -- ❌ ALL:全表扫描,索引失效!

避坑神技 ✨:如果必须用 %关键词% 模糊查询,可以考虑用 全文索引

sql 复制代码
-- 创建全文索引
CREATE FULLTEXT INDEX idx_title_ft ON books(title);

-- 高效查询包含关键词的记录
SELECT * FROM books
WHERE MATCH(title) AGAINST('数据库' IN NATURAL LANGUAGE MODE);

索引设计的三大灵魂拷问

  1. 是不是索引越多越好?

答:NO!索引像图书馆的分类架,太多了反而难找,而且每次增删改数据都要维护索引,就像每次新书入库都要重新贴标签 贴到崩溃。

  1. 主键为什么最好是自增 ID?

答:InnoDB 聚簇索引如果用随机 ID,会导致叶子节点频繁分裂,就像你整理好的书架忽然插进新书,整个架子都要重排 🗄️。

  1. 为什么不建议用 UUID 做主键?

答:UUID 是随机字符串,索引树会变成"歪脖子树" 🌳,查询效率暴跌!不信你试试给图书馆的书按 UUID 排序?


结语:索引不是银弹,但没有索引是真的完蛋

最后送大家一句我奶奶都能听懂的话:索引就像给自行车装变速器 🚲,平时通勤(简单查询)可能感觉不到,但遇到爬坡(复杂查询)时,有没有变速器直接是两个物种!

但记住,没有万能的索引设计,最好的实践是:用 EXPLAIN 分析 SQL,用监控工具观察慢查询,让数据告诉你答案 📊。

祝大家都能写出飞一般的 SQL,再也不用对着全表扫描掉头发!💇‍♂️💨

(如果觉得有用,记得点赞收藏哦~ 👇)

相关推荐
学历真的很重要1 小时前
VsCode+Roo Code+Gemini 2.5 Pro+Gemini Balance AI辅助编程环境搭建(理论上通过多个Api Key负载均衡达到无限免费Gemini 2.5 Pro)
前端·人工智能·vscode·后端·语言模型·负载均衡·ai编程
+VX:Fegn08952 小时前
计算机毕业设计|基于springboot + vue心理健康管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计
狂炫冰美式4 小时前
不谈技术,搞点文化 🧀 —— 从复活一句明代残诗破局产品迭代
前端·人工智能·后端
databook4 小时前
数据会说谎?三大推断方法帮你“审问”数据真相
后端·python·数据分析
代码栈上的思考5 小时前
深入解析Spring IoC核心与关键注解
java·后端·spring
expect7g6 小时前
Paimon源码解读 -- Compaction-2.KeyValueFileWriterFactory
大数据·后端·flink
小灰灰搞电子6 小时前
Rust 动态分发(dyn Trait)详解
开发语言·后端·rust
码事漫谈6 小时前
深入剖析进程、线程与虚拟内存
后端
码事漫谈6 小时前
MFC核心架构深度解析
后端