MSQL-聚簇索引与非聚簇索引的比较

聚簇索引详解

InnoDB 的聚簇索引特性

  1. 表数据本身就是聚簇索引

    • 数据行实际存储在聚簇索引的叶子节点中
    • "表就是索引,索引就是表"的结构
    • 每个InnoDB表有且只有一个聚簇索引

聚簇索引的叶子节点存储的是:真实数据

  1. 主键作为聚簇索引

    sql 复制代码
    CREATE TABLE users (
        id INT PRIMARY KEY,  -- 此主键自动成为聚簇索引
        name VARCHAR(100),
        email VARCHAR(100)
    );
  2. 无显式主键时的处理

    • 如果表没有定义主键,InnoDB会选择一个唯一的非空索引代替
    • 如果没有这样的索引,InnoDB会隐式创建一个6字节的ROWID作为聚簇索引

聚簇索引的优势

  • 高效的主键查询:直接通过B+树定位到数据行
  • 范围查询高效:连续的主键值物理存储也相邻
  • 覆盖索引优势:需要的数据都在索引中时可避免二次查找

聚簇索引的缺点

  • 插入速度依赖插入顺序:最好按主键顺序插入
  • 更新主键代价高:可能导致行移动
  • 全表扫描可能较慢:当主键不连续时

非聚簇索引(二级索引)

非聚簇索引结构

  1. 索引结构与数据分离

    • 索引B+树的叶子节点不包含完整行数据
    • 只存储主键值(或ROWID)
  2. 查找过程需要回表

    sql 复制代码
    二级索引查找 -> 找到主键 -> 通过主键到聚簇索引中查找完整数据

非聚簇索引示例

sql 复制代码
CREATE INDEX idx_name ON users(name);  -- 创建非聚簇索引

非聚簇索引的特点

  • 支持多个:一个表可以有多个非聚簇索引
  • 存储内容:索引列值 + 主键值
  • 覆盖索引优化:如果查询的列都在索引中,可避免回表

非**聚簇索引的叶子节点存储的是:**索引列值 + 主键值

MyISAM 的非聚簇索引

MyISAM 存储引擎使用的是纯非聚簇索引结构:

  • 数据.MYD文件:存储实际数据行
  • 索引.MYI文件:存储所有索引
  • 索引叶子节点存储的是数据行指针(物理地址)

对比总结

特性 InnoDB聚簇索引 InnoDB非聚簇索引 MyISAM非聚簇索引
数据存储位置 索引叶子节点 单独存储,引用主键 单独.MYD文件
索引数量 每表1个 多个 多个
叶子节点内容 完整数据行 主键值 数据文件指针
查找过程 直接获取数据 需要回表 直接通过指针访问数据
主键查询性能 最优(O(1)~O(logN)) 需要两次查找 需一次索引查找
范围查询性能 优秀(顺序I/O) 一般 一般

MyISAM 的非聚簇索引:叶子节点存储的数据文件指针(相对于InnoDB非聚簇索引,避免了回表)

实际应用建议

  1. 合理设计主键:短、有序(如自增INT),利用好聚簇索引特性

  2. 避免随机主键:如UUID会导致大量页分裂和碎片

  3. 覆盖索引优化:使查询只需访问索引避免回表

思考:

  1. 多实例应用从分布式ID服务获取ID后,由于网络延迟、处理速度差异等原因,后获取到的ID可能先提交事务,导致数据库中ID不是严格递增的,而是呈现"插入"形式(即小ID的记录可能出现在大ID之后)

(其实业务能容忍小范围的不一致)

方案1:业务逻辑的提交操作,尽量靠后,避免提前获取id?

相关推荐
PEI0420 分钟前
MVCC(多版本并发控制)
java·开发语言·数据库
码出财富29 分钟前
事务管理的选择:为何 @Transactional 并非万能,TransactionTemplate 更值得信赖
数据库
ST.J37 分钟前
SQL与数据库笔记
数据库·笔记·sql
jllws12 小时前
数据库原理及应用_数据库管理和保护_第5章数据库的安全性_理论部分
数据库
2302_809798322 小时前
【Redis】缓存的穿透、击穿和雪崩
数据库·redis·缓存
花哥码天下3 小时前
MySQL事务日志类型及作用解析
数据库·mysql
手握风云-3 小时前
MySQL数据库精研之旅第十七期:深度拆解事务核心(下)
数据库·mysql
亮子AI3 小时前
【PostgreSQL】如何实现主从复制?
数据库·postgresql
杏花春雨江南4 小时前
可重复读 是否“100%”地解决幻读?
数据库·mysql