MSQL-聚簇索引与非聚簇索引的比较

聚簇索引详解

InnoDB 的聚簇索引特性

  1. 表数据本身就是聚簇索引

    • 数据行实际存储在聚簇索引的叶子节点中
    • "表就是索引,索引就是表"的结构
    • 每个InnoDB表有且只有一个聚簇索引

聚簇索引的叶子节点存储的是:真实数据

  1. 主键作为聚簇索引

    sql 复制代码
    CREATE TABLE users (
        id INT PRIMARY KEY,  -- 此主键自动成为聚簇索引
        name VARCHAR(100),
        email VARCHAR(100)
    );
  2. 无显式主键时的处理

    • 如果表没有定义主键,InnoDB会选择一个唯一的非空索引代替
    • 如果没有这样的索引,InnoDB会隐式创建一个6字节的ROWID作为聚簇索引

聚簇索引的优势

  • 高效的主键查询:直接通过B+树定位到数据行
  • 范围查询高效:连续的主键值物理存储也相邻
  • 覆盖索引优势:需要的数据都在索引中时可避免二次查找

聚簇索引的缺点

  • 插入速度依赖插入顺序:最好按主键顺序插入
  • 更新主键代价高:可能导致行移动
  • 全表扫描可能较慢:当主键不连续时

非聚簇索引(二级索引)

非聚簇索引结构

  1. 索引结构与数据分离

    • 索引B+树的叶子节点不包含完整行数据
    • 只存储主键值(或ROWID)
  2. 查找过程需要回表

    sql 复制代码
    二级索引查找 -> 找到主键 -> 通过主键到聚簇索引中查找完整数据

非聚簇索引示例

sql 复制代码
CREATE INDEX idx_name ON users(name);  -- 创建非聚簇索引

非聚簇索引的特点

  • 支持多个:一个表可以有多个非聚簇索引
  • 存储内容:索引列值 + 主键值
  • 覆盖索引优化:如果查询的列都在索引中,可避免回表

非**聚簇索引的叶子节点存储的是:**索引列值 + 主键值

MyISAM 的非聚簇索引

MyISAM 存储引擎使用的是纯非聚簇索引结构:

  • 数据.MYD文件:存储实际数据行
  • 索引.MYI文件:存储所有索引
  • 索引叶子节点存储的是数据行指针(物理地址)

对比总结

特性 InnoDB聚簇索引 InnoDB非聚簇索引 MyISAM非聚簇索引
数据存储位置 索引叶子节点 单独存储,引用主键 单独.MYD文件
索引数量 每表1个 多个 多个
叶子节点内容 完整数据行 主键值 数据文件指针
查找过程 直接获取数据 需要回表 直接通过指针访问数据
主键查询性能 最优(O(1)~O(logN)) 需要两次查找 需一次索引查找
范围查询性能 优秀(顺序I/O) 一般 一般

MyISAM 的非聚簇索引:叶子节点存储的数据文件指针(相对于InnoDB非聚簇索引,避免了回表)

实际应用建议

  1. 合理设计主键:短、有序(如自增INT),利用好聚簇索引特性

  2. 避免随机主键:如UUID会导致大量页分裂和碎片

  3. 覆盖索引优化:使查询只需访问索引避免回表

思考:

  1. 多实例应用从分布式ID服务获取ID后,由于网络延迟、处理速度差异等原因,后获取到的ID可能先提交事务,导致数据库中ID不是严格递增的,而是呈现"插入"形式(即小ID的记录可能出现在大ID之后)

(其实业务能容忍小范围的不一致)

方案1:业务逻辑的提交操作,尽量靠后,避免提前获取id?

相关推荐
Francek Chen42 分钟前
【大数据存储与管理】实验3:熟悉常用的HBase操作
大数据·数据库·分布式·hbase
ffqws_44 分钟前
Spring @Transactional 注解详解:从入门到避坑
java·数据库·后端·spring
努力努力再努力wz1 小时前
【MySQL 进阶系列】C/C++ 如何通过客户端库访问 MySQL?从连接原理到 API 调用流程详解(附完整demo代码)
服务器·c语言·数据结构·数据库·c++·b树·mysql
七夜zippoe1 小时前
DolphinDB分布式表:创建与管理
数据库·分布式·维度·dolphindb·数据写入
何中应2 小时前
Redis集群搭建
数据库·redis·缓存
KmSH8umpK2 小时前
Redis分布式锁进阶第十七篇
数据库·redis·分布式
重生之小比特2 小时前
【MySQL 数据库】表的操作
数据库·mysql
雷工笔记3 小时前
MES 系统 设备保养管理模块详细设计方案
运维·数据库
晚风_END5 小时前
Linux|操作系统|zfs文件系统的使用详解
linux·运维·服务器·数据库·postgresql·性能优化·宽度优先
晚风_END11 小时前
Linux|操作系统|最新版openzfs编译记录
linux·运维·服务器·数据库·spring·中间件·个人开发