MySQL存储引擎详述:InnoDB为何胜出?

MySQL作为当前最流行的开源关系型数据库之一,其强大的功能和良好的性能使其广泛应用于各种规模的应用系统中。其中,存储引擎的设计理念是MySQL数据库灵活高效的关键所在。

一、什么是存储引擎

存储引擎是MySQL架构的重要组成部分,负责MySQL中数据的存储和提供了视图,存储过程等高级服务。简单来说,存储引擎就是数据库底层的引擎,用于处理SQL命令和底层的数据操作。不同的存储引擎支持不同的功能,可以根据应用场景选择最适合的存储引擎。

二、MySQL常见存储引擎

从MySQL 5.5版本开始,默认的存储引擎由MyISAM改为InnoDB。常见的存储引擎及其特点如下:

InnoDB

InnoDB是MySQL 5.5版本后的默认存储引擎,完全支持ACID事务特性和行级锁,实现了SQL标准的四种隔离级别,支持外键约束。InnoDB使用聚集索引存放数据,在主键查询上有很高的效率。是当前使用最广泛的存储引擎。

MyISAM

MyISAM是MySQL早期的默认存储引擎,占用资源较少,读取数据快。但是不支持事务和行级锁,无外键约束等特性,已经逐渐被InnoDB取代。

Memory

Memory存储引擎将表中的数据存储在RAM中,因此读写速度非常快。但是重启服务后,表中数据会丢失。使用场景一般是临时存储数据等。

CSV

CSV存储引擎将表的数据存储在文本文件中,其格式为逗号分隔值文件,可以方便地将数据导出为文件。相比其他存储引擎,它的性能和功能都较差。

Archive

Archive存储引擎只支持INSERT和SELECT操作,用于日志存档等只需读取的应用场景。

Federated

Federated存储引擎将表的数据存储在远程的MySQL服务器中,本地只是一个指向远程表的指针。

除此之外,MySQL还有NDB、Maria等其他存储引擎,但使用较少。从应用场景来看,绝大多数情况下都应该选择InnoDB存储引擎。

三、曾经InnoDB vs MyISAM

事务支持

InnoDB 支持事务,是有锁机制的,能够确保数据的一致性和完整性。MyISAM 不支持事务,在执行查询时允许其他用户对表进行插入、更新和删除操作,可能会导致数据不一致。这是MySQL将默认存储引擎从MyISAM变成InnoDB的重要原因之一。

外键约束

InnoDB 支持外键约束,能保证数据的参照完整性。而 MyISAM 不支持外键,在进行数据操作时不能保证关联数据的完整性,可能会出现数据孤立或数据丢失。

索引类型

InnoDB 使用聚集索引,数据文件本身按主键的顺序进行存放,所以主键查询效率很高。MyISAM 使用非聚集索引,数据文件是独立于索引文件的,所以需要根据索引文件中的指针,再去数据文件中查找对应的数据。InnoDB 辅助索引需要两次查找,MyISAM 无论是主键索引还是辅助索引都只需要一次查找。

计数效率

InnoDB 存储引擎需要实时维护数据行数,执行 SELECT COUNT(*) 时需要进行全表扫描。而 MyISAM 存储引擎在设计上借助了一个变量来存储表的具体行数,因此可以快速返回表行数。 当然这里说的SELECT COUNT(*) 是没有增加WHERE条件,如果增加了WHERE条件MyISAM还是需要遍历的。

锁粒度

InnoDB 的最小锁粒度是行锁,支持行级锁定,可以有效地支持高并发操作。MyISAM 最小锁粒度是表锁,只支持全表锁定,在进行读写操作时需要获取表级别的锁,并发性能差。这也是MySQL将默认引擎从MyISAM变成InnoDB的重要原因之一。

p.s.另外在崩溃恢复能力、热备份、克隆等方面两者也有不少差别。

四、如今InnoDB vs MyISAM

  • 从5.7开始,InnoDB更快
  • 在8.0中InnoDB性能不断提高
  • InnoDB 中整个事务层得到了极大的改进
  • 原本临时表MyISAM 更好,在8中磁盘内部临时表只支持InnoDB
  • 原本批量加载时MyISAM的性能优于InnoDB,禁用 InnoDB持久性后InnoDB更快
  • 原本COUNT(*)MyISAM 的速度更快,现在情况已不再如此。在多核环境下InnoDB更快
  • 从MySQL 5.6开始,InnoDB 支持全文搜索 (FTS),从那时起它的扩展能力比MyISAM好3倍
  • 云管理的MySQL服务均不包含MyISAM。Oracle云基础设施中的MySQL数据库服务也是如此。

官方blog的大牛也在建议大家都使用InnoDB,InnoDB已经优于MyISAM

比如官方这个测试报告,在并发数据的增加InnoDB吞吐量会趋于稳定,而MyISAM在高并发下还会有所下降。当然此时还有新建与修改的操作时MyISAM是表级锁就会更慢了。

五、应用场景

1)InnoDB 适用场景

事务支持应用

InnoDB 支持事务处理,符合 ACID 原则,能够保证数据的原子性、一致性、隔离性和持久性,适合需要事务支持的应用场景。

高并发读写环境

InnoDB 采用行级锁定,支持非锁定并发读,可以有效提高多用户并发读写操作的性能,适合高并发读写的应用环境。

数据完整性要求高

InnoDB 支持外键约束,能有效保证数据的参照完整性,防止出现数据孤立或丢失情况,适合对数据完整性要求较高的场合。

2)MyISAM 适用场景

读密集型应用

MyISAM 只有表级锁,读操作不会阻塞其他读,而只是阻塞写,因此适合读密集的操作环境。

事务非必需环境

MyISAM 不支持事务和外键,但可以节省系统开销,如果应用对事务完整性要求不高,可以选择 MyISAM。

六、选择建议

对于大多数应用场景,我们都建议使用InnoDB存储引擎,因为它支持事务、外键约束等高级特性,而且也能够获得较好的性能表现。只有在不需要事务支持,且对全文索引有较高需求的场景下,才考虑使用MyISAM存储引擎。正如上面说的在多核CPU的情况下COUNT(*)加条件 InnoDB优于MyISAM,如果硬盘条件一般的情况下或者别的情况下MyISAM在查询的速度上应该还是会比InnoDB快。

MySQL从5.5版本开始就将InnoDB设置为默认的存储引擎,这也从侧面体现了InnoDB在当前的重要地位。另外官方Blog文章也表达出在高并发场景下InnoDB的表现也会优于MyISAM。当然,根据具体的应用需求来选择合适的存储引擎,才是最佳的实践方式。

相关推荐
IvorySQL2 小时前
PostgreSQL 分区表的 ALTER TABLE 语句执行机制解析
数据库·postgresql·开源
·云扬·2 小时前
MySQL 8.0 Redo Log 归档与禁用实战指南
android·数据库·mysql
IT邦德2 小时前
Oracle 26ai DataGuard 搭建(RAC到单机)
数据库·oracle
惊讶的猫3 小时前
redis分片集群
数据库·redis·缓存·分片集群·海量数据存储·高并发写
不爱缺氧i3 小时前
完全卸载MariaDB
数据库·mariadb
纤纡.3 小时前
Linux中SQL 从基础到进阶:五大分类详解与表结构操作(ALTER/DROP)全攻略
linux·数据库·sql
jiunian_cn3 小时前
【Redis】渐进式遍历
数据库·redis·缓存
橙露4 小时前
Spring Boot 核心原理:自动配置机制与自定义 Starter 开发
java·数据库·spring boot
冰暮流星4 小时前
sql语言之分组语句group by
java·数据库·sql
符哥20084 小时前
Ubuntu 常用指令集大全(附实操实例)
数据库·ubuntu·postgresql