MySQL存储引擎详述:InnoDB为何胜出?

MySQL作为当前最流行的开源关系型数据库之一,其强大的功能和良好的性能使其广泛应用于各种规模的应用系统中。其中,存储引擎的设计理念是MySQL数据库灵活高效的关键所在。

一、什么是存储引擎

存储引擎是MySQL架构的重要组成部分,负责MySQL中数据的存储和提供了视图,存储过程等高级服务。简单来说,存储引擎就是数据库底层的引擎,用于处理SQL命令和底层的数据操作。不同的存储引擎支持不同的功能,可以根据应用场景选择最适合的存储引擎。

二、MySQL常见存储引擎

从MySQL 5.5版本开始,默认的存储引擎由MyISAM改为InnoDB。常见的存储引擎及其特点如下:

InnoDB

InnoDB是MySQL 5.5版本后的默认存储引擎,完全支持ACID事务特性和行级锁,实现了SQL标准的四种隔离级别,支持外键约束。InnoDB使用聚集索引存放数据,在主键查询上有很高的效率。是当前使用最广泛的存储引擎。

MyISAM

MyISAM是MySQL早期的默认存储引擎,占用资源较少,读取数据快。但是不支持事务和行级锁,无外键约束等特性,已经逐渐被InnoDB取代。

Memory

Memory存储引擎将表中的数据存储在RAM中,因此读写速度非常快。但是重启服务后,表中数据会丢失。使用场景一般是临时存储数据等。

CSV

CSV存储引擎将表的数据存储在文本文件中,其格式为逗号分隔值文件,可以方便地将数据导出为文件。相比其他存储引擎,它的性能和功能都较差。

Archive

Archive存储引擎只支持INSERT和SELECT操作,用于日志存档等只需读取的应用场景。

Federated

Federated存储引擎将表的数据存储在远程的MySQL服务器中,本地只是一个指向远程表的指针。

除此之外,MySQL还有NDB、Maria等其他存储引擎,但使用较少。从应用场景来看,绝大多数情况下都应该选择InnoDB存储引擎。

三、曾经InnoDB vs MyISAM

事务支持

InnoDB 支持事务,是有锁机制的,能够确保数据的一致性和完整性。MyISAM 不支持事务,在执行查询时允许其他用户对表进行插入、更新和删除操作,可能会导致数据不一致。这是MySQL将默认存储引擎从MyISAM变成InnoDB的重要原因之一。

外键约束

InnoDB 支持外键约束,能保证数据的参照完整性。而 MyISAM 不支持外键,在进行数据操作时不能保证关联数据的完整性,可能会出现数据孤立或数据丢失。

索引类型

InnoDB 使用聚集索引,数据文件本身按主键的顺序进行存放,所以主键查询效率很高。MyISAM 使用非聚集索引,数据文件是独立于索引文件的,所以需要根据索引文件中的指针,再去数据文件中查找对应的数据。InnoDB 辅助索引需要两次查找,MyISAM 无论是主键索引还是辅助索引都只需要一次查找。

计数效率

InnoDB 存储引擎需要实时维护数据行数,执行 SELECT COUNT(*) 时需要进行全表扫描。而 MyISAM 存储引擎在设计上借助了一个变量来存储表的具体行数,因此可以快速返回表行数。 当然这里说的SELECT COUNT(*) 是没有增加WHERE条件,如果增加了WHERE条件MyISAM还是需要遍历的。

锁粒度

InnoDB 的最小锁粒度是行锁,支持行级锁定,可以有效地支持高并发操作。MyISAM 最小锁粒度是表锁,只支持全表锁定,在进行读写操作时需要获取表级别的锁,并发性能差。这也是MySQL将默认引擎从MyISAM变成InnoDB的重要原因之一。

p.s.另外在崩溃恢复能力、热备份、克隆等方面两者也有不少差别。

四、如今InnoDB vs MyISAM

  • 从5.7开始,InnoDB更快
  • 在8.0中InnoDB性能不断提高
  • InnoDB 中整个事务层得到了极大的改进
  • 原本临时表MyISAM 更好,在8中磁盘内部临时表只支持InnoDB
  • 原本批量加载时MyISAM的性能优于InnoDB,禁用 InnoDB持久性后InnoDB更快
  • 原本COUNT(*)MyISAM 的速度更快,现在情况已不再如此。在多核环境下InnoDB更快
  • 从MySQL 5.6开始,InnoDB 支持全文搜索 (FTS),从那时起它的扩展能力比MyISAM好3倍
  • 云管理的MySQL服务均不包含MyISAM。Oracle云基础设施中的MySQL数据库服务也是如此。

官方blog的大牛也在建议大家都使用InnoDB,InnoDB已经优于MyISAM

比如官方这个测试报告,在并发数据的增加InnoDB吞吐量会趋于稳定,而MyISAM在高并发下还会有所下降。当然此时还有新建与修改的操作时MyISAM是表级锁就会更慢了。

五、应用场景

1)InnoDB 适用场景

事务支持应用

InnoDB 支持事务处理,符合 ACID 原则,能够保证数据的原子性、一致性、隔离性和持久性,适合需要事务支持的应用场景。

高并发读写环境

InnoDB 采用行级锁定,支持非锁定并发读,可以有效提高多用户并发读写操作的性能,适合高并发读写的应用环境。

数据完整性要求高

InnoDB 支持外键约束,能有效保证数据的参照完整性,防止出现数据孤立或丢失情况,适合对数据完整性要求较高的场合。

2)MyISAM 适用场景

读密集型应用

MyISAM 只有表级锁,读操作不会阻塞其他读,而只是阻塞写,因此适合读密集的操作环境。

事务非必需环境

MyISAM 不支持事务和外键,但可以节省系统开销,如果应用对事务完整性要求不高,可以选择 MyISAM。

六、选择建议

对于大多数应用场景,我们都建议使用InnoDB存储引擎,因为它支持事务、外键约束等高级特性,而且也能够获得较好的性能表现。只有在不需要事务支持,且对全文索引有较高需求的场景下,才考虑使用MyISAM存储引擎。正如上面说的在多核CPU的情况下COUNT(*)加条件 InnoDB优于MyISAM,如果硬盘条件一般的情况下或者别的情况下MyISAM在查询的速度上应该还是会比InnoDB快。

MySQL从5.5版本开始就将InnoDB设置为默认的存储引擎,这也从侧面体现了InnoDB在当前的重要地位。另外官方Blog文章也表达出在高并发场景下InnoDB的表现也会优于MyISAM。当然,根据具体的应用需求来选择合适的存储引擎,才是最佳的实践方式。

相关推荐
桀桀桀桀桀桀12 分钟前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥1 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452001 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina2 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina2 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j
尘浮生2 小时前
Java项目实战II基于Spring Boot的光影视频平台(开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·maven·intellij-idea
威哥爱编程2 小时前
SQL Server 数据太多如何优化
数据库·sql·sqlserver
小华同学ai2 小时前
AJ-Report:一款开源且非常强大的数据可视化大屏和报表工具
数据库·信息可视化·开源
Acrelhuang3 小时前
安科瑞5G基站直流叠光监控系统-安科瑞黄安南
大数据·数据库·数据仓库·物联网
十叶知秋3 小时前
【jmeter】jmeter的线程组功能的详细介绍
数据库·jmeter·性能测试