MySQL作为当前最流行的开源关系型数据库之一,其强大的功能和良好的性能使其广泛应用于各种规模的应用系统中。其中,存储引擎的设计理念是MySQL数据库灵活高效的关键所在。
一、什么是存储引擎
存储引擎是MySQL架构的重要组成部分,负责MySQL中数据的存储和提供了视图,存储过程等高级服务。简单来说,存储引擎就是数据库底层的引擎,用于处理SQL命令和底层的数据操作。不同的存储引擎支持不同的功能,可以根据应用场景选择最适合的存储引擎。
二、MySQL常见存储引擎
从MySQL 5.5版本开始,默认的存储引擎由MyISAM改为InnoDB。常见的存储引擎及其特点如下:
InnoDB
InnoDB是MySQL 5.5版本后的默认存储引擎,完全支持ACID事务特性和行级锁,实现了SQL标准的四种隔离级别,支持外键约束。InnoDB使用聚集索引存放数据,在主键查询上有很高的效率。是当前使用最广泛的存储引擎。
MyISAM
MyISAM是MySQL早期的默认存储引擎,占用资源较少,读取数据快。但是不支持事务和行级锁,无外键约束等特性,已经逐渐被InnoDB取代。
Memory
Memory存储引擎将表中的数据存储在RAM中,因此读写速度非常快。但是重启服务后,表中数据会丢失。使用场景一般是临时存储数据等。
CSV
CSV存储引擎将表的数据存储在文本文件中,其格式为逗号分隔值文件,可以方便地将数据导出为文件。相比其他存储引擎,它的性能和功能都较差。
Archive
Archive存储引擎只支持INSERT和SELECT操作,用于日志存档等只需读取的应用场景。
Federated
Federated存储引擎将表的数据存储在远程的MySQL服务器中,本地只是一个指向远程表的指针。
除此之外,MySQL还有NDB、Maria等其他存储引擎,但使用较少。从应用场景来看,绝大多数情况下都应该选择InnoDB存储引擎。
三、曾经InnoDB vs MyISAM
事务支持
InnoDB 支持事务,是有锁机制的,能够确保数据的一致性和完整性。MyISAM 不支持事务,在执行查询时允许其他用户对表进行插入、更新和删除操作,可能会导致数据不一致。这是MySQL将默认存储引擎从MyISAM变成InnoDB的重要原因之一。
外键约束
InnoDB 支持外键约束,能保证数据的参照完整性。而 MyISAM 不支持外键,在进行数据操作时不能保证关联数据的完整性,可能会出现数据孤立或数据丢失。
索引类型
InnoDB 使用聚集索引,数据文件本身按主键的顺序进行存放,所以主键查询效率很高。MyISAM 使用非聚集索引,数据文件是独立于索引文件的,所以需要根据索引文件中的指针,再去数据文件中查找对应的数据。InnoDB 辅助索引需要两次查找,MyISAM 无论是主键索引还是辅助索引都只需要一次查找。
计数效率
InnoDB 存储引擎需要实时维护数据行数,执行 SELECT COUNT(*) 时需要进行全表扫描。而 MyISAM 存储引擎在设计上借助了一个变量来存储表的具体行数,因此可以快速返回表行数。 当然这里说的SELECT COUNT(*) 是没有增加WHERE条件,如果增加了WHERE条件MyISAM还是需要遍历的。
锁粒度
InnoDB 的最小锁粒度是行锁,支持行级锁定,可以有效地支持高并发操作。MyISAM 最小锁粒度是表锁,只支持全表锁定,在进行读写操作时需要获取表级别的锁,并发性能差。这也是MySQL将默认引擎从MyISAM变成InnoDB的重要原因之一。
p.s.另外在崩溃恢复能力、热备份、克隆等方面两者也有不少差别。
四、如今InnoDB vs MyISAM
- 从5.7开始,InnoDB更快
- 在8.0中InnoDB性能不断提高
- InnoDB 中整个事务层得到了极大的改进
- 原本临时表MyISAM 更好,在8中磁盘内部临时表只支持InnoDB
- 原本批量加载时MyISAM的性能优于InnoDB,禁用 InnoDB持久性后InnoDB更快
- 原本COUNT(*)MyISAM 的速度更快,现在情况已不再如此。在多核环境下InnoDB更快
- 从MySQL 5.6开始,InnoDB 支持全文搜索 (FTS),从那时起它的扩展能力比MyISAM好3倍
- 云管理的MySQL服务均不包含MyISAM。Oracle云基础设施中的MySQL数据库服务也是如此。
官方blog的大牛也在建议大家都使用InnoDB,InnoDB已经优于MyISAM
比如官方这个测试报告,在并发数据的增加InnoDB吞吐量会趋于稳定,而MyISAM在高并发下还会有所下降。当然此时还有新建与修改的操作时MyISAM是表级锁就会更慢了。
五、应用场景
1)InnoDB 适用场景
事务支持应用
InnoDB 支持事务处理,符合 ACID 原则,能够保证数据的原子性、一致性、隔离性和持久性,适合需要事务支持的应用场景。
高并发读写环境
InnoDB 采用行级锁定,支持非锁定并发读,可以有效提高多用户并发读写操作的性能,适合高并发读写的应用环境。
数据完整性要求高
InnoDB 支持外键约束,能有效保证数据的参照完整性,防止出现数据孤立或丢失情况,适合对数据完整性要求较高的场合。
2)MyISAM 适用场景
读密集型应用
MyISAM 只有表级锁,读操作不会阻塞其他读,而只是阻塞写,因此适合读密集的操作环境。
事务非必需环境
MyISAM 不支持事务和外键,但可以节省系统开销,如果应用对事务完整性要求不高,可以选择 MyISAM。
六、选择建议
对于大多数应用场景,我们都建议使用InnoDB存储引擎,因为它支持事务、外键约束等高级特性,而且也能够获得较好的性能表现。只有在不需要事务支持,且对全文索引有较高需求的场景下,才考虑使用MyISAM存储引擎。正如上面说的在多核CPU的情况下COUNT(*)加条件 InnoDB优于MyISAM,如果硬盘条件一般的情况下或者别的情况下MyISAM在查询的速度上应该还是会比InnoDB快。
MySQL从5.5版本开始就将InnoDB设置为默认的存储引擎,这也从侧面体现了InnoDB在当前的重要地位。另外官方Blog文章也表达出在高并发场景下InnoDB的表现也会优于MyISAM。当然,根据具体的应用需求来选择合适的存储引擎,才是最佳的实践方式。