什么是数据库范式，为什么要反范式？

小雷土豆丝2024-06-27 8:36

一、典型回答

数据库范式其实是数据库的设计上的一些规范，这些规范可以让数据库的设计更加简洁、清晰，同时也会更好的保证一致性。

二、三范式

第一范式（1NF）：数据库表中的属性的原子性，要求属性具有原子性，不可被拆分。比如：地址如果都细化拆分为省、市、街道、小区等等多个字段，这就是符合第一范式的，如果地址就是一个字段，那就不符合了。

第二范式（2NF）：数据库表中的每个实例或记录必须可以被唯一区分，说白了就是要有主键，其他的字段都依赖于主键。

第三范式（3NF）：任何非主属性不依赖于其他非主属性，也就是说，非主键外的所有字段必须互不依赖。

如果我们在做表结构设计的时候，完全遵守数据库三范式，确实可以避免一些写时异常，提升一些写入性能，但是同时也会丢失一些读取性能。因为在遵守范式的数据库设计中，表中不能有任何冗余字段，这就使查询的时候就会经常有多表关联查询，这无疑是比较耗时的，于是就有了反范式化。所谓反范式化是一种针对遵从设计范式的数据库的性能优化策略。也就是说，反范式化不等于非范式化，反范式化一定发生在满足设计的基础之上。前者相当于遵守所有规则，再进行局部调整。

比如：我们可以在表中增加一些冗余字段，方便我们进行数据查询，而不再需要经常做多表join，但同时，这也带来一个问题，那就是这些冗余字段之间的一致性如何保证？这个问题本来在遵守范式的设计中是不会有的，一旦做了反范式，那就需要开发者自行解决了。

反范式其实本质上是软件开发中一个比较典型的方案，那就是"空间换时间"，通过做一些数据冗余，来提升查询速度。在互联网业务中，比较典型的就是数据量大，并发高，并且通常查询的频率要远高于写入的频率，所以适当的做一些反范式，通过一些字段的冗余，可以提升查询性能，降低响应时长，从而提升并发度。

参考：Hollis