数据库小册(1)

1. 关系型数据库主要考点

关系型数据库:

  1. 架构
  2. 索引
  3. 语法
  4. 理论规范

2. 如何设计一个关系型数据库

设计即模块划分。

数据库最主要的功能是存储我们的数据,所以需要一个存储的文件系统

我们要把涉及到的物流数据提供逻辑的形式给组织和表示出来,这是我们就用到了程序的存储管理模块。

为了更快更好的提升我们程序的效率,我们普遍的做法是引入缓存机制,把取出来的数据放入缓存当中,这样我们就可以减少从数据库读取IO消耗,加快效率。

我们还需要给外界提供可以读取我们数据库指令和可读的SQL语句,这样我们就需要一个SQL解析器

这时候为了进一步去提升SQL执行效率,我们将SQL缓存到缓存里面,将编译好的SQL放入缓存中。

此外我们还需要注意设计的缓存不宜过大,算法里面还需要有淘汰机制,淘汰了一些不常用的数据。执行的SQL操作也需要记录下来,方便我们做数据库的主从同步或灾难恢复。还需要给用户数据管理的私密空间和权限划分。还需要考虑异常的发生处理,因此引入了容灾机制。当我们数据库挂了,这时候应该怎么办?要恢复到什么程度?这些都需要设计。而且为了进一步提升查询效率,以及让数据库支持并发,我们还需要引入最能突出数据库特性的锁和索引这两个模块。

注意:

如何优化存储效能,我们都知道处理数据肯定不可以在磁盘中去执行,而是让程序其加载到程序空间的内存去做。此外,为了执行效率,我们需要尽可能减少IO,如果频繁的去数据库逐行查找并放回,那么频繁的IO会让数据库执行效率低下,同时一次IO读取一行或多行数据所花费的时间没有区别。所以为了提升效率,一次去读取多行,这样来看行就失去了它的意义,所以数据库中把块或页作为存储数据的单元格。

3. 为什么需要使用索引?

首先我们需要做一个调研,用最简单的方法进行对数据库的查询,即对数据库进行全表扫描,对整个数据库表全部或分批次的进行扫描并加载到内存中,逐个去加载,轮询直到找到我们的目标,这种方法普遍被认为十分慢,但是是在所有情况下都这么慢吗?

存在即是合理,当我们的数据库里面的数据只有很少比如几十行作用,使用全表扫描肯定比通过索引来的快。

对于绝大多数情况来说,我们都需要避免全表扫描,提升我们的效率,这时候索引就诞生了。索引就类型于字典,通过索引来大幅度提升查询效率。

那什么是索引呢?通过上面的分析,我们知道索引即是把记录限定到一定查询范围内的字段。那么主键对我们来说就是一个很好的切入点,包括唯一键和普通键也是可以的。

那么怎么才可以让我们的查找更加高效呢?这时候就应该引入数据结构来帮助我们了。可以是二叉树,平衡二叉树,红黑树,B树,B+树,一些hash结构。而Mysql里面主要是通过B+数实现的。

相关推荐
静听山水4 小时前
StarRocks高级特性
数据库
范纹杉想快点毕业4 小时前
从单片机基础到程序框架:全方位技术深度解析
数据库·mongodb
晚风_END4 小时前
Linux|操作系统|elasticdump的二进制方式部署
运维·服务器·开发语言·数据库·jenkins·数据库开发·数据库架构
devmoon4 小时前
Polkadot SDK 自定义 Pallet Benchmark 指南:生成并接入 Weight
开发语言·网络·数据库·web3·区块链·波卡
数据知道4 小时前
PostgreSQL 故障排查:紧急排查与 SQL 熔断处理(CPU 占用 100% 等情况)
数据库·sql·postgresql
静听山水4 小时前
Redis的Pipeline (管道)
数据库·redis·php
数据知道4 小时前
PostgreSQL 性能优化: I/O 瓶颈分析,以及如何提高数据库的 I/O 性能?
数据库·postgresql·性能优化
繁华落尽,寻一世真情5 小时前
【基于 AI 的智能小说创作助手】MuMuAINovel-sqlite 基于 AI 的智能小说创作助手
数据库·人工智能·sqlite
TOPGO智能5 小时前
在腾讯CloudStudio上成功部署Moltbot接入飞书
数据库
云边有个稻草人5 小时前
关系数据库替换用金仓:数据迁移过程中的完整性与一致性风险
数据库·国产数据库·kingbasees·金仓数据库·关系数据库替换用金仓