一.额外知识
1.为什么内存读取比硬盘读取快
在了解mysql和redis的区别之前,先来讨论一下额外的知识:为什么内存读取比硬盘读取快?
先看一个结论:内存读取至少比硬盘读取快10万倍首先机械硬盘基本上的速度都在100MB-200MB 之间,SSD硬盘快一点,但是也是在500MB 左右的水准,但是现在DDR4内存 基本上都是50GB-100GB 之间看频率,那这是为什么呢:拿机械硬盘举例,如果cpu要到硬盘里面去拿数据,它得走I/O,然后机械硬盘还得转着找资源,找到了之后把数据写到内存,然后cpu才去内存里面读.
但是cpu如果要的数据在内存里面呢?它先读一级缓存,然后二级缓存,然后三级缓存,最后到内存里面去找,虽然它得走四步,硬盘读取也只比它多了两步调用,但是一级缓存的速度那基本上都是 1000G/s, 这三个缓存用的时间和硬盘读取的时间根本不是一回事儿,差距太大了
了解了为什么内存读取比硬盘读取快,再来看看为什么数据库比硬盘快?
2.为什么数据库比硬盘快
磁盘读取的话有磁道和扇区的一个概念,一个扇区是512byte, 然后每次读东西的时候都是 512byte往外拿,就算只读一个字节的东西一样会给512 ,这个和缓存行的概念是一样的
但是后来硬盘变大了,操作系统定义了一个4K对齐原则:就是每次读取4k,为什么要这样弄呢,因为硬盘大了放的东西就多了,比如:
bash
如果一个学校里面有2000个学生
那么给学号的话是不是只需要4位数就能表示哪个学号是哪个学生了
但是如果有2000000个学生了呢?4位数的学号就不够用了,就得扩大位数
以前512byte的时候,索引4个字节就能搞定了,
但是现在硬盘变大了东西变多了4个字节搞不定了,要么就减少存储空间,
要么就扩大每次读取的数量
4k对齐解决了存储问题,但并没有解决读取速度的问题,因为是有带宽限制的,所以就出现了 SSD硬盘,它比传统的机械硬盘更好,具有快速读写、质量轻、能耗低以及体积小等优点.
4K对齐之后全量IO速度比一开始也快不了多少,那想让读取速度变快的关键在于解决全量 IO 的问题
bash
如果一个盘里面放了一千个文档,想要找到其中的一个文档这很困难,
那如果用一百个文件夹去分类,每个文件夹里面只放部分相似的文档,
比如说Redis的文件夹就放Redis的文档,这样找文档的效率就大大提升了,
同理如果后面文档数量又变大了,变成了100W个那就可以采用文件夹套文件夹的方式去解决
可以理解将数据存放在表里,在表中建立了索引,然后将这一系列索引又放到索引表中,又将一系列的索引表放到了一个B+树中,然后将B+树放到了内存,这样效率就大大提升了,因为操作系统每次读取数据都是 4k 所以目前数据库的设计为数据表和索引表的大小都是4K,如比:
bash查一个数据,它就先判断在哪个区间,然后通过区间去找索引表,然后通过索引找到真正的数据表拿数据 但是硬盘读取就不一样了,它得随机I/O去找数据,有了数据库索引之后,直接就能通过找索引表就能命中数据了,效率大不一样。
总结:
- 硬盘和数据库的读取差距在于索引
- 数据表 -> 索引表 -> B+树
有了数据库的概念之后,那什么是关系型数据库呢?
3.关系型数据库
关系型数据库在建表的时候,必须给出这个表有多少个字段也就是多少列,而且要给出列的类型,给出列的类型之后它在硬盘开辟的空间就已经被定死了,如果存储的时候,建表是 5 个字段,然后只有1个字段有值,另外4个字段为空,那么其 4个字段就会被 0 填满
那么如果表的数据很多的时候,性能会降低吗?这个分两个情况:
- 并发高的时候,会受硬盘带宽的影响,这个和数据多不多没关系,主要是带宽问题
- 看sql的复杂程度,取决于sql ,如果说是行式数据库,完事查 sum 或者是 age 这种,本来就很慢,数据越多越慢
总结:关系型数据库倾向于行级存储
4.内存数据库
因为IO是有瓶颈的,虽然它优化的很好,但是速度还是不够用,所以出现了内存数据库:把数据存储到内存上的数据库,常见的有 Memcached 和 redis 等
Memcached 是 03 年出来的,Redis 是 09 年,虽然两者都是KV存储,但是有一个区别:Memcached的value是没有类型的,而 Redis 有五个基本数据类型,Redis给不同类型提供了很多方法,并且Redis是可以做持久化的,而Memcached没有提供持久化方案
好了,上面讲解了内存读取和硬盘读取速度,以及引入了关系型数据库和非关系型数据库(内存数据库/缓存数据库),下面就来看看关系型数据库Mysql和非关系型数据库Redis的区别
二.数据库类型不同
Mysql是
****关系型数据库
,主要用于存放持久数据,将数据存放在硬盘中,读取速度相对较慢
Redis是NOSQL数据库,即**非关系型数据库
,也是缓存数据库** ,即数据存储在**内存
中,缓存的读取速度快**,能够大大的提高运行效率,但是保存时间有限
**缓存:**数据交换的
缓冲区(cache),
当浏览器执行请求时,首先会对在缓存中进行查找,如果存在就获取,否则,就访问数据库
计算机中内存和硬盘的区别内存具有易失性,只有在当通电系统启动的时候,内存中数据才会存在,当断电之后,内存中数据就不会再存在了,而数据存在硬盘中则不会这样,在硬盘中无论通电与否,数据都可以长期存放在硬盘中
容量不同,内存的容量一般比较小,硬盘的容量一般比较大
速度不同,数据在内存中的读写速度是要比硬盘中快的,在内存中处理数据性能更好
三.作用不同
mysql用于 持久化的存储数据到硬盘, 存储数据量大,功能强大,但是速度较慢
redis用于存储使用较为 频繁的数据到内存中, 存储数据量小,读取速度快, 保存时间有限
**mysql和redis因为需求的不同,一般都是配合使用,比如:**当浏览器执行请求时,首先会在缓存中进行查找(redis中查找),如果存在就获取,否则,就访问数据库,这样减少访问数据库的次数,提高运行效率
四.运行机制
MySQL数据库作为存储的关系型数据库,支持分布式事务,可以保证数据的一致性,相对薄弱的地方在于每次请求访问数据库时,都存在着I/O
操作
,如果反复频繁的访问数据库会产生以下问题:
1.会在
反复链接数据库上花费大量的时间,从而导致
运行效率过慢2.反复的访问数据库也会导致数据库的
负载过高,那么此时缓存的概念就衍生出来了
Redis是基于单线程的,效率比较高, 但不支持分布式事务,在并发访问时可能会出现数据不一致的情况,但是它的
数据的读写速度快于传统的关系型数据库 MySQL: 是因为redis是基于内存操作的,故CPU不是性能瓶颈
,机器的内存和宽带才是Redis的瓶颈
。在实际应用中,Redis 只需要将数据一次性 写入内存中,之后对数据的读取及修改则可以在内存中高效地执行,避免了磁盘寻道时间等硬盘操作时间带来的延迟,从而实现了高速访问、高效处理等功能
五.应用场景不同
MySQL适用于大规模数据存储和复杂查询场景,例如电商、金融、物流等领域,MySQL的事务处理 和数据备份功能可以保证数据的完整性和安全性
Redis适用于高并发读写、数据缓存 和实时计算 等场景,例如社交网络、游戏、广告等领域,Redis的高性能读写 和丰富的数据结构可以提高系统的响应速度和可扩展性
综上所述,MySQL和Redis在数据存储结构、性能表现、数据一致性和使用场景等方面有很大的差异,在选择数据库管理系统时,需要根据实际需求和应用场景进行综合考虑
六.总结
Redis和MySQL都是通过监听端口接受客户端请求,并根据请求类型执行相应的操作,它们的主要区别在于数据存储的方式 和支持的数据结构类型,Redis通过内存存储实现了高速读写,而MySQL通过磁盘存储实现了数据持久化和事务处理