
任何收获都不是偶然,
一点一滴的进步终会让未来的你焕然一新!
从零开始认识redis
- [1 认识redis](#1 认识redis)
- [2 浅谈redis在分布式系统中的应用](#2 浅谈redis在分布式系统中的应用)
- [3 redis的特性](#3 redis的特性)
1 认识redis
redis文档中给了redis清晰的定位:
- redis全程是Remote Dictionary Server(远程字典服务器),指明其储存的结构是"键值对"。
- 作为非关系性数据集成(NoSql)中间件,用更快的速度、更多内存和更高的准确性构建程序。
NoSQL(Not Only SQL) 并不是否定 SQL,而是补充传统关系型数据库的一种新范式。
✅ NoSQL 特征:
| 特性 | SQL(关系型) | NoSQL(非关系型) |
|---|---|---|
| 数据结构 | 结构化(Structured) | 非结构化(Unstructured) |
| 数据关系 | 强关联(主外键) | 无关联(嵌套/冗余存储) |
| 查询语言 | SQL 标准语句 | 每种数据库自定义 |
| 事务支持 | 支持 ACID | 多数不支持 ACID,仅保证最终一致性 |
| 存储方式 | 基于磁盘 | 基于内存 |
| 扩展方式 | 垂直扩展(升级硬件) | 水平扩展(多机分片) |
| 使用场景 | 安全性高、结构稳定、金融电商等 | 海量数据、实时访问、性能敏感系统 |
特性对比无法感受到两种的差距,我们举个例子,比如现在我想要储存一个学生的基本信息,使用sql和redis分别进行实现:
sql
create table student(
id int,
name varchar(20),
age int
);
insert into student (id , name , age)values(1 , '张三' , 18);
bash
# 1. 存储单个学生信息(Hash结构:键为student:1,字段为id、name、age,对应值分别为1、张三、18)
HSET student:1 id 1 name "张三" age 18
# 会得到一个数据
{
"id":1,
"name" : "张三",
"age":18
}
进行查询时:
| 操作 | SQL | Redis |
|---|---|---|
| 查询用户信息 | SELECT * FROM student WHERE id=1 | get student :1 |
2 浅谈redis在分布式系统中的应用
单机架构简而言之就是只在一个服务器上提供的服务(内部可能使用了数据库,网络,等),一个服务器负责业务处理,也负责数据存储。
当业务进一步增长,数据量大大提升,一台主机难以支持时,就需要引入更多的主机,也就出现了分布式架构。
每台主机的硬件资源包括内存,cpu,硬盘,网络...服务器的每次请求都会消耗一定资源,同一时刻处理大量的请求就可能导致某个硬件资源不够用了,遇到资源不够的问题有两种主要解决思想:
- 开源:简单粗暴的解决,增加更多的硬件资源。一台主机扩展到极限了,就需要加入更多的主机了。引入多台主机就构成了分布式系统了。
- 节流:针对程序优化,优化数据结构,数据库存储结构等等...这就看程序员的个人能力了
注意:引入分布式,是万不得已的,系统的复杂度会大大提高,出现bug的概率越高。
最简单的分布式系统就是一个业务服务器+一个储存服务器。但是当请求量提升时,可能会出现一台业务服务器处理不过来的情况,这时可以在引入一台业务服务器,通过网关做负载均衡,他们共同读取一个数据库。
当当处理的请求量增加,导致数据库读写消耗增大时,可以将储存服务器也增添一个,设置一个主服务器和一个从属服务器,他们之间会进行数据同步:主服务器负责数据写操作,从服务器负责数据操作,主服务器会将写入的数据同步到读服务器中。
此时又出现了一个新问题,对于一个十分频繁且耗时的查询(比如查询全体成员成绩),每次查询会占用大量的资源。同时因为数据库的处理读取速度很慢,频繁的查询更会导致超时。这时就需要对热数据进行处理 ,引入缓存,将热数据储存到缓存中。当业务服务器处理请求时先在缓存服务器中查找,没有再去存储服务器中查询。当然这样也会引入很多的问题:
- 缓存数据应该保留多久?
- 数据库数据修改了导致和缓存中不一致了怎么办?
- ...
这个redis就是作为缓存服务器出现的。由于其储存是在内存中进行的,读写速度是比硬盘读写高好几个数量级的!这也是redis快速的重要原因:
| 操作类型 | Redis(单线程) | MySQL(InnoDB 引擎) | PostgreSQL |
|---|---|---|---|
| 读 QPS(每秒查询数) | 10 万~100 万 + | 1 万~5 万(开启缓存) | 1 万~5 万 |
| 写 QPS(每秒写入数) | 5 万~50 万 + | 5000~2 万(开启缓存) | 5000~2 万 |
| 平均响应延迟 | 微秒级(~100μs) | 毫秒级(~10ms) | 毫秒级 |
注意:redis的快速是相对来说的,比关系型数据库快,但还是比不过内存变量,毕竟redis说到底还是网络服务中间件,网络的延迟是不可避免的!
3 redis的特性
redis是一个在内存中储存数据的中间件,可以用于数据缓存,也可以用做数据库,通常是在分布式系统中发挥作用。
同时redis也会提供持久化的能力,因为内存数据一旦重启就会消失,所以在硬盘中储存一份是非常有必要的!并且redis是支持集群的(一个redis主机储存的数据是有限的,引入多个主机可以提供更好的能力)!
redis最重要的特性就是快,其快的原因:
- redis本质是使用内存进行存放数据的,读取数据相比于硬盘本身就高好几个数量级
- redis核心功能的实现简单,核心功能都是比较简单的操作内存的数据结构
- redis的网络使用IO多路复用(epoll),使用一个线程,基于事件触发构建的高效IO。
- redis使用的是单线程模型,减少了不必要的线程之间的竞争开销。通常:单线程不一定会提高速度,对于CPU密集型任务,使用多个线程可以充分使用CPU多核资源。但是对于redis来说,主要操作是操作内存的数据结构,并不会占用很多CPU资源(也就是单核和多核的区别不大)