Redis总结（官方文档解读）

定义

Redis是一个开源的，基于内存的数据结构存储系统，可以用作数据库、缓存和消息中间件。

特征

高性能
支持丰富的数据类型
丰富的操作类型，操作是原子性的
支持周期性持久化
支持分布式
开源免费，社区活跃

数据类型

|------------|-----------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 数据类型 | 解释 | 使用场景 | 基本命令 |
| string | 最简单的值类型。字符串存储字节序列，包括文本、序列化对象和二进制数组。单个Redis 字符串最大可以为512MB | * 缓存层 * 计数器：视频播放量，文章浏览量 | * SET：存储一个字符串值。 * SETNX：仅当键不存在时才存储字符串值。对于实现锁很有用。 * GET：检索字符串值。 * MGET：在一次操作中检索多个字符串值。 |
| hash | Redis 哈希是一种记录类型，其结构为字段值对的集合。 | * 表示基本对象 * 存储计数器分组 | * HSET：设置哈希表中一个或多个字段的值。 * HGET：返回给定字段的值。 * HMGET：返回一个或多个给定字段的值。 * HINCRBY：将给定字段的值增加提供的整数。 |
| list | Redis 列表是字符串值的链接列表 | * 实现堆栈和队列 * 为后台工作系统构建队列管理:回复评论、点赞 | * LPUSH:在列表的头部添加一个新元素； * RPUSH:添加到尾部。 * LPOP:从列表头部移除并返回一个元素； * RPOP:执行相同操作，但从列表尾部移除。 * LLEN:返回列表的长度。 * LMOVE:原子地将元素从一个列表移动到另一个列表。 * LRANGE:从列表中提取一定范围的元素。 * LTRIM:将列表缩减为指定的元素范围。 |
| set | Redis 集合是唯一字符串（成员）的无序集合 | * 跟踪唯一项目（例如，跟踪访问给定博客文章的所有唯一 IP 地址）:去重、抽奖 * 表示关系（例如，具有给定角色的所有用户的集合）:初始化用户池 * 执行常见的集合运算，例如交集、并集和差集。 | * SADD:向集合中添加新成员。 * SREM:从集合中删除指定成员。 * SISMEMBER:测试字符串是否为集合成员。 * SINTER:返回两个或多个集合共同拥有的成员集合（即交集）。 * SCARD:返回集合的大小（又称基数）。 |
| zset | Redis 有序集是按相关分数排序的唯一字符串（成员）的集合。当多个字符串具有相同的分数时，这些字符串将按字典顺序排序 | * 排行榜 * 速率限制器 | * ZADD：将新成员和相关分数添加到排序集中。如果该成员已存在，则更新分数。 * ZRANGE：返回在给定范围内排序的排序集的成员。 * ZRANK：返回所提供成员的排名，假设排序按升序排列。 * ZREVRANK：返回所提供成员的排名，假设排序集按降序排列。 |
| Stream | Redis Stream 是 Redis 5.0 版本引入的一种新的数据结构，Redis 可为每个流条目生成一个唯一 ID,用于实现消息队列的功能。Stream 是一种有序的、可持久化的数据结构，可以用来存储多个字段和值对的消息记录。 | * 事件源（例如跟踪用户操作、点击等） * 传感器监控（例如，现场设备的读数） * 通知（例如，将每个用户的通知记录存储在单独的流中） | * XADD：向流中添加新条目。 * XREAD：读取一个或多个条目，从给定位置开始并随时间向前移动。 * XRANGE：返回两个提供的条目 ID 之间的条目范围。 * XLEN：返回流的长度。 |
| Bitmap | 位图不是实际的数据类型，而是一组定义在字符串类型上的面向位的操作，该字符串被视为位向量。由于字符串是二进制安全的 blob，其最大长度为 512 MB，因此它们适合设置最多 2^32 个不同的位。 | * 您可以对一个或多个字符串执行按位运算 * 对于集合成员对应于整数 0-N 的情况的有效集合表示。 * 对象权限，其中每个位代表一个特定的权限，类似于文件系统存储权限的方式。 | * SETBIT将提供的偏移量处的位设置为 0 或 1。 * GETBIT返回给定偏移量的位的值。 |
| Bitfield | Redis 位域允许您设置、递增和获取任意位长度的整数值。这些值使用二进制编码的 Redis 字符串存储。位字段支持原子读取、写入和增量操作。 | * 您可以对从无符号 1 位整数到有符号 63 位整数的任何值进行操作。 * 管理计数器和类似数值的理想选择 | * BITFIELD原子地设置、增加和读取一个或多个值。 * BITFIELD_RO是的只读变体BITFIELD |
| Geospatial | Redis 地理空间索引可让您存储坐标并搜索它们。 | * 查找给定半径或边界框内的附近点 | * GEOADD：将位置添加到给定的地理空间索引（请注意，在此命令中经度位于纬度之前）。 * GEOSEARCH：返回具有给定半径或边界框的位置。 |

过期策略

惰性删除 。查询key 的时候才对key进行检测。若key已经过期则删除，若key没有过期则返回。缺点是如果过期的key 一直没有被访问，则会一直无法被删除，存在于内存中。
定期删除 。redis 每隔一段时间对数据库做一次检查，删除里面过期的key。由于不可能对所有key 做轮询，所以redis 会每次随机选取一些key 做检查和删除。
内存淘汰机制
- volatile-lru：针对设置了过期时间的key，使用lru（最近很少使用)算法进行淘汰
- allkeys-lru:针对所有key 使用lru算法进行淘汰
- volatile-lfu:针对设置了过期时间的key，使用lfu（最近不经常使用）算法进行淘汰
- allkeys-lfu:针对所有key 使用lfu 算法进行淘汰
- volatile-random:从所有设置了过期时间的key 中使用随机淘汰方式进行淘汰
- allkeys-random:针对所有的key 使用随机淘汰机制进行淘汰
- volatile-ttl：针对设置了过期时间的key，越早过期的越先被淘汰
- noeviction:不会淘汰任何数据，当使用的内存空间超过maxmemory是时，再有写请求来时返回错误

持久化方案

Redis 提供了一系列持久性选项包括：

RDB（Redis 数据库） ：RDB 持久性会按照指定的时间间隔对数据集执行时间点快照。
AOF（仅追加文件） ：AOF 持久性记录服务器收到的每个写入操作。然后可以在服务器启动时再次重放这些操作，重建原始数据集。命令使用与Redis 协议本身相同的格式进行记录。
无持久性 ：您可以完全禁用持久性。这有时在缓存时使用。
RDB + AOF ：您还可以在同一实例中结合使用AOF 和RDB

RDB

优点
- RDB 是 Redis 数据的一个非常紧凑的单文件时间点表示。RDB 文件非常适合备份。例如，您可能希望每小时存档最近 24 小时内的 RDB 文件，并每天保存 30 天的 RDB 快照。这样，您就可以在发生灾难时轻松恢复数据集的不同版本。
- RDB 非常适合灾难恢复，它是一个单一的紧凑文件，可以传输到远程数据中心，或者传输到 Amazon S3（可能加密）。
- RDB 可最大程度地提高 Redis 的性能，因为 Redis 父进程为了持久化所需要做的唯一工作就是派生一个子进程，然后由子进程来完成其余所有工作。父进程永远不会执行磁盘 I/O 或类似操作。
- 与 AOF 相比，RDB 允许使用大数据集更快地重启。
- 在副本上，RDB 支持重启和故障转移后的部分重新同步。
缺点
- 如果您需要尽量减少 Redis 停止工作（例如断电后）时数据丢失的可能性，那么 RDB 并不是一个好选择。您可以配置生成 RDB 的不同保存点 （例如，在至少五分钟后对数据集进行 100 次写入后，您可以有多个保存点）。但是，您通常每五分钟或更长时间创建一个 RDB 快照，因此，如果 Redis 因任何原因而未正确关闭而停止工作，您应该准备好丢失最近几分钟的数据。
- RDB 需要经常使用子进程 fork() 才能将其持久保存在磁盘上。如果数据集很大，fork() 可能会很耗时，如果数据集很大且 CPU 性能不佳，可能会导致 Redis 停止为客户端提供服务几毫秒甚至一秒钟。AOF 也需要 fork()，但频率较低，您可以调整重写日志的频率，而无需牺牲持久性。

AOF

优点
- 使用 AOF Redis 的持久性更强：您可以采用不同的 fsync 策略：完全不进行 fsync、每秒进行 fsync、每次查询时进行 fsync。使用每秒进行 fsync 的默认策略，写入性能仍然很好。fsync 使用后台线程执行，主线程会在没有 fsync 进行时尽力执行写入，因此您只会丢失一秒钟的写入。
- AOF 日志是仅附加日志，因此不会出现寻道，也不会在断电时出现损坏问题。即使日志因某种原因（磁盘已满或其他原因）以半写命令结束，redis-check-aof 工具也能够轻松修复它。
- 当 AOF 太大时，Redis 能够在后台自动重写。重写是完全安全的，因为 Redis 在继续向旧文件追加内容的同时，会使用创建当前数据集所需的最少操作集生成一个全新的文件，并且一旦第二个文件准备就绪，Redis 就会切换这两个文件并开始向新文件追加内容。
- AOF 以易于理解和解析的格式逐一记录所有操作的日志。您甚至可以轻松导出 AOF 文件。例如，即使您不小心使用该FLUSHALL命令刷新了所有内容，只要在此期间没有执行日志重写，您仍然可以通过停止服务器、删除最新命令并重新启动 Redis 来保存数据集。
缺点
- 对于同一数据集，AOF 文件通常比等效的 RDB 文件更大
- 根据确切的 fsync 策略，AOF 可能比 RDB 慢。一般来说，将 fsync 设置为每秒一次时 ，性能仍然非常高，而禁用 fsync 时，即使在高负载下，它也应该与 RDB 一样快。即使在写入负载巨大的情况下，RDB 仍能够提供更多关于最大延迟的保证。

RDB/AOF 对比

|--------|------------------------------------|----------------------------------------------------------------------|
| - | RDB | AOF |
| 说明 | 把当前内存中的数据集快照写入磁盘。恢复时是将快照文件直接读到内存里。 | 通过持续不断的保存Redis 服务器所执行的更新命令来记录数据库状态，类似mysql 的 binlog。恢复数据时要从头开始回放更新命令 |
| 磁盘刷新频率 | 低 | 高 |
| 文件大小 | 小 | 大 |
| 数据恢复效率 | 高 | 低 |
| 数据安全 | 低 | 高 |

分布式方案

分片方案

|-------|---------------------------------------------------------------------------------------|
| 客户端分片 | 将分片工作放在业务程序端。不依赖于第三方分布式中间件，实现方法和代码可控，对开发人员要求高。 |
| 代理分片 | 将分片工作交给专门的代理程序来做，运维方案。代表：Twemproxy，Codis |
| 服务器分片 | Redis Cluster 将所有key映射到16384个slot 中，集群中每个redis 实例负责一部分，业务程序通过集成的redis cluster 客户端进行操作 |

主从复制

主从复制是redis 最基本、最常用的同步方式。它的原理是将主节点的数据复制到从节点，使得从节点的数据与主节点保持一致。主从复制是异步的，从节点与主节点的数据不是实时同步的。如果主节点发生故障，从节点可能会因为数据延迟而出现数据丢失的情况。

集群模式

Redis集群是Redis提供的分布式数据库方案，它将数据分散在多个节点上，每个节点都包含整个数据集的一部分。Redis集群通过分片来分布数据，每个节点负责数据集的一个片段。集群中的每个分片都可以有一个或多个从节点，用于故障转移和高可用性。

哨兵模式

除了主从复制外，Redis 还提供了哨兵模式作为高可用性解决方案。哨兵模式可以自动检测主节点的状态。当主节点发生故障时，会自动将一个从节点切换为主节点。切换过程中，从节点会先将自己的数据与主节点保持一致，然后才能成为新的主节点。因此，在哨兵模式下，数据同步的过程与主从复制类似，但是其实现方式更加自动化。

缓存方案

redis 用作缓存组件时，其基于内存的读写特性，比基于磁盘读写的数据库性能要高很多，适合缓存高频热点的数据，来提高读性能。这样可以降低对数据库服务器的查询请求，提高系统性能。

数据一致性

读写步骤

在使用缓存与数据库保持一致性的场景中，通常遵循以下读写步骤来确保数据的一致性。

读取操作：

检查缓存：客户端发起读取请求时，首先在缓存中查找所需数据。

缓存命中：如果缓存中有数据（缓存命中），则直接返回缓存中的数据给客户端。
缓存未命中：
1. 如果缓存中没有数据（缓存未命中），则从数据库中读取数据。
2. 将从数据库中读取的数据写入缓存，以便下次可以直接从缓存中读取。
3. 返回数据库中的数据给客户端。

写入操作：

更新数据库：客户端发起写入请求时，首先更新数据库中的数据。
失效缓存：在数据库更新成功后，立即使缓存中的相关数据失效或更新缓存中的数据。这样可以确保下次读取操作时，客户端能够从数据库中获取最新的数据。

分布式锁

使用分布式锁来保证在更新数据库和失效缓存的过程中，不会有其他并发操作干扰。

读写串行化

通过队列等机制，确保对同一数据的读写操作不会并发执行。

订阅数据库变更

通过订阅数据库的变更日志（如 MySQL 的 Binlog），在数据变更时自动更新或失效缓存。

缓存异常

缓存穿透

定义
- 缓存穿透是指查询一个一定不存在的数据，由于缓存中不存在该数据，每次请求都会落到数据库上，从而可能导致数据库压力过大甚至崩溃。
造成原因
- 恶意攻击，造成大量访问不存在的key
解决方案
- 缓存空对象 ：对于查询结果为空的键，也将其存入缓存，并设置一个较短的过期时间。这样，即使是不存在的数据也会被缓存，从而避免频繁查询数据库。
- 布隆过滤器 ：在访问缓存之前，使用布隆过滤器检查数据是否可能存在。如果布隆过滤器判断数据不存在，则直接返回，不查询缓存和数据库。
- 接口限流 ：对于访问频率极高的请求，可以使用接口限流来防止恶意攻击。
- 安全性检查 ：应用程序检查key的合法性，提前拒绝不合法请求；检查请求来源IP，限制访问次数，或设置黑名单。

缓存雪崩

定义
- 缓存雪崩是指缓存中大量数据同时过期或者缓存服务突然宕机，导致大量请求直接落到数据库上，引起数据库压力骤增，甚至导致数据库崩溃。
造成原因
- redis故障、比如redis 宕机
- 网络出现抖动
解决方案 ：
- 设置不同的过期时间 ：为缓存数据设置不同的过期时间，避免大量数据同时过期。
- 使用持久化缓存 ：比如Redis的RDB或AOF持久化功能，即使服务重启，也能快速恢复缓存数据。
- 服务熔断和限流 ：在缓存失效或者服务故障时，通过服务熔断和限流来保护后端系统。
- 多级缓存 ：构建多级缓存架构，例如本地缓存+分布式缓存，即使分布式缓存出现问题，本地缓存仍能提供一定的保护。

缓存击穿

定义
- 缓存击穿是指某个热点数据在缓存中过期，而此时大量并发请求访问该数据，导致这些请求都落到数据库上，从而可能引起数据库压力过大。
造成原因
- 热点key 设置了太短的过期时间
解决方案
- 热点数据永不过期 ：对于热点数据，可以设置永不过期或者过期时间非常长。
- 互斥锁 ：在缓存失效时，通过互斥锁来保证同一时间只有一个请求去查询数据库，并更新缓存，其他请求等待缓存更新完成后再返回数据。
- 数据热加载 ：使用后台线程或者定时任务，预先加载热点数据至缓存中。

Redis 使用Lua 脚本

Redis 允许用户在服务器上上传和执行 Lua 脚本。脚本可以使用编程控制结构，并在执行时使用大多数命令来访问数据库。由于脚本在服务器中执行，因此从脚本读取和写入数据非常高效。

使用脚本的优势
- 提高执行效率：减少网络开销、原子性操作和减少解析时间。
- 简化复杂操作：通过封装多个操作为一个脚本，简化了复杂的操作逻辑。
- 原子性保证：脚本的执行是原子操作，避免了在多线程环境下的竞态条件问题。
- 安全性控制：通过参数化脚本和限制脚本权限，确保脚本的安全性。
应用场景
- 原子性操作：通过使用Lua脚本，可以实现事务处理、乐观锁、排他锁等原子性操作。
- 复杂计算：Lua脚本可以进行复杂的计算，如计算统计数据、排序、过滤等。
- 批量操作：通过Lua脚本可以实现批量操作，如批量插入、批量删除等。
- 分布式锁：使用Lua脚本可以实现分布式锁，防止多个客户端同时访问共享资源。
执行步骤
- 要执行 Lua 脚本，可以使用 EVAL 命令。基本格式如下：
  - EVAL script numkeys key $key ...$ arg $arg ...$
    - script：Lua 脚本内容。
    - numkeys：指定后面参数中键的数量。
    - key $key ...$ ：脚本中使用的 Redis 键。
    - arg $arg ...$ ：传递给 Lua 脚本的参数。
- Redis 使用一个脚本缓存，这意味着相同的 Lua 脚本不需要每次执行时都重新发送。一旦脚本被缓存，它就可以通过 EVALSHA 命令通过脚本的 SHA1 校验和来调用。
  - EVALSHA sha1 numkeys key $key ...$ arg $arg ...$
- 要获取脚本的 SHA1 校验和，可以使用 SCRIPT LOAD 命令：
  - SCRIPT LOAD "your lua script here"

Redis 事务

Redis 中的事务处理是通过 MULTI、EXEC、DISCARD 和 WATCH 命令来实现的。Redis 的事务允许一组命令在单个步骤中按顺序执行，确保这些命令作为一个单独的操作被处理。

以下是 Redis 事务处理的关键点
- 事务中的所有命令都是序列化的，并按顺序执行
- 在 Redis 事务执行过程中，其他客户端发送的请求永远不会得到处理。这保证了命令作为单个隔离操作执行。
命令
- MULTI
  - MULTI 命令用于开始一个事务。在发出 MULTI 命令后，客户端可以发出多个命令，这些命令不会立即被执行，而是被放入一个队列中。
- EXEC
  - 在 MULTI 命令之后，你可以发送多个命令到队列中。当所有的命令都添加到事务队列后，使用 EXEC 命令来执行所有队列中的命令。
- DISCARD
  - 如果你在执行事务之前改变主意，可以使用 DISCARD 命令来取消事务，并丢弃事务队列中的所有命令。
- WATCH
  - 在事务开始之前，你可以使用 WATCH 命令来监控一个或多个键。如果在事务执行前这些键被修改（通过其他客户端），则 EXEC 命令将不会执行事务中的任何命令，而是返回一个空回复。这种机制可以用作乐观锁。
注意事项

Redis 事务不支持回滚，如果事务中的某个命令执行失败，那么事务中的其他命令仍然会执行。

Redis 发布/订阅

Redis 的发布/订阅（Publish/Subscribe）模式是一种消息传递范式，允许客户端订阅一个或多个频道（channel），并接收来自这些频道的消息。在这种模式中，发送者（发布者）发布消息到一个频道，而接收者（订阅者）监听这个频道以接收消息。

基本概念
- 发布者（Publisher） ：发布消息到频道。
- 订阅者（Subscriber） ：订阅一个或多个频道，以接收来自这些频道的消息。
- 频道（Channel） ：消息传递的通道，发布者和订阅者通过频道进行消息的发送和接收。
常用命令
- SUBSCRIBE ：订阅一个或多个频道。
  - SUBSCRIBE channel $channel ...$
- UNSUBSCRIBE : 退订一个或多个频道。
  - UNSUBSCRIBE $channel \[channel ...$ ]
- PUBLISH ：向指定频道发送消息。
  - PUBLISH channel message
- PSUBSCRIBE ：订阅一个或多个符合给定模式的频道。
  - PSUBSCRIBE pattern $pattern ...$
- PUNSUBSCRIBE ：退订一个或多个符合给定模式的频道。
  - PUNSUBSCRIBE $pattern \[pattern ...$ ]
注意事项
- 发布/订阅消息是异步的，发布者不会知道消息是否被成功接收。
- 如果没有订阅者监听某个频道，那么向该频道发布的消息将不会被任何人接收。
- 订阅者在订阅频道时处于阻塞状态，只能接收消息或通过退订来退出阻塞状态。
- 发布/订阅模式不支持消息持久化，如果 Redis 服务重启，所有订阅信息和发布过的消息都会丢失。

比较

Redis 与 Mysql 的区别

redis 是No-SQL 数据库，Mysql 是关系型数据库
Mysql 用于持久化的存储到硬盘，功能强大，速度稍慢，基于磁盘，读写速度没有Redis 快，但是不受空间容量限制，性价比高。redis 用于存储使用较为频繁的数据到缓存中，读取速度快，基于内存，读写速度快，也可做持久化，但是内存空间有限，当数据超过内存空间时，需扩充内存
redis 是 key-value 数据库，不是传统的关系型数据库，数据主要存储在内存中。Mysql 是关系型数据库，具有事务的基本特征，数据存储在文件中；redis 作为中间件服务，主要作用于缓存，存储重要的及时数据；Mysql 数据库更偏向于数据库服务，类似一种中心仓库，负责数据的管理。

Redis 与 Memcache 的区别

redis 数据类型多于 Memcache
redis 可周期性做持久化，Memcache 不能持久化
redis 支持 master-slave 模式的数据备份，Memcache 不支持数据持久化，无法进行数据备份
Memcache 是多线程的，Redis 是单线程的；CPU 利用率 Memcache 优于 redis
批量读取性能 Memcache 优于 Redis

参考文献

Redis 官方文档：Develop with Redis | Docs