概述
使用 Redis 时,不可避免地会遇到并发访问的问题,比如说如果多个用户同时下单,就会对缓存在 Redis 中的商品库存并发更新。一旦有了并发写操作,数据就会被修改,如果我们没有对并发写请求做好控制,就可能导致数据被改错,影响业务的正常使用(例如,库存数据错误,导致下单异常)。
为了保证并发访问的正确性,Redis 提供了两种方法,分别是加锁和原子操作。当一个客户端获得锁后,就会一直持有这把锁,直到客户端完成数据更新,才释放这把锁。
但是用锁会有两个问题:
- 一个是,如果加锁操作多,会降低系统的并发访问性能。
- 第二个是,Redis 客户端需要加锁时,需要用到分布式锁,而分布式锁实现复杂,需要用额外的存储系统来提供枷锁解锁操作。
原子操作是另一种提供并发访问控制的方法。原子操作是指执行过程保持原子性的操作,而且原子操作执行时并不需要加锁,实现了无锁操作。这样一来,既能保证并发控制,还能减少对系统并发性能的影响。
1.并发访问中需要对什么进行控制?
并发访问控制是指对多个客户端访问操作同一份数据的过程进行控制,以保证任何一个客户端发送的操作在 Redis 实例上执行具有互斥性。
并发访问控制对应的操作主要是数据修改操作。当客户端需要修改数据时,基本流程分成两步:
- 客户端先把数据读取到本地,在本地进行修改
- 客户端修改完数据后,再写回 Redis。
这个流程叫做"读取 - 修改 - 写回 "操作(Read-Modify-Write,简称为 RMW 操作
)。当有多个客户端对同一份数据执行 RMW 操作
的话,我们就需要让 RMW 操作
涉及的代码以原子性方式执行。访问同一份数据的 RMW 操作
的代码,就叫做临界区代码。
不过,当有多个客户端并发执行临界区代码时,就会存在一些潜在问题。例如,客户端要对商品库存执行扣减 1 的操作,伪代码如下:
c
current = GET(id)
current--
SET(id, current)
- 可以看到,客户先根据商品 id,从 Redis 中读取商品当前的库存值 current(对应 Read)
- 然后,客户端对库存值减 1(对应 Modify)
- 再把库存值写回 Redis (对应 Write)
如果,我们对临界区代码的执行没有控制机制,就会出现数据更新错误。在刚才的例子中,假设现在有两个客户端 A 和 B,同时执行刚才的临界区代码,就会出现错误。
- 在客户端 A 在 t1 时读取库存值 10 并扣减 1
- 在 t2 时,客户端 A 还没有把扣减值后的库存值 9 写回 Redis。此时,客户端 B 读取到库存值 10,也扣减了 1, B 记录的库存值也为 9 了。
- 等到 T3 时刻, A 往 Redis 写回了库存值 9。
- T4 时刻,B 也写回了库存值 9。
如果按正确的逻辑处理,客户端 A 和 B 对库存值各做了一次扣减,库存值应该为 8.所以,这里的库存值明显更新错了。
出现这个现象的原因是,临界区代码中的客户端读取、更新、再写回涉及了三个操作,而这三个操作执行时并不具有互斥性,多个客户端基于相同的初始值进行修改,而不是基于前一个客户端修改后的值再修改。
前面,我们已经解释过,虽然加锁保证了互斥性,但是加锁也会导致系统并发性能降低。接下来,我们了解下 Redis 中的原子操作。
2.Redis 的两种原子操作方法
Redis 的原子操作采用了两种方法:
- 把多操作在 Redis 中实现成一个操作,也就是单命令操作。
- 把多个操作写到 Lua 脚本中,以原子性方式执行单个脚本。
单命令操作
Redis 使用单线程来串行处理客户端的请求命令,所以,当 Redis 执行某个命令操作时,其他命令是无法执行的,这相当于命令操作是互斥执行的。
当然,Redis 的快照生成、AOF 重写这些操作可以使用后台线程或子进程执行,也就是和主线程的操作并行执行。不过他们都是只读操作,不会修改数据,所以,不需要对它们进行并发控制。
虽然 Redis 的单个命令可以原子性地执行,但是在实际应用中,数据修改时可能包含多个操作,至少包括读数据、数据增减、写回数据三个操作,这显然不是单个命令。
Redis 提供了 INCR/DECR 命令,把这三个操作变为一个原子操作了。INCR/DECR 命令可以对数据进行增值 / 减值操作,而它们本身就是单个命令操作,Redis 在执行它们时,本身就具有互斥性。
比如说,在刚才的库存扣减例子中,客户端可以使用下面的代码,也不用担心出现库存值扣减错误的问题。
bash
DECR id
所以,如果我们执行的 RMW 操作对数据增减值的话, Redis 提供的原子操作 INCR 和 DECR 可以直接绑我们进行并发控制。
Lua 脚本
如果,我们要执行的操作不是简单地增减数据,而是有更新复杂的判断逻辑或者其他操作,那么 Redis 的单命令操作已经无法保证多个操作的互斥执行了。这个时候,就需要用到 Lua 脚本
。
Redis 会把整个 Lua 脚本
作为一个整体执行,在执行过程中不会被其他命令打断,从而保证了 Lua 脚本
中操作的原子性。如果,我们有多个操作要执行,但是又无法使用 INCR/DECR 这种命令操作来实现,就可以把这些要执行的命令编写到一个 Lua 脚本
中。然后,我们可以使用 Redis 的 EVAL 命令来执行脚本。这样一来,这些操作在执行的时就具有了互斥性。
我们可以把 访问次数加 1、判断访问次数是否为 1,以及设置过期时间这三个操作写入一个 Lua 脚本
,如下所示:
lua
local current
current = redis.call("incr", KEYS[1])
if tonumber(current) == 1 then
redis.call("expire", KEYS[1], 60)
end
return current
假设编写的脚本的名称为 lua.script,我们就接着使用 Redis 客户端,带上 eval 选项,来执行该脚本。脚本所需要的参数通过以下命令中的 key 和 arg 进行传递。
bash
redis-cli --eval lua.script [key key2 ...] , [arg arg2 ...]
另外还可以在 Redis 客户端内,执行脚本:
eval lua.script key-num [key key2 ...] [arg arg2 ...]
[key key2 ...]
: 表示在脚本中所用到的那些 Redis 键(key),这些键名参数可以在 Lua 中通过全局变量 KEYS 数组,用 1 为基址的形式访问( KEYS[1] , KEYS[2] ,以此类推)。[arg arg2 ...]
: 附加参数,在 Lua 中通过全局变量 ARGV 数组访问,访问的形式和 KEYS 变量类似( ARGV[1] 、 ARGV[2] ,诸如此类)。
例如上面的 Lua 脚本的实际执行如下(其中, KEYS[1] 为 lua1
):
bash
chenjian@DESKTOP-Q24SEP3:~$ vim lua.script
chenjian@DESKTOP-Q24SEP3:~$ ./redis-6.2.12/src/redis-cli --eval lua.script lua1 ,
(integer) 1
chenjian@DESKTOP-Q24SEP3:~$ ./redis-6.2.12/src/redis-cli --eval lua.script lua1 ,
(integer) 2
这样一来,访问次数加 1、判断访问次数是否为 1,以及设置过期时间这三个操作就可以原子性的执行了。即使客户端有多个线程同时执行这个脚本,Redis 也会依次串行的执行脚本代码,避免并发操作带来的数据错误。
不过需要注意的是,如果把很多操作都放在 Lua 脚本中原子执行,会导致 Redis 执行脚本的时间增加,同样也会降低 Redis 。所以,给你一个小建议:在编写 Lua 脚本时,你要避免把不需要做并发控制的操作写入 Lua 脚本中。