List是Redis中的列表,按照插入顺序保存数据,插入顺序是什么样的,数据就怎么保存。可以添加一个元素到列表的头部(左边)或者尾部(右边)。一个列表最多可以包含232-1个元素(4294967295,每个列表超过40亿个元素)。是一种双向列表结构。
1、List列表命令
- blpop key1[key2...] timeout:从头部(左边)移出并获取一个元素,如果列表没有元素会阻塞到列表有元素或者超时。
- brpop key1[key2...] timeout:从尾部(右边)移出并获取一个元素,如果列表没有元素会阻塞到列表有元素或者超时。
- brpoplpush source destination timeout:从尾部(右边)移出一个元素,并添加到另一个列表的头部并返回。如果列表没有元素会阻塞到列表有元素或者超时。
- lindex key index:通过索引(下标)获取列表中的元素。index可以为负,-1表示最后一个元素,-2表示倒数第二个元素。以此类推
- linsert key before|after pivot value:将值value插入到列表key中,位于pivot之前或者之后。
当指定的元素不在列表或者列表为空时不执行任何操作,如果key不是列表类型,则返回一个错误
- llen key:获取列表的长度
- lpop key:从列表的头部(左边)移出并获取列表一个元素。如果列表没有元素,不会阻塞。
- lpush key value1[value2]:将一个或者多个值插入到列表头部(左边)。多个元素一起插入时,后面的头部。
如果插入的key不存在,将创建一个空的列表,并执行lpush操作。当key不是列表类型时,会报错。
- lpushx key value:将一个值插入到列表的头部(左边),当列表不存在时操作无效。
- lrange key start end:返回列表中指定区间的元素,从0开始,当end为-1时表示到最后一个元素,-2为倒数第二个元素。
- lren key count value:移出列表中值和value相等的值。
count的值有如下几种情况:
- count>0:从列表的头部(左)到尾部(右)搜索,移出值与value相等的元素,数量为count。
- count<0:从列表的尾部(右)到头部(做)搜索,移出值与value相等的元素,数量为count的绝对值。
- count=0:移出列表中所有与value相等的元素。
- lset key index value:通过索引(下标)设置元素的值。当下标超出范围(超过列表的已有数量)或者列表为空,进行lset操作会报错。
- ltrim key start end:对一个列表进行修剪,让列表只存在指定区间内的元素,以外的全删除。0表示第一个元素,1表示第二个,-1表示最后一个,-2表示倒数第二个。以此类推。
- rpop key:移出列表的最后一个元素(最右边)。不会阻塞。
- rpoplpush source destination:移出source列表的最后一个元素,插入到destination的头部,并返回。
- rpush key value1[value2]:在列表尾部添加一个或者多个元素。后边的在最后。
- roushx key value:将值添加到已存在列表的尾部。
2、底层结构
2.1、linkedList
与Java
中的LinkedList
类似,Redis
中的linkedList
是一个双向链表,也是由一个个的节点组成。Redis
借助c
语言的链表节点结构如下:
c
typedf struct listNode{
//前一个节点
struct listNode *prev;
//后一个节点
struct listNode *next;
//当前节点的值的指针
void *value;
}listNode;
prev
指向前一个节点,next
指向下一个节点,value
保存着当前节点对应的数据对象。listNode
结构示意图如下:
链表的结构如下:
c
typedf struct list{
//头指针
listNode *head;
//尾指针
listNode *tail;
//节点拷贝函数
void *(*dup)(void *ptr);
//释放节点函数
void *(*free)(void *ptr);
//判断两个节点是否相等函数
int (*match)(void *ptr,void *key);
//链表长度
unsigned long len;
}list;
head
指向链表的头结点,tail
指向链表的尾节点。len
表示链表有多少个节点,这样可以在O(1)
的时间复杂度内获得链表的长度。
链表的结构示意图如下:
2.2、zipList
Redis的zipList结构如下:
c
typedf struct ziplist<T>{
//压缩列表占用字符数
int32 zlbytes;
//最后一个元素距离起始位置的偏移量,用于快速定位最后一个节点
int32 zltail_offset;
//元素个数
int16 zllength;
//元素内容
T[] entries;
//结束位 0xFF
int8 zlend;
}ziplist
zipList
结构示意图如下:
根据zltail_offset
字段就可以快速定位到最后一个entry
的位置,这样配合Entry
结构中的prelen
字段,就可以实现链表的倒序遍历。
下面是entry
的结构:
c
typed struct entry{
//前一个entry的长度
int<var> prelen;
//元素编码类型
int<var> encoding;
//元素内容
optional byte[] content;
}entry
prelen
保存了前一个entry
的长度,这样就可以在倒序遍历时就可以根据此字段来获取到前一个entry
的位置。encoding
保存了content
内容的编码类型。content
是保存的内容,其类型是optional
,表示这个字段是可选的。当content
是很小的整数时,他会内连到content
的尾部。entry
结构示意图如下:
思考题:为什么有了 **linkedList**
还要设计一个 **zipList**
呢?
- 就像
zipList
的名字一样,他是一个压缩列表,相比较于linkedList
,其少了pre
和next
两个指针。Redis
中两个指针就要占用16个字节(64位操作系统的一个指针就是8字节)。 linkedList
每个节点的内存都是单独分配,加速了内存的碎片化,影响内存的管理。zipList
的内存都是连续组成的,这样一来,由于内存是连续就减少了许多内存的碎片化和指针的内存占用。
zipList
遍历时,先根据zlbytes
和zltail_offset
定位到最后一个entry
的位置,然后根据最后一个entry
的prelen
确定前一个entry
的位置。
连锁更新
前面说到,Entry
结构中有个prelen
字段,表示其前一个entry
的长度,他的长度要么是1个字节,要么是5个字节:
- 前一个
entry
的长度小于254字节,则prelen
的长度为1字节(8位,最大可表示255); - 前一个
entry
的长度大于254字节,则prelen
的长度为5字节;
假设有一组压缩列表的长度都在250~253之间,突然增加一个entry
长度大于254字节。由于新的entry
的长度大于254字节,那么原链表的首节点的prelen
的长度就会为5个字节,随后会导致其他的所有entry
的prelen
都增大为5个字节,每次prelen
的增大,都需要一次内存的再分配操作。
linkedList和zipList的对比
- 当列表的长度或者数量较少时,通常采用
zipList
,当列表的长度较大或者数量较多时,通常采用linkedList
存储。 - 双向链表
linkedList
方便与在列表上增加或者删除操作,也即push
和pop
操作。但是其内存的开销比较大。一方面其比zipList
多了两个指针。且其每个节点的内存都是独立的,地址不连续,容易形成内存碎片。 zipList
存储在一块连续的内存上,其查询速度较快,但是不利于修改操作,插入和删除操作需要频繁的申请和释放内存。特别是当zipList
很大时,一次realloc
可能会导致大量的拷贝。
2.3、quickList
在Redis
3.2版本后,list
的底层实现又多了一种,quickList
。quickList
是zipList
和linkedList
的混合体,它将linkedList
按段切分,每一段使用zipList
来存储数据。每个quickList
之间用双向指针串接起来。示意图如下:
节点quickList
结构如下:
c
typedf struct quicklistNode{
//前一个节点
quicklistNode *prev;
//后一个节点
quicklistNode *next;
//压缩列表
ziplist* zl;
//ziplist大小
int32 size;
//ziplist中元素数量
int16 count;
//编码形式 存储ziplist还是LZF压缩存的ziplist
int2 encoding;
...
}quicklistNode;
quickList
的结构如下:
c
typedf struct quicklist{
//头节点
quicklistNode* head;
//尾节点
quicklistNode* tail;
//元素总数
long count;
//quicklistNode节点总数
int nodes;
//压缩深度算法
int compressDepth;
...
}quicklist;
为了进一步节约空间,Redis
还会对ziplist
进行压缩存储,使用LZF算法进行压缩,可以选择压缩深度。
每个zipList可以存储元素的个数
Redis.conf
文件,在DVANCE CONFIG
下面有着清晰记载:
c
# Lists are also encoded in a special way to save a lot of space.
# The number of entries allowed per internal list node can be specified
# as a fixed maximum size or a maximum number of elements.
# For a fixed maximum size, use -5 through -1, meaning:
# -5: max size: 64 Kb <-- not recommended for normal workloads
# -4: max size: 32 Kb <-- not recommended
# -3: max size: 16 Kb <-- probably not recommended
# -2: max size: 8 Kb <-- good
# -1: max size: 4 Kb <-- good
# Positive numbers mean store up to _exactly_ that number of elements
# per list node.
# The highest performing option is usually -2 (8 Kb size) or -1 (4 Kb size),
# but if your use case is unique, adjust the settings as necessary.
list-max-ziplist-size -2
quicklist
内部默认单个ziplist
的长度为8K字节,即list-max-ziplist-size
的值设置为-2,超出这个阈值,就会重新生成一个新的ziplist
来存储数据。根据注释可知,性能最好的时候就是list-max-ziplist-size
为-1和-2时,即分别是4Kb和8Kb。当然这个值也可以是正数,当值为正数n 时,表示每个quicklist
上的ziplist
最多包含n个数据项。
压缩深度
在quickList
中可以使用压缩算法对zipList
进行进一步的压缩,这个算法就是LZF算法 ,这是一种无损压缩算法。使用压缩算法对zipList
进行压缩后,zipList
结构如下:
c
typedf struct zoplist_compressed{
//元素个数
int32 size;
//元素内容
byte[] compressed_data;
}
压缩后的quickList
结构如下:
在Redis.conf
配置文件中对其进行配置
c
# Lists may also be compressed.
# Compress depth is the number of quicklist ziplist nodes from *each* side of
# the list to *exclude* from compression. The head and tail of the list
# are always uncompressed for fast push/pop operations. Settings are:
# 0: disable all list compression
# 1: depth 1 means "don't start compressing until after 1 node into the list,
# going from either the head or tail"
# So: [head]->node->node->...->node->[tail]
# [head], [tail] will always be uncompressed; inner nodes will compress.
# 2: [head]->[next]->node->node->...->node->[prev]->[tail]
# 2 here means: don't compress head or head->next or tail->prev or tail,
# but compress all nodes between them.
# 3: [head]->[next]->[next]->node->node->...->node->[prev]->[prev]->[tail]
# etc.
list-compress-depth 0
list-compress-depth
这个参数表示一quickList
**两端不被压缩的节点个数,**实际上这里的节点个数指的是quickList
的节点个数,而不是zipList
里面的数据项个数。
quickList
默认的压缩深度为0,也就是不开启压缩。- 当
list-compress-depth
为1时,表示首尾各有一个节点不进行压缩,中间节点进行压缩。 - 当
list-compress-depth
为2时,表示首尾各有两个节点不行压缩,中间节点进行压缩。 - 以此类推。
从上面可以看到quickList
的首尾两个节点永远不会被压缩。