String
Redis底层是使用C实现的,但是它并没有使用C中char* 的方法,而是自己定义了一个SDS,也就是简单字符串,先说一下char*以及它的缺点。
char*是C中String的实现,它在读取到 '\0'后就会停止,C中把这个符号作为String的结尾。因此如果 '\0'后还有其他字符,C中并不会把它算在里面。并且如果想要知道String的长度,需要遍历所有字符串,在时间复杂度上是O(n)的。对于需要储存数据的Redis来说,如果出现 '\0'就停止读入,以及每次获得String长度都需要重新遍历,这显然是不可能的,所以Redis自己创新了一个简单字符串。
|-----------|-----|
| word[0] | z |
| word[1] | c |
| word[2] | s |
| word[3] | \0 |
SDS使用byte数组来存放数据,并且使用专门的len变量来记录长度。不仅如此,他还可以在存放64位整数的时候节省空间。这解决了C中String出现的一些问题,但是这也会出现一些新的问题。具体情况可以看我的Redis实战中String类型有什么缺点。
Hash
Redis中的Hash也进行了优化,主要体现在了两点,分别针对hash冲突和rehash。
hash冲突
Hash存储键值对如果hash冲突了,就会使用拉链法避免hash冲突,这和java中的hashmap解决hash冲突的方法是一致的,但是在扩容方面,却有一些区别。
rehash
需要注意的是在装载因子大于1的时候,Redis允许扩容,但是AOF重写或生成RDB时就不可以扩容,为了保证不污染AOF和RDB,但是装载因子大于5,立即扩容。在rehash时,如果没有新的请求,也会通过定时任务的方式进行rehash。