我们都知道Redis中保存的Key是字符串,value往往是字符串或者字符串的集合。可见字符串是Redis中最常用的一种数据结构。
不过Redis没有直接使用C语言中的字符串,因为C语言字符串存在很多问题:
- 获取字符串长度的需要通过运算,O(n)复杂度
- 非二进制安全,不能出现类似于’\0’的字符,因为在c字符串中,'\0’代表字符串结束
- 不可修改
Redis构建了一种新的字符串结构,称为简单动态字符串(Simple Dynamic String),简称SDS。
例如,我们执行命令:
ubuntu_docker:0>set name "张三"
"OK"
ubuntu_docker:0>
那么Redis将在底层创建两个SDS,其中一个是包含name的SDS,另一个是包含“张三”的SDS。
redis是用C语言写的,其中SDS是一个结构体,源码如下:
struct __attribute__((__packed__)) sdshdr8 {
uint8_t len;
uint8_t alloc;
unsigned char flags;
char buf[];
}
例如,一个包含字符串“name"的sds结构如下: SDS之所以叫做动态字符串,是因为它具备动态扩容的能力,例如一个内容为“hi”的SDS: 假如我们要给SDS追加一段字符串",Amy”,这里首先会申请新内存空间:
- 如果新字符串小于1M,则新空间为扩展后字符串长度的两倍+1;
- 如果新字符串大于1M,则新空间为扩展后字符串长度+1M+1。称为内存预分配。
使用SDS的优点如下:
- 获取字符串长度的时间复杂度为0(1)
- 支持动态扩容
- 减少内存分配次数
- 二进制安全
当然上面的源码只是选取一个出来,事实上redis还提供很多种比特位的结构体,打开redis源码的sds.h文件就可以看见:
/* Note: sdshdr5 is never used, we just access the flags byte directly.
* However is here to document the layout of type 5 SDS strings. */
通过这个注释可以了解,redis提供5种SDS结构体,其中sdshdr5从来不被使用,一般都是直接访问标志字节
如果有兴趣了解更多相关内容,欢迎来我的个人网站看看:瞳孔的个人网站
|