本文主要介绍“Redis数据结构中的字符串类型有哪些”。在日常操作中,相信很多人对Redis数据结构中的String类型有疑问。边肖查阅了各种资料,整理出简单易用的操作方法,希望能帮助大家解答“Redis数据结构中的String类型有哪些”的疑惑!接下来,请和边肖一起学习!
Redis常用作分布式KV缓存。很多人只能用,却不知道底层还有很多不为人知的秘密。
String类型
String是Redis支持的最基本的数据类型。首先,让我们看一下String,以及它的数据结构和存储方式。
00-1010众所周知,redis是用C语言编写的,但是C语言没有String类型,只有char[],初始化时需要指定类型的大小,不能更改。为了实现诸如incr命令和append命令等动态添加和扩展功能,redis定义并维护了一个SDS(简单动态字符串)来实现这些功能。
让我们首先看看redis源代码中定义的数据结构。为了节省空间,有五种类型。
1.len:需要遍历数组才能得到char[]的长度,len(char[])的时间复杂度为o(n);
2.Alloc: C语言没有String类型,只有char[],char[]必须先分配空间长度,char[]提前分配长度,数据增长后需要扩展;
3.总是占用一个字节。的最低3位用于表示标头的类型。有五种类型的报头,在sds.h中有固定的定义
4.BUF[]:C语言的char数组,以' \0 '结尾,表示存储的二进制数据不能包含' \0 ',图片、音频等二进制存储会出现问题。——这就是Redis说自己实现的SDS是二进制安全字符串的原因。
00-1010 1.Redis实现SDS支持扩展
2.包括长度len,并获得长度复杂度O(1)
3.空间的预先分配
4.惰性空间的释放(如下所述)
重新定义SDS 去存储String
优势
支持容量扩展的能力
包括长度len,并得到长度复杂度O(1)
空间预分配
劣势
需要分配额外的内存
频繁分发和回收造成的效率问题
SDS对c原始char数组的改进
jemalloc分配内存时,根据我们申请的字节数n,会找到一个比n大但最接近n的2的幂作为分配空间,可以减少频繁分配的频率。比如说。如果申请6字节的空间,jemalloc实际上会分配8字节的空间;如果你申请24字节的空间,jemalloc将分配32字节。因此,在我们刚刚讨论的场景中,dictEntry结构占用了32个字节。
00-1010空间预分配用于优化SDS的字符串增长操作:当SDS的API修改一个SDS,需要扩展SDS的空间时,程序不仅会分配修改所需的空间,还会为SDS分配额外的未使用空间。
其中,分配的额外未使用空间量由以下公式确定:
如果修改SDS后SDS的长度(即len属性的值)将小于1 MB,那么程序将分配与len属性大小相同的未使用空间,然后SDS的LEN属性的值将与free属性的值相同。比如SDS的len修改后改为13字节,程序也会分配13字节的未用空间,SDS的buf数组实际长度会变成13 ^ 13 ^ 1=27字节(多一个字节用来存储空字符)。
如果对 SDS 进行修改之后, SDS 的长度将大于等于 1 MB , 那么程序会分配 1 MB 的未使用空间。 举个例子, 如果进行修改之后, SDS 的 len 将变成 30 MB , 那么程序会分配 1 MB 的未使用空间, SDS 的 buf 数组的实际长度将为 30 MB + 1 MB + 1 byte 。
通过空间预分配策略, Redis 可以减少连续执行字符串增长操作所需的内存重分配次数。
惰性释放
惰性空间释放用于优化 SDS 的字符串缩短操作: 当 SDS 的 API 需要缩短 SDS 保存的字符串时, 程序并不立即使用内存重分配来回收缩短后多出来的字节, 而是使用 free 属性将这些字节的数量记录起来, 并等待将来使用。
Redis的KV存储结构
在redis中,所有的存储都是以KV键值对的形式存储的,K是字符串类型,就是SDS;V 可能是字符串、list、hash等(Redis支持的数据结构),V并没有直接定成具体的类型,而是用redisObject封装了一层;实际存储的数据结构是由ptr指针具体指向。
并且,redis为了更好的节省空间,ptr指针也有不同方式的存储,一方面,当保存的是 Long 类型整数时,RedisObject 中的指针就直接赋值为整数数据了,这样就不用额外的指针再指向整数了,节省了指针的空间开销。另一方面,当保存的是字符串数据,并且字符串小于等于 44 字节时,RedisObject 中的元数据、指针和 SDS 是一块连续的内存区域,这样就可以避免内存碎片。这种布局方式也被称为 embstr 编码方式。当然,当字符串大于 44 字节时,SDS 的数据量就开始变多了,Redis 就不再把 SDS 和 RedisObject 布局在一起了,而是会给 SDS 分配独立的空间,并用指针指向 SDS 结构。这种布局方式被称为 raw 编码模式。如图所示
-
embstr 编码
存储简短字符串,一次的内存分配;
它是只读的,如果对内容进行修改,就会变成raw编码(即使没超过44字节); -
raw 编码
可分配多次内存空间,存储大于44个字节的长字符串。
raw 原生SDS 字符长度 缩减到小于44,会逆向变成embstr编码吗?
不会;Redis底层编码,转变后 不可逆(不会回退)。
到此,关于“Redis数据结构中的String类型有哪些”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/141700.html