redis常用内存优化手段与参数

来源:互联网 发布:excel数据有效性条件 编辑:程序博客网 时间:2024/05/01 07:32
原文地址:http://www.infoq.com/cn/articles/tq-redis-memory-usage-optimization-storage
通过上面的实现上的分析,可以看出redis的内存管理成本比较高,即占用了过多的内存,redis的作者对这点也很清楚,所以提供了一系列的参数和手段来控制和节省内存:

首先最重要的一点是不要开启redis的vm选项,即虚拟内存功能。这个本来是作为redis存储超出物理内存数据的一种数据在内存与磁盘换入换出的一个持久化策略,但是其内存管理成本也很搞,并且我们后续会分析此种持久化策略并不成熟,所以关闭vm功能,所以请设置redis.conf文件中 的vm-enabled 为no。
其次,最好设置下redis.conf中的maxmemory选项,该选项告诉redis当使用了多少物理内存后就开始拒绝后续的写入请求,该参数能很好的保护好你的redis不会因为使用过多的物理内存而导致swap,最红严重影响性能甚至崩溃。

另外redis为不同数据类型分别提供了一组参数来控制内存使用,我们前面详细分析过redis hash是value内部为一个hashmap,如果该map 的成员比较少,则会采用类似一维线性的紧凑格式来存储该map,即省去了大量指针的内存开销,这个从拿书控制对应在redis.conf配置文件中下面两项:
hash-max-zipmap-entries 64
hash-max-zipmap-value 512
hash-max-zipmap-entres

含义是当value这个map内部不超过多少成员时会采用线性紧凑格式存储,默认是64,即 alue内部有64个以下的成员就是使用线性紧凑存储,超过该值就自动转成真正的hashMap。
hash-max-zipmap-value 含义是当alue 这个map内部的每个成员值长度不超过多少字节就会采用线性紧凑存储来节省空间。
以上两个条件,任意一条超过设置就会转成真正的hashmap,也就不会再节省内存了,那么这个值是不是设置的越大越好呢。答案当然是否定的,hashmap的优势就是查找和操作的时间复杂度都是o(1)的,而放弃hash采用一维存储则是o(n)的时间复杂度,如果成员数量很少,则影响不大,否则严重影响性能,所以要权衡这个值的设置。总体上是最根本的时间成本和空间成本上的权衡。

同类参数还有:
list-max-ziplist-entries 512
说明:list数据类型多少节点以下会采用去指针的紧凑存储格式。

list-max-ziplist-value 64
说明:list数据类型节点值大小系哦啊与多少字节会采用紧凑存储格式。
set-max-inset-entries 512
说明set数据类型内部数据如果全部是数值型,且包含多少字节点以下,会采用紧凑存储格式。

redis内部实现没有对内存分配方面做过多的优化,一定程度上回存在内存碎片,不过大多数的情况下,这个不会成为redis的性能瓶颈。不过如果在redis内部存储的大部分是数值型的话,redis内部采用了一个shared integer的方式来省去分配内存的开销,即在系统启动是先分配一个从1~n那么多个数值对象放在一个池子中,如果存储的数据恰好是这个数值范围内的数据,则直接诶从池子里取出对象。并且通过引用技术的方式来分享。这样在系统存储了大量数值下,也能在一定程度上节省内存并且提高ixngneng,这个参数值n的设置需要修改源代码中的一行宏定义:REDIS_SHARED_INTERGERS,该值默认为10000,可以根据自己的需要进行修改,修改后重新编译就可以了。


redis的持久化机制:
四种持久化方式:
定时快照方式---snapshot----------定时器事件---固定时间点检查当前数据发生的改变次数与时间是否满足触发持久化的条件。满足时,就通过fork调用来创建一个子进程。
这个子进程默认会与父进程共享相同的地址空间,这时就可以通过子进程来遍历整个内存来进行存储操作,而主进程则仍然可以提供服务,当有写入时由操作系统按照内存页(page)为单位来进行copy-on-write保证父子进程之间不会互相影响。

该持久化的主要缺点是定时快照只是代表一段时间内的内存映像,所以系统重启会丢失上次快照与重启之间所有的数据

基于语句追加文件的方式------aof-------类似mysql基于语句的binlog方式,即每条会使redis内存数据发生改变的命令都会追加到一个log文件中,也就是说这个log文件就是redis的持久化数据。
缺点是:追加log文件可能导致体积过大,当系统重启恢复数据时如果是aof的方式则加载数据会非常缓慢
虚拟内存----vm--------已被遗弃。。。。
Diskstore方式-------B-tree


    设计思路上,前两种基于全部数据都在内存中,即小数据量下提供磁盘落地功能。
    后两种方式则是作者在尝试存储数据超过物理内存时,即大数据量的数据存储。仍在实验阶段

0 0
原创粉丝点击