Redis入门经典——The Little Redis Book (翻译)

来源:互联网 发布:java通用版游戏 编辑:程序博客网 时间:2024/04/29 10:12

The Little Redis Book

                By Karl Seguin

 

 

关于本书:本书完全免费下载。你可以随意转载,复制,但请你注明作者,Karl Seguin。译者,WY。以及不要用于商业用途。

关于作者:Karl 同志是广大屌丝IT码农中的一员。但经验丰富,不仅活好而且跨领域甚广。闲暇之余,跟笔者一样闲的蛋疼,写了几本小书。没想到还挺受欢迎,特别是The Little MongoDb Book,风靡码农界。更多资讯看他的个人博客http://openmymind.net 。

本书最新版本: http://github.com/karlseguin/the-little-redis-book

 

 

 

 

 

 

 

 

 

简介:

最近几年,用于数据持久化查询的的技术和工具到一个突飞猛进的地步。但可以打包票的说,关系型数据也就那样了,同时,围绕数据的那套系统却肯定会是大不一样的。

在所有的工具和技术解决方案中,Redis 是最令我虎躯一震的。第一是因为它太TM容易上手了。你只需花费几小时的时间就可以上手使用了。第二,它用一种非常通用的方法解决了一系列特殊问题。为什么呢?因为他并非所有的东西都是有关数据的。你了解的越多,对这句话的理解就会越深刻。

当你能仅用Redis 完成一个系统时,我想你已经找到它提供的最普遍的解决方案——不管该系统是传统的关系型数据库,还是一个基于文档的系统。在这方面,它有点像是一个索引引擎,不过你无须将所有应用构建在Lucene(由apache发布的著名的全文检索引擎工具包)上。当然,也就这一点相似而已。

本书的目的是介绍Redis 的一些基础。我们会把重点放在Redis 的五种数据结构以及不同的数据建模方法。当然还会接触一些关键的管理方法以及调试技巧。

   

 

 

开始:

     学习的方法不同,有人喜欢上手,有人喜欢看视频,也有人喜欢看书。不过最有效的方法不过直接试用一下了。在学习以下内容时,最好先安装一个Redis,灰常简单的哦。

 Redis是不支持Widows的,但这妨碍不了万能的码农们如果只是玩票的话,用https://github.com/MSOpenTech/redis。

*nix下的安装就自行谷歌下吧。

 安装完成后,以Linux 下为例,运行./redis-server.启动服务器,然后运行./redis-cli,将以默认接口(6379)连接本地服务.你可以在命令行下输入info 测试服务器的状态。

 

 

 

第一章   基础

  在研究Redis的时候首先我们要知道Redis是什么,他是为解决什么样的问题而出现的。

   Redis常被描述为一种常驻内存的的持续性的key_value存储。我认为这样描述有失精准,Redis的确是将所有数据存储在内存中,它也的确持续性的写入磁盘,但他绝不仅是简单的key_value存储。认识到这个偏见非常重要,否则你用它解决的问题就会大大变少。

事实上Redis发布了五种不同的数据结构,只有一种是典型的key_value结构。理解这五种结构,他们如何工作,相应的内嵌方法,以及根据他们如何建模才是重中之重。首先,

让我们理清数据结构的用途吧。

如果我们打算使用数据结构的概念到这个关联世界中,我们首先想到的就是数据库的一种简单数据结构——表(tables).表是一种既复杂又很灵活的结构。几乎所有的东西都可以用表来模拟,存储。然而他也并非没有缺点。因为并非所有的东西都像我们想的那样简单。如果我们用到的结构就是这种特殊的,无法用普遍方法解决的话怎么办呐?

对特殊的问题应用特殊的数据结构。我们编码不就是这样吗?你不会为每一条数据使用哈希表,你自然也不会用一个标量变量。对我来说,这就是Redis的用途。如果你是跟scalars,lists,hashes,或者sets打交道,为什么不把他们存储为这种形式呢。

基本模块:

1,数据库

Redis也有你所熟悉的数据库的概念,一个数据库包含一系列数据。数据库的经典用途就是将一个应用的所有数据组合在一起,将它与其他的应用分离开。

在Redis里,数据库被简单地用一个数字来识别,比如用0来表示默认的数据库。你过你想换一个不同的数据库,可以在命令行里使用select命令。比如:select1.Redis会回复OK 。表示你修改成功。如果想换回来,只需要输入select0 即可。

2,命令行,Keys 和 Values

   因为Redis不仅仅是key_value存储服务,而且Redis的五种数据结构至少有一个key和一个value.这样我们理解key_value就显得尤为重要了。

Keys是你识别一段数据的依据。我们以后会经常跟keys打交道,但现在,你只需了解一个key大概是长这样就可以了:user:leto .我们可以猜测这是一个用户名为leto的用户信息。冒号没有任何特殊意义,只是作为一个分隔符。

Values 代表与keys相关联的实际信息。他们可以是任何东西。可以是字符串,整数,甚至序列化对象(JSON,XML等)。对Redis来说,不管他们是什么格式,不过是一系列的字节而已。注意不同的驱动会处理不同格式的对象,所以本书我们只讨论字符串,整数以及JSON。

好了,现在开始动手。输入以下命令:

set  users:leto ‘{“name”:”leto”,”planet”:”dune”,”likes”:[“spice”]}’

这是Redis最基本的操作。首先是set 命令,后边是两个参数。第一个是要设定的keys参数,第二个是values参数。许多命令(并非全部)是只有一个key参数。那如何获取数据呢,如下:

get users:leto
    现在可以自己尝试下其他的组合。Keys和values是最基本的概念,而get和set是操作他们最简单的方式。

         3,查询

由上文我们可以看到,对于Redis而言,keys代表一切,而values无法查询到任何东西。比如:上文中,我们无法通过属性planet 的dune 值查询到任何东西。

许多人认为这将导致很多不便。因为我们知道数据查询要求灵活,强大,而Redis的方法显得有些原始,不切实际。不要为这点耿耿于怀。记住,Redis不是一种万能的方法。查询的限制是Redis本身具有的。

     4,内存和持久化

我们之前提过Redis是常驻内存的持久化存储。Redis会依据有多少keys改变而将相应的数据库输出到磁盘。默认配置,如果有超过1000个keys改变,Redis每60秒做一次存储。

同时,Redis还有append模式。当一个key改变时,磁盘上的append_only_file会相应更新。有些情况下会丢失60秒的数据的代价来换取性能,当然,这会导致一些硬件或者软件的问题。有些情况下这个代价是无法接受的。Redis将选择权交给我们。第六章的时候,还会有第三种选项,将持续性交给slave进程处理。

Redis将所有数据存储在内存里,最明显的代价就是:占据太多RAM,而这仍然是服务器硬件中最贵的部分。

我觉得有些开发者可能忘了数据所占的空间其实不大。莎士比亚的全集才仅占不到5.5M的内存。而且,其他的解决方案无非是通过不断IO或者大量消耗CPU,也是得不偿失的。所以除非是存储非常大的多媒体文件,内存方面真不是问题。

Redis的确是支持虚拟内存的。但是这个特点已被证实是个败笔,不被推荐。

(提示:5.5M的莎士比亚全集可以被压缩为2M。虽然Redis不提供自动压缩功能,但是因为它把values看做字节,所以对此数据进行压缩是非常可行的。)

      5,标题串联

     最后我想把所有的小标题串联起来。特别是,查询限制,数据结构,Redis的内存存储方式。

     当你把这些东西结合起来的时候,就会得出一个灰常牛逼的结果:速度。一些人可能会想,“当然了,一切都在内存中必须快啊”。这只是一部分而已。Redis优于其他解决方案的真正原因是他的特殊的数据结构。

     有多快?这取决于很多因素——所用的命令,数据类型,等等。Redis的性能趋向于每秒以万记甚至以十万计数。你可以运行 redis_benchmark (与redis-server,redis-cli同一文件夹下)来测试。

    以上这些是非常重要的因为它会影响你以后将如何使用Redis。有SQL使用背景的开发者趋向于减少访问数据库的次数。这对于任何系统来说都是一个好建议,包括Redis。但是,由于我们经常跟简单的数据结构打交道,我们也需要多次访问才能达到目的。刚开始我们可能不适应,但对比以前的方法这种代价还是值得的。

          6,小结

尽管我们没怎么实际操作Redis,但我们已经了解了很多必要的知识。可能有些地方还不是很清楚,不要紧,接下来的章节你可能会不经意间发现答案。

本章重要内容如下:

.key是识别value数据的一个字符串标示。

.对Redis而言,value只是一系列字节,不管是何种格式。

.Redis有五种特殊的数据结构。

.综上所述,Redis即快又易用。但并不适合所有场合。

 

 

 

     第二章   数据结构

   接下来我们开始学习五种数据结构。我们会解释每一种数据结构,涉及到的方法,以及它使用的场景。

迄今为止我们还没有接触数据结构的概念。当我们使用“set”命令的时候,Redis怎么会知道我们使用哪种数据结构呢?其实每条命令都是针对特定的一种数据结构。例如,当你使用“set”的时候,针对的就是string这种数据结构。,当你使用“hset”的时候就是针对hash。

各种数据结构详细的方法本书就不再一一列举,感兴趣的可以自行查阅手册。

不过,任何时候,你都可以用“flushdb”来清除所有数据。

1,       Strings

Strings是Redis中最基本的数据结构。当你想到key_value对的时候,正是String结构。不要被他的名字迷惑,value值可以是任何形式。

我们已经见过常用的形式了。下面的形式是我们以后会经常用到的:

Setusers:leto ‘{“name”:leto,”palnet”:dune,”likes”:[“spice”]}’

另外,Redis提供一些普遍的操作方法。例如, strlen<key> 用于获取某个key对应的value的长度;getrange<key> <start><end>返回value对应范围的值;append <key><value>将value加到对应的value值后面。

示例如下:


现在,你也许会说,很好,但是这也没什么用啊。你不能有意义的拉出JSON中的值以及附加value值啊。的确,本节内容仅仅是讲解一些命令,尤其是对于string的。

前面的时候我们说过Redis是不关心values值的形式的。这句话大部分情况下是正确的。然而,有些针对String的命令对value的类型还是敏感的。例如incr,incrby,decr,decrby.示例如下:


试一下 incr users:leto,会返回一个错误。


        2, Hashes

       人们经常说,hash是Redis作为一个key_value存储器的最好的例子。其实这种说法有失公允。你看,很多时候,hashes结构很像是Strings结构。最重要的区别就是,他们提供了一个额外的间接寻址方式:一个字段。所以hash的get和set方法如下:


  我们也可以同时设置,获取或者删除多个字段,示例如下:


       可以看出,hash给我们更多可控制的简单字符串。比起将信息存储到简单的序列化字符串中,我们可以用hash得到更加精确地表示。好处就是比较灵活的得到或者修改,删除特定数据,而不用先获取所有数据。

从一个定义好的对象的视角来看待hash结构,是理解他工作方式的重点。从性能角度讲,细粒度的控制是非常有用的。下一章我们会讲解hash如何用来组织数据令查询更加实用。我觉得,这才是让hash结构发光的原因。


      3,       LISTS

     Lists允许你针对一个给定的key来存储和操作一个数组value。你可以根据给定的key增加value,获取第一个或者最后一个value值。Lists会保持插入顺序。我们可以用一个newusers 的list来追踪最新注册的用户。


首先我们把一个新用户push进list里面,然后对他进行裁剪使其最多包含50个user。这是一种非常普遍的方式。ltrim是一个复杂度为O(n)的操作,非常高效。

(这一段实在不知如何翻译,摘抄如下:)(大致意思就是用list存储其他数据结构的key.代码是用ruby写的)

This is also the first time that we are seeing a valuein one key referencing a value in another. If we wanted to get the details ofthe last 10 users, we’d do the following combination:

ids =redis.lrange('newusers', 0, 9)

redis.mget(*ids.map {|u|"users:#{u}"})

The above is a bit of Ruby which shows the type ofmultiple roundtrips we talked about before.

    当然,lists不仅仅是善于存储其他keys的引用。它的values也可以是任何东西。你可以用它来存储日志,或者用户的访问站点的动作记录。如果是在游戏中,你可以用来追踪玩家的行为。

         4,Sets

Sets数据结构存储无重复的value值,而且是无顺序的,但他提供的基于value值的查询速度非常快。示例如下:


不管这个用户的朋友有多少,我们都可以在O(1)的时间复杂度内查询出某人是否是它的朋友:


甚至于我们也可以得到两个人是否有相同的朋友:

sinter friends:letofriends:duncan

或者将他们共同的朋友存到另一个新键值中。

sinterstorefriends:leto_duncan friends:leto friends:duncan

sets集合常用于不允许值重复的情况(或者是有inter(取交集),union(取合集)操作的数据)。

       5,  Sorted Sets

最后一个强大的数据结构就是sorted sets,如果说hash是带字段的string结构,那么sorted set 就是带score(分数)的set。Score提供了排序,比较的功能。比如,我们要做一个朋友的排行榜:

zadd friends:duncan 70ghanima 95 paul 95 chani 75 jessica 1 vladimir

我们要找出score>90(假设score最高为100)的朋友有几个,可以如下操作:

zcount friends:duncan 90 100

    找出chani 的排名:

zrevrank friends:duncan chani

    我们用zrerank 而不是使用zrank 的原因是Redis默认的排序策略是由小到大。而此处需要从大到小排序,故用zrerank。对于sorted sort,最常用的例子就是排行榜系统了。实际上,任何需要用一系列整数进行排序,或者需要对score进行一系列操作的都很适用sorted set结构。

        小结

本节大致了解了一下五种数据结构。比较清楚地是,Redis能做的要比你想到的多。也许现在还有很多对string或者sorted set的应用没有人想到。只要你懂得了一些常用方法,就会发现Redis的目的是作为一种解决问题的通用方法。当然,不要想当然的认为Redis提供了五中数据结构以及对应的方法,你就要必须全部用他们。

 

 

 

         第三章   数据结构进阶

    以前的章节中我们讨论了数据结构以及他们能解决的问题实例。现在应该涉及一些比较高级但是通用的设计方法模式了。(待续)


 

0 0
原创粉丝点击