Redis入门经典——The Little Redis Book （翻译）

来源：互联网发布：java通用版游戏编辑：程序博客网时间：2024/04/29 10:12

The Little Redis Book

By Karl Seguin

关于本书：本书完全免费下载。你可以随意转载，复制，但请你注明作者，Karl Seguin。译者,WY。以及不要用于商业用途。

关于作者：Karl 同志是广大屌丝IT码农中的一员。但经验丰富，不仅活好而且跨领域甚广。闲暇之余，跟笔者一样闲的蛋疼，写了几本小书。没想到还挺受欢迎，特别是The Little MongoDb Book，风靡码农界。更多资讯看他的个人博客http://openmymind.net 。

本书最新版本： http://github.com/karlseguin/the-little-redis-book

简介：

最近几年，用于数据持久化查询的的技术和工具到一个突飞猛进的地步。但可以打包票的说，关系型数据也就那样了，同时，围绕数据的那套系统却肯定会是大不一样的。

在所有的工具和技术解决方案中，Redis 是最令我虎躯一震的。第一是因为它太TM容易上手了。你只需花费几小时的时间就可以上手使用了。第二，它用一种非常通用的方法解决了一系列特殊问题。为什么呢？因为他并非所有的东西都是有关数据的。你了解的越多，对这句话的理解就会越深刻。

当你能仅用Redis 完成一个系统时，我想你已经找到它提供的最普遍的解决方案——不管该系统是传统的关系型数据库，还是一个基于文档的系统。在这方面，它有点像是一个索引引擎，不过你无须将所有应用构建在Lucene（由apache发布的著名的全文检索引擎工具包）上。当然，也就这一点相似而已。

本书的目的是介绍Redis 的一些基础。我们会把重点放在Redis 的五种数据结构以及不同的数据建模方法。当然还会接触一些关键的管理方法以及调试技巧。

开始：

学习的方法不同，有人喜欢上手，有人喜欢看视频，也有人喜欢看书。不过最有效的方法不过直接试用一下了。在学习以下内容时，最好先安装一个Redis，灰常简单的哦。

Redis是不支持Widows的，但这妨碍不了万能的码农们如果只是玩票的话，用https://github.com/MSOpenTech/redis。

*nix下的安装就自行谷歌下吧。

安装完成后，以Linux 下为例，运行./redis-server.启动服务器，然后运行./redis-cli，将以默认接口（6379）连接本地服务.你可以在命令行下输入info 测试服务器的状态。

第一章基础

在研究Redis的时候首先我们要知道Redis是什么，他是为解决什么样的问题而出现的。

Redis常被描述为一种常驻内存的的持续性的key_value存储。我认为这样描述有失精准，Redis的确是将所有数据存储在内存中，它也的确持续性的写入磁盘，但他绝不仅是简单的key_value存储。认识到这个偏见非常重要，否则你用它解决的问题就会大大变少。

事实上Redis发布了五种不同的数据结构，只有一种是典型的key_value结构。理解这五种结构，他们如何工作，相应的内嵌方法，以及根据他们如何建模才是重中之重。首先，

让我们理清数据结构的用途吧。

如果我们打算使用数据结构的概念到这个关联世界中，我们首先想到的就是数据库的一种简单数据结构——表（tables）.表是一种既复杂又很灵活的结构。几乎所有的东西都可以用表来模拟，存储。然而他也并非没有缺点。因为并非所有的东西都像我们想的那样简单。如果我们用到的结构就是这种特殊的，无法用普遍方法解决的话怎么办呐？

对特殊的问题应用特殊的数据结构。我们编码不就是这样吗？你不会为每一条数据使用哈希表，你自然也不会用一个标量变量。对我来说，这就是Redis的用途。如果你是跟scalars,lists,hashes,或者sets打交道，为什么不把他们存储为这种形式呢。

基本模块:

1，数据库

Redis也有你所熟悉的数据库的概念，一个数据库包含一系列数据。数据库的经典用途就是将一个应用的所有数据组合在一起，将它与其他的应用分离开。

在Redis里，数据库被简单地用一个数字来识别，比如用0来表示默认的数据库。你过你想换一个不同的数据库，可以在命令行里使用select命令。比如：select1.Redis会回复OK 。表示你修改成功。如果想换回来，只需要输入select0 即可。

2,命令行，Keys 和 Values

因为Redis不仅仅是key_value存储服务，而且Redis的五种数据结构至少有一个key和一个value.这样我们理解key_value就显得尤为重要了。

Keys是你识别一段数据的依据。我们以后会经常跟keys打交道，但现在，你只需了解一个key大概是长这样就可以了：user：leto .我们可以猜测这是一个用户名为leto的用户信息。冒号没有任何特殊意义，只是作为一个分隔符。

Values 代表与keys相关联的实际信息。他们可以是任何东西。可以是字符串，整数，甚至序列化对象（JSON,XML等）。对Redis来说，不管他们是什么格式，不过是一系列的字节而已。注意不同的驱动会处理不同格式的对象，所以本书我们只讨论字符串，整数以及JSON。

好了，现在开始动手。输入以下命令：

set users:leto ‘{“name”:”leto”,”planet”:”dune”,”likes”:[“spice”]}’

这是Redis最基本的操作。首先是set 命令，后边是两个参数。第一个是要设定的keys参数，第二个是values参数。许多命令（并非全部）是只有一个key参数。那如何获取数据呢，如下：

get users:leto
现在可以自己尝试下其他的组合。Keys和values是最基本的概念，而get和set是操作他们最简单的方式。

3，查询

由上文我们可以看到，对于Redis而言，keys代表一切，而values无法查询到任何东西。比如：上文中，我们无法通过属性planet 的dune 值查询到任何东西。

许多人认为这将导致很多不便。因为我们知道数据查询要求灵活，强大，而Redis的方法显得有些原始，不切实际。不要为这点耿耿于怀。记住，Redis不是一种万能的方法。查询的限制是Redis本身具有的。

4，内存和持久化

我们之前提过Redis是常驻内存的持久化存储。Redis会依据有多少keys改变而将相应的数据库输出到磁盘。默认配置，如果有超过1000个keys改变，Redis每60秒做一次存储。

同时，Redis还有append模式。当一个key改变时，磁盘上的append_only_file会相应更新。有些情况下会丢失60秒的数据的代价来换取性能，当然，这会导致一些硬件或者软件的问题。有些情况下这个代价是无法接受的。Redis将选择权交给我们。第六章的时候，还会有第三种选项，将持续性交给slave进程处理。

Redis将所有数据存储在内存里，最明显的代价就是：占据太多RAM，而这仍然是服务器硬件中最贵的部分。

我觉得有些开发者可能忘了数据所占的空间其实不大。莎士比亚的全集才仅占不到5.5M的内存。而且，其他的解决方案无非是通过不断IO或者大量消耗CPU，也是得不偿失的。所以除非是存储非常大的多媒体文件，内存方面真不是问题。

Redis的确是支持虚拟内存的。但是这个特点已被证实是个败笔，不被推荐。

（提示：5.5M的莎士比亚全集可以被压缩为2M。虽然Redis不提供自动压缩功能，但是因为它把values看做字节，所以对此数据进行压缩是非常可行的。）

5，标题串联

最后我想把所有的小标题串联起来。特别是，查询限制，数据结构，Redis的内存存储方式。

当你把这些东西结合起来的时候，就会得出一个灰常牛逼的结果：速度。一些人可能会想，“当然了，一切都在内存中必须快啊”。这只是一部分而已。Redis优于其他解决方案的真正原因是他的特殊的数据结构。

有多快？这取决于很多因素——所用的命令，数据类型，等等。Redis的性能趋向于每秒以万记甚至以十万计数。你可以运行 redis_benchmark (与redis-server，redis-cli同一文件夹下)来测试。

以上这些是非常重要的因为它会影响你以后将如何使用Redis。有SQL使用背景的开发者趋向于减少访问数据库的次数。这对于任何系统来说都是一个好建议，包括Redis。但是，由于我们经常跟简单的数据结构打交道，我们也需要多次访问才能达到目的。刚开始我们可能不适应，但对比以前的方法这种代价还是值得的。

6，小结

尽管我们没怎么实际操作Redis，但我们已经了解了很多必要的知识。可能有些地方还不是很清楚，不要紧，接下来的章节你可能会不经意间发现答案。

本章重要内容如下：

.key是识别value数据的一个字符串标示。

.对Redis而言，value只是一系列字节，不管是何种格式。

.Redis有五种特殊的数据结构。

.综上所述，Redis即快又易用。但并不适合所有场合。

第二章数据结构

接下来我们开始学习五种数据结构。我们会解释每一种数据结构，涉及到的方法，以及它使用的场景。

迄今为止我们还没有接触数据结构的概念。当我们使用“set”命令的时候，Redis怎么会知道我们使用哪种数据结构呢？其实每条命令都是针对特定的一种数据结构。例如，当你使用“set”的时候，针对的就是string这种数据结构。，当你使用“hset”的时候就是针对hash。

各种数据结构详细的方法本书就不再一一列举，感兴趣的可以自行查阅手册。

不过，任何时候，你都可以用“flushdb”来清除所有数据。

1， Strings

Strings是Redis中最基本的数据结构。当你想到key_value对的时候，正是String结构。不要被他的名字迷惑，value值可以是任何形式。

我们已经见过常用的形式了。下面的形式是我们以后会经常用到的：

Setusers:leto ‘{“name”:leto,”palnet”:dune,”likes”:[“spice”]}’

另外，Redis提供一些普遍的操作方法。例如， strlen<key> 用于获取某个key对应的value的长度；getrange<key> <start><end>返回value对应范围的值；append <key><value>将value加到对应的value值后面。

示例如下：

现在，你也许会说，很好，但是这也没什么用啊。你不能有意义的拉出JSON中的值以及附加value值啊。的确，本节内容仅仅是讲解一些命令，尤其是对于string的。

前面的时候我们说过Redis是不关心values值的形式的。这句话大部分情况下是正确的。然而，有些针对String的命令对value的类型还是敏感的。例如incr,incrby,decr,decrby.示例如下：

试一下 incr users:leto,会返回一个错误。

2, Hashes

人们经常说，hash是Redis作为一个key_value存储器的最好的例子。其实这种说法有失公允。你看，很多时候，hashes结构很像是Strings结构。最重要的区别就是，他们提供了一个额外的间接寻址方式：一个字段。所以hash的get和set方法如下：

我们也可以同时设置，获取或者删除多个字段，示例如下：

可以看出，hash给我们更多可控制的简单字符串。比起将信息存储到简单的序列化字符串中，我们可以用hash得到更加精确地表示。好处就是比较灵活的得到或者修改，删除特定数据，而不用先获取所有数据。

从一个定义好的对象的视角来看待hash结构，是理解他工作方式的重点。从性能角度讲，细粒度的控制是非常有用的。下一章我们会讲解hash如何用来组织数据令查询更加实用。我觉得，这才是让hash结构发光的原因。

3， LISTS

Lists允许你针对一个给定的key来存储和操作一个数组value。你可以根据给定的key增加value，获取第一个或者最后一个value值。Lists会保持插入顺序。我们可以用一个newusers 的list来追踪最新注册的用户。

首先我们把一个新用户push进list里面，然后对他进行裁剪使其最多包含50个user。这是一种非常普遍的方式。ltrim是一个复杂度为O（n）的操作，非常高效。

（这一段实在不知如何翻译，摘抄如下：）（大致意思就是用list存储其他数据结构的key.代码是用ruby写的）

This is also the first time that we are seeing a valuein one key referencing a value in another. If we wanted to get the details ofthe last 10 users, we’d do the following combination:

ids =redis.lrange('newusers', 0, 9)

redis.mget(*ids.map {|u|"users:#{u}"})

The above is a bit of Ruby which shows the type ofmultiple roundtrips we talked about before.

当然，lists不仅仅是善于存储其他keys的引用。它的values也可以是任何东西。你可以用它来存储日志，或者用户的访问站点的动作记录。如果是在游戏中，你可以用来追踪玩家的行为。

4，Sets

Sets数据结构存储无重复的value值，而且是无顺序的，但他提供的基于value值的查询速度非常快。示例如下：

不管这个用户的朋友有多少，我们都可以在O(1)的时间复杂度内查询出某人是否是它的朋友：

甚至于我们也可以得到两个人是否有相同的朋友：

sinter friends:letofriends:duncan

或者将他们共同的朋友存到另一个新键值中。

sinterstorefriends:leto_duncan friends:leto friends:duncan

sets集合常用于不允许值重复的情况（或者是有inter（取交集），union（取合集）操作的数据）。

5, Sorted Sets

最后一个强大的数据结构就是sorted sets,如果说hash是带字段的string结构，那么sorted set 就是带score（分数）的set。Score提供了排序，比较的功能。比如，我们要做一个朋友的排行榜：

zadd friends:duncan 70ghanima 95 paul 95 chani 75 jessica 1 vladimir

我们要找出score>90（假设score最高为100）的朋友有几个，可以如下操作：

zcount friends:duncan 90 100

找出chani 的排名：

zrevrank friends:duncan chani

我们用zrerank 而不是使用zrank 的原因是Redis默认的排序策略是由小到大。而此处需要从大到小排序，故用zrerank。对于sorted sort，最常用的例子就是排行榜系统了。实际上，任何需要用一系列整数进行排序，或者需要对score进行一系列操作的都很适用sorted set结构。

小结

本节大致了解了一下五种数据结构。比较清楚地是，Redis能做的要比你想到的多。也许现在还有很多对string或者sorted set的应用没有人想到。只要你懂得了一些常用方法，就会发现Redis的目的是作为一种解决问题的通用方法。当然，不要想当然的认为Redis提供了五中数据结构以及对应的方法，你就要必须全部用他们。

第三章数据结构进阶

以前的章节中我们讨论了数据结构以及他们能解决的问题实例。现在应该涉及一些比较高级但是通用的设计方法模式了。（待续）

0 0