python学习—Day30—redis

来源:互联网 发布:妇幼保健三级网络建设 编辑:程序博客网 时间:2024/06/15 23:58

NoSQL简介:

NoSQL,泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。

虽然NoSQL的流行与火起来才短短几年的时间,但是不可否认,现在已经开始了第二代运动。尽管早期的堆栈代码只能算是一种实验,然而现在的系统已经更加的成熟、稳定。不过现在也面临着一个严酷的事实:技术越来越成熟——以至于原来很好的NoSQL数据存储不得不进行重写,也有少数人认为这就是所谓的2.0版本。该工具可以为大数据建立快速、可扩展的存储库。

非关系型数据库和关系型数据库的差别:

非关系型数据库的优势:1. 性能NOSQL是基于键值对的,可以想象成表中的主键和值的对应关系,而且不需要经过SQL层的解析,所以性能非常高。2. 可扩展性同样也是因为基于键值对,数据之间没有耦合性,所以非常容易水平扩展。关系型数据库的优势:1. 复杂查询可以用SQL语句方便的在一个表以及多个表之间做非常复杂的数据查询。2. 事务支持使得对于安全性能很高的数据访问要求得以实现。对于这两类数据库,对方的优势就是自己的弱势,反之亦然。但是近年来这两种数据库都在向着另外一个方向进化。例如:NOSQL数据库慢慢开始具备SQL数据库的一些复杂查询功能的雏形,比如Couchbase的index以及MONGO的复杂查询。对于事务的支持也可以用一些系统级的原子操作来实现例如乐观锁之类的方法来曲线救国。SQL数据库也开始慢慢进化,比如HandlerSocker技术的实现,可以在MYSQL上实现对于SQL层的穿透,用NOSQL的方式访问数据库,性能可以上可以达到甚至超越NOSQL数据库。可扩展性上例如Percona Server,可以实现无中心化的集群。虽然这两极都因为各自的弱势而开始进化出另一极的一些特性,但是这些特性的增加也会消弱其本来具备的优势,比如Couchbase上的index的增加会逐步降低数据库的读写性能。所以怎样构建系统的短期和长期存储策略,用好他们各自的强项是架构师需要好好考虑的重要问题。



redis服务搭建:

redis的概念:

redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sortedset --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。

Redis 是一个高性能的key-value数据库。 redis的出现,很大程度补偿了memcached这类key/value存储的不足,在部 分场合可以对关系数据库起到很好的补充作用。它提供了Java,C/C++,C#,PHP,JavaScript,Perl,Object-C,Python,Ruby,Erlang等客户端,使用很方便。

Redis支持主从同步。数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。这使得Redis可执行单层树复制。存盘可以有意无意的对数据进行写操作。由于完全实现了发布/订阅机制,使得从数据库在任何地方同步树时,可订阅一个频道并接收主服务器完整的消息发布记录。同步对读取操作的可扩展性和数据冗余很有帮助。

安装redis步骤:
[root@localhost package]# tar -zxvf redis-3.0.1.tar.gz -C /usr/src/
[root@localhost package]# cd /usr/src/redis-3.0.1/
[root@localhost redis-3.0.1]# make
然后直接启动:
[root@localhost redis-3.0.1]# src/redis-sever &\\还可以使用指定配置文件的形式启动:[root@localhost redis-3.0.1]# ./src/redis-server redis.conf
检查redis是否正常启动:
[root@localhost redis-3.0.1]# ps -ef | grep redis
root       6358   3016  0 23:58 pts/0    00:00:00 src/redis-server *:6379\\默认监听端口


配置文件:redis.conf中的:daemonize选项是否支持后台启动,默认为no,需要修改为yes。
如果需要配置redis的主从,则在从的配置文件里面最后添加 : salvof  master-ip 端口  即可。
从服务器的使用(是否具有写权限:有参数  slave-read-only 控制)

linux客户端操作:
[root@localhost redis-3.0.1]# ./src/redis-cli
127.0.0.1:6379> keys *
(empty list or set)
127.0.0.1:6379> exit
下面介绍python界面操作。


redis的简单操作:

#@File :redis_mode.pyimport redis# redis_config = {#     "host": "192.168.172.20"#     "port": 6379# }
# r = redis.Redis(**redis_config)
r = redis.Redis(host="192.168.172.20", port=6379)r.set("xiao", "OK")\\set操作:第一个参数是key,第二个参数就是valueprint(r.keys())\\r.keys就是获取到所有的keyprint(r.get("xiao"))\\r.get就是获取到key的值
[root@localhost redis-3.0.1]# ./src/redis-cli
127.0.0.1:6379> keys *
1) "xiao"



redis连接池:

import redis
pool = redis.ConnectionPool(host="192.168.172.20")r = redis.Redis(connection_pool=pool)r.set("name", "xiaojingjing")print(r.get("name"))
xiaojingjing

或者如下图:




redis管道:redis的管道,可以一次执行多条redis命令。

管道(将多个命令打包发送,同时server也将所有需要返回的值放在内存中直到发送给client。有利有弊。)

redis-py默认在执行每次请求都会创建(连接池申请连接)和断开(归还连接池)一次连接操作,如果想要在一次请求中指定多个命令,则可以使用pipline实现一次请求指定多个命令,并且默认情况下一次pipline 是原子性操作。减少功耗

redis是一个cs模式的tcp server,使用和http类似的请求响应协议。一个client可以通过一个socket连接发起多个请求命令。每个请求命令发出后client通常会阻塞并等待redis服务处理,redis处理完后请求命令后会将结果通过响应报文返回给client。


基本的通信过程如下:

Client: INCR X

Server: 1

Client: INCR X

Server: 2

Client: INCR X

Server: 3

Client: INCR X

Server: 4

基本上四个命令需要8个tcp报文才能完成。由于通信会有网络延迟,假如从client和server之间的包传输时间需要0.125秒。那么上面的四个命令8个报文至少会需要1秒才能完成。这样即使redis每秒能处理100个命令,而我们的client也只能一秒钟发出四个命令。这显示没有充分利用 redis的处理能力。除了可以利用mget,mset 之类的单条命令处理多个key的命令外我们还可以利用pipeline的方式从client打包多条命令一起发出,不需要等待单条命令的响应返回,而redis服务端会处理完多条命令后会将多条命令的处理结果打包到一起返回给客户端。通信过程如下:

Client: INCR X

Client: INCR X

Client: INCR X

Client: INCR X

Server: 1

Server: 2

Server: 3

Server: 4

假设不会因为tcp报文过长而被拆分。可能两个tcp报文就能完成四条命令,client可以将四个命令放到一个tcp报文一起发送,server则可以将四条命令的处理结果放到一个tcp报文返回。通过pipeline方式当有大批量的操作时候。我们可以节省很多原来浪费在网络延迟的时间。需要注意到是用 pipeline方式打包命令发送,redis必须在处理完所有命令前先缓存起所有命令的处理结果。打包的命令越多,缓存消耗内存也越多。所以并是不是打包的命令越多越好。具体多少合适需要根据具体情况测试


示例:
#!/usr/bin/env python# -*- coding:UTF-8 -*-# @Time :2017/11/27 0:39# @Author :xiaojingjing#@File :redis_guandao.pyimport datetimeimport redisdef withpipe(r):    pipe = r.pipeline(transaction=True)\\获得一个管道对象。    for i in xrange(1, 1000):        key = "test1" +str(i)        value = "test1" + str(i)        pipe.set(key, value)    pipe.execute()\\使用管道函数def withoutpipe(r):    # pipe = r.pipeline(transaction=True)    for i in xrange(1, 1000):        key = "test1" + str(i)        value = "test1" + str(i)        r.set(key, value)if __name__ == "__main__":    pool = redis.ConnectionPool(host="192.168.172.20", port=6379, db=0)\\db这里最好使用0    r1 = redis.Redis(connection_pool=pool)\\分别取两个链接    r2 = redis.Redis(connection_pool=pool)    start = datetime.datetime.now()    # print(start)    withpipe(r1)    end = datetime.datetime.now()    # print((end-start).microseconds)\\取微秒值,因为程序执行还是很快的。    # print(end-start)    t_time = (end - start).microseconds    print("withpipe time is : {0}".format(t_time))\\打印时间差    start = datetime.datetime.now()    withoutpipe(r2)    end = datetime.datetime.now()    t_time = (end - start).microseconds    print("withoutpipe time is : {0}".format(t_time))
withpipe time is : 41000
withoutpipe time is : 247000


reids目前提供5种数据类型:string类型, list类型,set集合类型, 有序集合类型, hash类型
具体操作下次继续~啦啦啦




原创粉丝点击