python之yield(二)
来源:互联网 发布:minix3.3.0源码下载 编辑:程序博客网 时间:2024/05/16 19:25
前言
建立前文提到的yield基本应用,协程概念之后,在续一些协程衍生出的异步应用。经常会听到并发和并行,同步和异步那么就简单梳理下这几个到底应该怎样理解。
并发和并行
并发:是程序结构上的概念,指你实现的程序是否支持多个动作。所以并发是指:你实现的程序是并发的,或者说你实现的系统是并发的,实质就是你实现的系统支持多个动作。例如你这个人既支持画图,也支持写文章这个两个动作,说明你“人”这个系统是并发的。
并行:指在同一时刻,同时执行多个操作。这个从直观感觉上说,就是并行指程序运行过程中,否同时执行多个事件。直观感受,单核操作系统是不能达到并行目的,因为一个cpu一个时间只能执行一个东西,多核才是执行并行的基础。既有两个人,同时执行画图,写文章这两件事。同一时间点,这两件事都在执行。
同步和异步
同步:发起一个调用,没得到调用结果,就不返回。
异步:发起一个调用结果,没等调用结束,就已经返回。
阻塞和非阻塞
阻塞:线程和进程在访问数据时遇到需要等待返回时执行等待。
非阻塞:线程和进程访问数据时遇到等待返回,挂起当前线程或进程,转而执行其他线程或进程。
一个很好的示例说明同步阻塞,同步非阻塞,异步阻塞,异步费阻塞的示例:
同步阻塞:小明一直盯着下载进度条,到 100% 的时候就完成。
同步非阻塞:小明提交下载任务后就去干别的,每过一段时间就去瞄一眼进度条,看到 100% 就完成。
异步阻塞:小明换了个有下载完成通知功能的软件,下载完成就“叮”一声。不过小明仍然一直等待“叮”的声音(看起来很傻,不是吗)
异步非阻塞:仍然是那个会“叮”一声的下载软件,小明提交下载任务后就去干别的,听到“叮”的一声就知道完成了。
实际使用
结合我们之前描述的协程概念可以知道,我们使用协程实现的程序就是异步非阻塞。这一套实用性,可以说非常广泛。举个例子:
用过mongodb都知道,如果要是在海量数据中match一些复合条件的数据出来,一定会有一个等待的时间,且假定你的程序是单进程,单线程的。那么现在要求运行5个match数据的操作,每个操作都是一秒。通常阻塞的就会按部就班一个一个运行,最终至少5秒得到结果。可是如果你运用异步机制,每个match操作在读取停顿,立马返回主调函数,继续执行下一个match,一次类推,这样相当于5个match在同时等待,最终耗时1秒多。
如果换多线程使用:看似并行,别忘了python中GIL限制,实际上也是单线程执行的,只是系统会自动切换。那么增加了操作系统线程间切换的开销,一定不会快于上面的协程实现。因为这个程序主要耗时是等待从mongodb中读取数据。
如果换做多进程:这个是真实并行,但是效率同协程比起来,基本相同,可是这个会增加系统额外的内存开销,因为每个进程都要占据自己的独立运行空间。
所以对于IO(数据库读写,网络访问,文件读写等)密集型的,协程能够极大提高效率。因为这是我们人为知道在等待耗时的地方调出继续执行。
Gevent
概述
Gevent是一个python第三方库来支持协程,并不是简单的让编者自己用yield实现。其以greenlet为核心,pip在安装gevent时会自动安装greenlet。Gevent框架实现异,也是利用了linux epoll事件监听机制。
用法
具体用法我们通过一个示例了解:
import geventdef foo(): print('Running in foo') gevent.sleep(0) #不同于time.sleep(n) print('Explicit context switch to foo again')def bar(): print('Explicit context to bar') gevent.sleep(0) print('Implicit context switch back to bar')gevent.joinall([ gevent.Greenlet(foo).start() gevent.spawn(bar),])
执行结果:
这里的gevent.sleep(n)和我们通常理解的time.sleep(n)不同源码注释中解释说:让当前greenlet休眠至少n秒,但是当n<=0时,立马将执行权交给其他的能运行的greenlet。说白了n置0,立马调出当前函数,下次轮到他执行的时候继续从gevent.sleep(n)后执行。可以去看一下gevent.sleep(seconds=0, ref=True)源码,很简单。
怎么样,foo和bar两个函数并没有yield,但是实现了协程。这个有点僵硬,通常写东西经常要访问别人写好的一些基础服务的API,示例如下:
import geventimport timeimport requeststic = lambda start : 'at %1.1f seconds' % (time.time() - start)urls = [ ('google', 'https://www.google.com.hk/'), ('github', 'https://github.com/'), ('baidu', 'https://www.baidu.com/'),]def fetch(key, url): start = time.time() response = requests.get(url) print('Process {0}: {1} -- consuming: {2}'.format( key, response.status_code, tic(start)))def synchronous(): start = time.time() for obj in urls: fetch(obj[0], obj[1]) print('End synchronous: consuming: {}'.format(tic(start)))def asynchronous(): start = time.time() coroutine = [] for obj in urls: coroutine.append(gevent.spawn(fetch, obj[0], obj[1])) gevent.joinall(coroutine) print('End synchronous: consuming: {}'.format(tic(start)))print('Synchronous:')synchronous()print('Asynchronous:')asynchronous()
该段程序运行结果:
仔细观察上图运行结果,思考几个问题:
1, 重复运行,synchronous返回结果的顺序是不是一定是google, github, baidu? 相对应Asynchronous呢?
2,synchronous总用时?Asynchronous总共用时?
不妨自己尝试运行一下。
在学习Gevent过程中,http://xlambda.com/gevent-tutorial/#_4
让我收获颇丰,其中示例第一个源于此链接。
除此之外,异步在python中真正一个大的框架是Tornado,是在牛的一个框架,很轻,但是却能够解决c10k,后续有机会再行分享。
- python之yield(二)
- Python yield 详解(二)
- python之yield(一)
- python yield 进阶(二)
- python 之 yield
- python 之 yield
- python之yield理解
- python之yield篇
- Python之yield
- Python 之 yield
- python之生成器yield
- python之yield
- python关键字之 yield
- python学习笔记之yield
- python 关键字之yield、next
- Python 学习笔记之 -- yield
- python 之 看yield的返回值
- python 2.5版yield之学习心得
- 第二十一篇玩转【斗鱼直播APP】系列之加载数据动画
- rails 练习5--将Topic与Votes做关联
- Python: 图像处理的基本运算
- 安卓RecyclerView与DrawerLayout的简单应用
- Android MVC模式与MVP模式
- python之yield(二)
- 让form只提交不跳转的两种方法总结
- java中怎么折叠代码
- Araxis Merge基本配置及操作
- 什么时候使用Controller、Service、Directive
- 一个完整的json返回
- SGU101 Domino 留坑
- C++ Primer(第五版)练习6.26
- 详细的JQ冲突解决办法,导航所用jq与图片所用jq冲突解决方法