Python 学习入门(24)—— 进程高级
来源:互联网 发布:炫舞房间源码 编辑:程序博客网 时间:2024/06/05 04:45
初步了解Python多进程之后,我们可以继续探索multiprocessing包中更加高级的工具。这些工具可以让我们更加便利地实现多进程。
1. 进程池
之前我们使用Process创建进程的时候,每次创建一个进程。进程池 (Process Pool) 创建多个进程。这些进程就像是随时待命的士兵,准备执行任务(程序)。一个进程池中可以容纳多个待命的士兵。
比如下面的程序:
def f(x): return x**2pool = mul.Pool(5)rel = pool.map(f,[1,2,3,4,5,6,7,8,9,10])
print(rel)
我们创建了一个容许5个进程的进程池 (Process Pool) 。Pool运行的每个进程都执行f()函数。我们利用map()方法,将f()函数作用到表的每个元素上。这与built-in的map()函数类似,只是这里用5个进程并行处理。如果进程运行结束后,还有需要处理的元素,那么的进程会被用于重新运行f()函数。除了map()方法外,Pool还有下面的常用方法。
apply_async(func,args) 从进程池中取出一个进程执行func,args为func的参数。它将返回一个AsyncResult的对象,你可以对该对象调用get()方法以获得结果。
close() 进程池不再创建新的进程
join() wait进程池中的全部进程。必须对Pool先调用close()方法才能join。
练习:
有下面一个文件download.txt。
www.sina.com.cnwww.163.comwww.iciba.comwww.cnblogs.comwww.qq.comwww.douban.com
使用包含3个进程的进程池下载文件中网站的首页。(你可以使用subprocess调用wget或者curl等下载工具执行具体的下载任务)
2. 共享资源
我们在Python多进程初步已经提到,我们应该尽量避免多进程共享资源。多进程共享资源必然会带来进程间相互竞争。而这种竞争又会造成race condition,我们的结果有可能被竞争的不确定性所影响。但如果需要,我们依然可以通过共享内存和Manager对象这么做。
1) 共享内存
在Linux进程间通信中,我们已经讲述了共享内存(shared memory)的原理,这里给出用Python实现的例子:
import multiprocessingdef f(n, a): n.value = 3.14 a[0] = 5num = multiprocessing.Value('d', 0.0)arr = multiprocessing.Array('i', range(10))p = multiprocessing.Process(target=f, args=(num, arr))p.start()p.join()print num.valueprint arr[:]
这里我们实际上只有主进程和Process对象代表的进程。我们在主进程的内存空间中创建共享的内存,也就是Value和Array两个对象。对象Value被设置成为双精度数(d), 并初始化为0.0。而Array则类似于C中的数组,有固定的类型(i, 也就是整数)。在Process进程中,我们修改了Value和Array对象。回到主程序,打印出结果,主程序也看到了两个对象的改变,说明资源确实在两个进程之间共享。
2)Manager
Manager对象类似于服务器与客户之间的通信 (server-client),与我们在Internet上的活动很类似。我们用一个进程作为服务器,建立Manager来真正存放资源。其它的进程可以通过参数传递或者根据地址来访问Manager,建立连接后,操作服务器上的资源。在防火墙允许的情况下,我们完全可以将Manager运用于多计算机,从而模仿了一个真实的网络情境。下面的例子中,我们对Manager的使用类似于shared memory,但可以共享更丰富的对象类型。
def f(x, arr, l): x.value = 3.14 arr[0] = 5 l.append('Hello')server = multiprocessing.Manager()x = server.Value('d', 0.0)arr = server.Array('i', range(10))l = server.list()proc = multiprocessing.Process(target=f, args=(x, arr, l))proc.start()proc.join()print(x.value)print(arr)print(l)
Manager利用list()方法提供了表的共享方式。实际上你可以利用dict()来共享词典,Lock()来共享threading.Lock(注意,我们共享的是threading.Lock,而不是进程的mutiprocessing.Lock。后者本身已经实现了进程共享)等。 这样Manager就允许我们共享更多样的对象。
我们在这里不深入讲解Manager在远程情况下的应用。有机会的话,会在网络应用中进一步探索。
总结
Pool
Shared memory, Manager
博客之星评选,请投我一票:
http://vote.blog.csdn.net/blogstaritem/blogstar2013/sunboy_2050
- Python 学习入门(24)—— 进程高级
- Python 学习入门(23)—— 进程
- Python入门(四,高级)
- python核心高级学习总结4-------python实现进程通信
- Python学习笔记(四)——高级特性
- python学习(8)——高级特性
- python学习(13)——面向对象高级编程
- Python高级特性——学习笔记
- Python学习笔记——高级特性
- python学习——高级特性
- Python学习笔记——高级特性
- Python高级编程——12.系统编程(多进程和多线程)总述
- Python高级编程——12. (1)系统编程之多进程
- 《UNIX环境高级编程》学习笔记——进程环境
- Linux入门学习——进程
- 《UNIX环境高级编程》学习笔记——进程控制(一)
- 《UNIX环境高级编程》学习笔记——进程控制(二)
- Python学习笔记(七):高级特性、函数式编程、模板(快速入门篇)
- 表达式求值 一位数字
- 跳出循环的几种方式比较
- PCM data flow - 2 - ASoC data structure
- CAN总线的抗干扰能力
- Palindromes
- Python 学习入门(24)—— 进程高级
- 批改Android镜像文件 ramdisk.img、system.img、userdata.img获取root权限
- ubuntu下安装gcc
- C++读取文件中有逗号的数据
- 为方便ATS管理建立的一些命令别名
- 大数的加法
- 反转数字
- 最大乘积
- poj 3384 Feng Shui(内推进半平面交+最远点对)