学习python多线程和多进程的一点感想

来源：互联网发布：淘宝新客户关系营销编辑：程序博客网时间：2024/05/17 04:46

转自：http://my.oschina.net/u/593413/blog/88573

今天学了一下python的多进程和多线程技巧。

多线程方面倒没啥可说的，很简单。值得注意的是，多线程并不限制你一次只执行一个，如果你的线程之间不共享变量的话，是用不到线程锁的，虽然这么说，但是其实即使不用lock程序还是一次只执行一个线程。如果程序内部有阻塞现象（比如下载之类），使用线程很不错，但是如果没有的话，用不用线程的消耗差别不大（甚至因为要支持线程而减慢）。不使用lock其实是将lock交给了python负责，它会根据阻塞与否协调线程的执行。

说回重点，多进程吧。

下面是我从其他人的帖子里抄来的一个多进程示范脚本（当然修改了一些）：

01import multiprocessing
02import os
03 
04def get(url,lock):
05    lock.acquire()
06    print os.getpid(),url
07    lock.release()
08 
09plist=[]
10lock=multiprocessing.Lock()
11for i in ['www.sina.com.cn','www.163.com','www.baidu.com','www.cnblogs.com','www.qq.com','www.douban.com']:
12    proc=multiprocessing.Process(target=get,args=(i,lock))
13    plist.append(proc)
14 
15for proc in plist: proc.start()
16for proc in plist: proc.join()

但是呢，我执行起来，却会死机，会不停的打开python解释程序。

这样当然是让我很纳闷的，因为这个程序在ideone（一个在线代码编译器）上运行正常，问别人也说可以正常执行，怎么到我这里就不行了呢？

起初我以为是安装非标准模块的副作用，于是重装了一次python2.7.3，然后从网上找了另一个范例试了一下，ok。

我很高兴，以为解决问题了，不过为了保险，还是再实验了一下上面的代码，又挂了……

这就让我很郁闷了，看来原因不是python，还是代码的问题。

可是代码成功执行了啊……

这个时候，我注意到一个细节，那就是在代码存放的目录里，多出来一个字节码的pyc文件。

看来这个pyc文件应该和这一问题有关……原来如此！

我安装python的时候，是选择了预编译库文件选项的，这样可以加快代码的执行速度。不过这样就导致了一个问题：预编译后的字节码文件的代码顺序和源代码文件是不太一样的。装入字节码文件时，会自动执行pyc文件里的部分代码（就是那些贴左面放的部分），而这一执行，就会导致程序发生递归，结果就是不断启用python解释执行pyc文件……

然后，然后俺就死机了……

ok，那么我就按我的判断来修改一下吧，代码如下：

01from multiprocessing import Process
02import os
03 
04def myget(url):
05    print os.getpid(),url
06 
07if __name__ == '__main__':
08    plist=[]
09    for i in ['www.sina.com.cn','www.163.com','www.baidu.com','www.cnblogs.com','www.qq.com','www.douban.com']:
10        proc=Process(target=myget,args=(i,))
11        plist.append(proc)
12    for proc in plist: proc.start()
13    for proc in plist: proc.join()

下面一句：

if __name__ == '__main__':

的作用是让后面的代码只有文件被作为程序执行时才有效，作为库加载时不执行。

结果很好，成功执行了代码。

这一事例告诉我们，python官方的代码格式并不是仅仅出于美观的，尽可能的按官方风格写，可以避免很多不可预料的错误。