关于Python的进程线程协程之大话多进程多线程

来源：互联网发布：淘宝关键词挖掘编辑：程序博客网时间：2024/06/05 16:52

大话多进程多线程

“进程——资源分配的最小单位，线程——程序执行的最小单位”

进程：

是程序执行时的一个实例，即它是程序已经执行到课中程度的数据结构的汇集。从内核的观点看，进程的目的就是担当分配系统资源（CPU时间、内存等）的基本单位。在Linux系统下，启动一个新的进程必须分配给它独立的地址空间，建立众多的数据表来维护它的代码段、堆栈段和数据段，多进程是一种”昂贵”的多任务工作方式。

线程：

是进程的一个执行流，是CPU调度和分派的基本单位，它是比进程更小的能独立运行的基本单位。一个进程由几个线程组成（拥有很多相对独立的执行流的用户程序共享应用程序的大部分数据结构），线程与同属一个进程的其他的线程共享进程所拥有的全部资源。运行于一个进程中的多个线程，它们彼此之间使用相同的地址空间，共享大部分数据

漫谈进程与线程区别：

进程有独立的地址空间，一个进程崩溃后，在保护模式下不会对其它进程产生影响，而线程只是一个进程中的不同执行路径。

线程有自己的堆栈和局部变量，但线程没有单独的地址空间，（同一进程内的线程共享进程的地址空间），一个线程死掉就等于整个进程死掉，所以多进程的程序要比多线程的程序健壮。但在但对于一些要求并发处理并且又要共享某些变量的并发操作，只能用线程，不能用进程。

开销上各有千秋。启动一个线程所花费的空间远远小于启动一个进程所花费的空间，而且，线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。据统计，总的说来，一个进程的开销大约是一个线程开销的30倍左右，当然，在具体的系统上，这个数据可能会有较大的区别。进程切换时，耗费资源较大，效率要差一些。

通信机制不同。对不同进程来说，它们具有独立的数据空间，要进行数据的传递只能通过通信的方式进行，这种方式不仅费时，而且很不方便。线程则不然，由于同一进程下的线程之间共享数据空间，所以一个线程的数据可以直接为其它线程所用，这不仅快捷，而且方便。当然，数据的共享也带来其他一些问题，有的变量不能同时被一个以上的线程所修改，有的子程序中声明为static的数据有可能出现更多问题，比如修改后的数据结果不一致（竞态条件）。

优缺点总结：进程优点：编程、调试简单，可靠性较高。进程缺点：创建、销毁、切换速度慢，内存、资源占用大。
线程优点：创建、销毁、切换速度快，内存、资源占用小。线程缺点：编程、调试复杂，可靠性较差。

多线程处理，有以下应用优点：

提高应用IO响应。这对图形界面的程序尤其有意义，当一个操作耗时很长时，整个系统都会等待这个操作，此时程序不会响应键盘、鼠标、菜单的操作，而使用多线程技术，将耗时长的IO操作（time
consuming）置于一个新的线程，可以避免这种尴尬的情况。

使多CPU系统更加高效。一般说来，操作系统会保证当线程数不大于CPU数目时，不同的线程运行于不同的CPU上。

模块化程序结构。一个既长又复杂的进程可以考虑分为多个线程，成为几个独立或半独立的模块化运行，这样利于程序的迭代。

多进程处理，有以下应用优点：

每个进程互相独立，不影响主程序的稳定性，子进程崩溃没关系；通过增加CPU，就可以容易扩充性能；

可以尽量减少线程加锁/解锁的影响，极大提高性能，就算是线程运行的模块算法效率低也没关系；

每个子进程都有2GB地址空间和相关资源，总体能够达到的性能上限非常大

ps：在Unix上编程采用多线程还是多进程的争执由来已久，WEB服务器技术中，Apache是采用多进程的（perfork模式，每客户连接对应一个进程，每进程中只存在唯一一个执行线
程），Java的Web容器Tomcat、Websphere等都是多线程的（每客户连接对应一个线程，所有线程都在一个进程中）。

0 0