协程（四）原理

来源：互联网发布：linux man 编辑：程序博客网时间：2024/05/02 04:50

出处：http://www.cnblogs.com/takeaction/archive/2015/03/25/4365422.html

协程，又称微线程和纤程等，据说源于 Simula 和 Modula-2 语言（我没有深究，有错请指正），现代编程语言基本上都有支持，比如 Lua、ruby 和最新的 Google Go，当然也还有最近很让我惊艳的 falcon。协程是用户空间线程，操作系统其存在一无所知，所以需要用户自己去做调度，用来执行协作式多任务非常合适。其实用协程来做的东西，用线程或进程通常也是一样可以做的，但往往多了许多加锁和通信的操作。

下面是生产者消费者模型的基于抢占式多线程编程实现（伪代码）：
// 队列容器
var q := new queue
// 消费者线程
loop
lock(q)
get item from q
unlock(q)
if item
use this item
else
sleep
// 生产者线程
loop
create some new items
lock(q)
add the items to q
unlock(q)

由以上代码可以看到线程实现至少有两点硬伤：

1、对队列的操作需要有显式/隐式（使用线程安全的队列）的加锁操作。

2、消费者线程还要通过 sleep 把 CPU 资源适时地“谦让”给生产者线程使用，其中的适时是多久，基本上只能静态地使用经验值，效果往往不由人意。

而使用协程可以比较好的解决这个问题，下面来看一下基于协程的生产者消费者模型实现（伪代码）：
// 队列容器
var q := new queue
// 生产者协程
loop
while q is not full
create some new items
add the items to q
yield to consume
// 消费者协程
loop
while q is not empty
remove some items from q
use the items
yield to produce

可以从以上代码看到之前的加锁和谦让 CPU 的硬伤不复存在，但也损失了利用多核 CPU 的能力。所以选择线程还是协程，就要看应用场合了。下面简单谈一下协程常见的用武之地，其中之一是状态机，能够产生更高可读性的代码；还有就是并行的角色模型，这在游戏开发中比较常见；以及产生器，有助于对输入/输出和数据结构的通用遍历。

协程虽然如此之好，看是很长时间以来，因为受到基于堆栈的子例程实现的限制，并没有多少语言在其实语言或库中支持协程，所以线程作为一个替代者（当然，线程也有其超越协程之处）被广泛接受了。但是在今天，很多语言都内建了协程的支持，甚至是 C/C++ 语言。MS Windows 2000 以后的版本，都支持所谓的 Fiber，即纤程，其实就是协程的别称；在开源平台，POSIX 标准也定义了协程相关的标准，GNU Portable Threads 实现了跨平台的用户空间线程，即协程的另一种别称。在这百花齐放的时节，正是我们好好学习和利用它的时机。

接下来我将在第二篇中谈谈游戏中试用协程的三个场合。

由以上代码可以看到线程实现至少有两点硬伤：

1、对队列的操作需要有显式/隐式（使用线程安全的队列）的加锁操作。

2、消费者线程还要通过 sleep 把 CPU 资源适时地“谦让”给生产者线程使用，其中的适时是多久，基本上只能静态地使用经验值，效果往往不由人意。

接下来我将在第二篇中谈谈游戏中试用协程的三个场合。

作者：阿猫
链接：http://www.zhihu.com/question/20511233/answer/24260355
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

没有啥复杂的东西，考虑清楚需求，就可以很自然的衍生出这些解决方案。

一开始大家想要同一时间执行那么三五个程序，大家能一块跑一跑。特别是UI什么的，别一上计算量比较大的玩意就跟死机一样。于是就有了并发，从程序员的角度可以看成是多个独立的逻辑流。内部可以是多cpu并行，也可以是单cpu时间分片，能快速的切换逻辑流，看起来像是大家一块跑的就行。
但是一块跑就有问题了。我计算到一半，刚把多次方程解到最后一步，你突然插进来，我的中间状态咋办，我用来储存的内存被你覆盖了咋办？所以跑在一个cpu里面的并发都需要处理上下文切换的问题。进程就是这样抽象出来个一个概念，搭配虚拟内存、进程表之类的东西，用来管理独立的程序运行、切换。
后来一电脑上有了好几个cpu，好咧，大家都别闲着，一人跑一进程。就是所谓的并行。
因为程序的使用涉及大量的计算机资源配置，把这活随意的交给用户程序，非常容易让整个系统分分钟被搞跪，资源分配也很难做到相对的公平。所以核心的操作需要陷入内核(kernel)，切换到操作系统，让老大帮你来做。
有的时候碰着I/O访问，阻塞了后面所有的计算。空着也是空着，老大就直接把CPU切换到其他进程，让人家先用着。当然除了I\O阻塞，还有时钟阻塞等等。一开始大家都这样弄，后来发现不成，太慢了。为啥呀，一切换进程得反复进入内核，置换掉一大堆状态。进程数一高，大部分系统资源就被进程切换给吃掉了。后来搞出线程的概念，大致意思就是，这个地方阻塞了，但我还有其他地方的逻辑流可以计算，这些逻辑流是共享一个地址空间的，不用特别麻烦的切换页表、刷新TLB，只要把寄存器刷新一遍就行，能比切换进程开销少点。
如果连时钟阻塞、线程切换这些功能我们都不需要了，自己在进程里面写一个逻辑流调度的东西。那么我们即可以利用到并发优势，又可以避免反复系统调用，还有进程切换造成的开销，分分钟给你上几千个逻辑流不费力。这就是用户态线程。
从上面可以看到，实现一个用户态线程有两个必须要处理的问题：一是碰着阻塞式I\O会导致整个进程被挂起；二是由于缺乏时钟阻塞，进程需要自己拥有调度线程的能力。如果一种实现使得每个线程需要自己通过调用某个方法，主动交出控制权。那么我们就称这种用户态线程是协作式的，即是协程。

本质上协程就是用户空间下的线程。

0 0