C++ 线程池实现原理

来源：互联网发布：c语言windows窗口程序编辑：程序博客网时间：2024/06/07 05:44

背景

多线程编程是C++开发者的一个基本功，但是很多开发者都是直接使用公司给包装好的线程池库，没有去了解具体实现，有些实现也都因为高度优化而写得讳莫如深，让初学者看得吃力。

所以写这篇文章主要是想以非常简单的方式讲讲实现原理，希望初学者看完之后不是觉得「不明觉厉」，而是觉得「原来如此」。

面朝代码

首先先来一段超级简单（注释丰富）的代码展示多线程编程的经典写法。

注: 该段代码和完整运行示例请见 limonp-thread-pool-programming-example ，可以通过以下命令跑通示例代码和输出结果，建议尝试以下。当然记得前提是该机器的网络可以访问 GitHub 的情况下。可能因为在中国访问 GitHub 并不是很稳定，不是每次都能成功，所以如果卡住的话就多make几次。

git clone https://github.com/yanyiwu/practicecd practice/cpp/limonp-v0.5.1-demomake

#include "limonp/ThreadPool.hpp"#include "limonp/StdExtension.hpp"using namespace std;const size_t THREAD_NUM = 4;// 这个类本身没什么实际含义，只是为了示例多线程编程而写出来的而已。class Foo { public:  // 这个类成员函数Append会在多个线程中被调用，多个线程同时对 chars 这个类成员变量进行写操作，所以需要加锁保证线程安全。  void Append(char c) {      limonp::MutexLockGuard lock(mutex_);      chars.push_back(c);   }  string chars; // 多线程共享的对象  limonp::MutexLock mutex_; // 线程锁};void DemoClassFunction() {  Foo foo;  cout << foo.chars << endl;  // 初始化一个线程池。  limonp::ThreadPool thread_pool(THREAD_NUM);  thread_pool.Start(); // 启动线程池  for (size_t i = 0; i < 20; i++) {      char c = i % 10 + '0';      // 使用 NewClosure 绑定 foo 对象和 Append 函数和对应参数，构造一个闭包扔进线程池中运行，关于这个 NewClosure 后面会讲。      thread_pool.Add(limonp::NewClosure(&foo, &Foo::Append, c));  }  thread_pool.Stop(); // 等待所有线程工作（工作是指NewClosure生成的闭包函数）都完成，然后停止所有线程。  cout << foo.chars << endl;}int main() {  DemoClassFunction();  return 0;}

上面代码注释已经非常详细，一路看下来可能最困惑的应该是 NewClosure 闭包创建函数。很多人谈到闭包就觉得是一个很高深或者是坑很深的问题，但是此闭包非JavaScript的闭包。是一个简单版本，只考虑值拷贝，不考虑引用类型的参数。

limonp::NewClosure(&foo, &Foo::Append, c)

所以在该代码中三个参数，第一个是类对象的指针，第二个是成员函数的指针，第三个是int，都是值传递。在此不支持引用传递的参数。

简单闭包实现

假设你现在已经运行了刚才的这三行命令。

git clone https://github.com/yanyiwu/practicecd practice/cpp/limonp-v0.5.1-demomake

一切运行正常的话，应该目前所在的目录里面有 limonp-0.5.1 这个目录。然后可以在

limonp-0.5.1/include/limonp/Closure.hpp

文件中看到 NewClosure 函数的定义，NewClosure 是一个模板函数，所以才能支持多种多样的类型。但是也让代码变得晦涩很多。

但是 NewClosure 的实现原理最主要的是生成一个满足 ClosureInterface 接口定义的对象而已。

同时这个 ClosureInterface 也异常的简单，如下：

class ClosureInterface { public:  virtual ~ClosureInterface() {    }  virtual void Run() = 0;};

因为当这个 Closure 对象被扔进线程池之后，其实是进入了一个队列中。然后线程池的多个线程去从队列中获取Closure指针，然后调用该 Run() 函数。

注意到，NewClosure 其实是生成一个对象指针，我们只是构造了这个对象，但是没有销毁它？是否会造成内存泄露？显然不会，原因是在线程池中，调用完 Closure 中的 Run() 函数之后，会 delete 该指针，所以不会造成内存泄露。

到这里只剩下一个最关键的困惑点就是 Run() 的具体实现。也就是如何通过如下代码将 Append 这个类成员函数变成一个实现了 Run() 函数的 Closure 对象？

limonp::NewClosure(&foo, &Foo::Append, c)

因为 NewClosure 是模板函数，支持各种参数类型，但是对于本文的例子，实际上调用的 NewClosure 函数实现如下：

template<class R, class Obj, class Arg1>ClosureInterface* NewClosure(Obj* obj, R (Obj::* fun)(Arg1), Arg1 arg1) {  return new ObjClosure1<Obj, R (Obj::* )(Arg1), Arg1>(obj, fun, arg1);}

所以实际上创建的对象是 ObjClosure1 , 依然是在源码

limonp-0.5.1/include/limonp/Closure.hpp

中可以找到 ObjClosure1 的实现，如下代码：

template <class Obj, class Funct, class Arg1>class ObjClosure1: public ClosureInterface { public:  ObjClosure1(Obj* p, Funct fun, Arg1 arg1) {     p_ = p;     fun_ = fun;     arg1_ = arg1;    }  virtual ~ObjClosure1() {    }  virtual void Run() {      (p_->*fun_)(arg1_);    } private:  Obj* p_;  Funct fun_;  Arg1 arg1_;};

真相大白

到这里真相基本上就浮出水面了。类的对象指针，成员函数指针，函数的参数，都作为 ObjClosure1 的类成员变量存储着。然后在函数 Run() 里面再用起来。

virtual void Run() {    (p_->*fun_)(arg1_);}

可能看到这里的时候有点不理解，这里就涉及到类成员函数指针的调用。显然因为类的成员函数是需要 this 指针的，这个写过 C++ 的应该都知道。所以直接像C语言那样调用函数（如下），显然是不可能的，没有传入 this 指针嘛。

(*fun)(arg1_);

所以在 C++ 中，调用类的成员函数指针，是如下这样：

(p_->*fun_)(arg1_);

这样才能把 p_ 当成 this 指针传进去。

这样就实现了之前的 NewClosure 将「类，类成员函数指针，函数参数」打包成一个闭包供线程池调用的意图。

所以就有了最开始示例代码那种写法。

最后

感觉自己写的还是很通俗易懂的，有具体代码，而且还是可一键下载运行的，然后最底层的代码实现也都解释了。应该算是很对得起本文题目了吧。

1 1