【C++ STL应用与实现】22: 函数组合之1：如何使用std::bind (since C++11)

来源：互联网发布：淘宝联盟创建网站推广编辑：程序博客网时间：2024/05/17 07:07

本系列文章的目录在这里：目录. 通过目录里可以对STL总体有个大概了解

前言

std::bind是STL实现函数组合概念的重要手段，本文总结了std::bind这个模板函数的用法，给出了std::bind绑定普通函数(函数指针)、lambda表达式、成员函数、成员变量、模板函数、嵌套std::bind等的语法细节及注意的问题。

文中涉及到的术语：

std::placeholders : 占位符，被占位符绑定的参数，在实际调用中被实际参数代替。
std::decay : 退化类型
std::forward : 转发
Callable : 可调用对象
lambda : functors的语法糖，定义一个函数(对象), 当做函数来使用
trailing return types : 用于在声明（定义）函数时，函数返回值依赖于其参数的类型；或者是函数返回类型描述比较复杂时，用来简化类型书写
reference_wrapper : 引用包装类模板，用于把一个应用封装成一个对象，以便于在容器里，或者传递引用。

std::bind 是什么

看命名空间前缀std就知道，bind是标准库的亲儿子，包含在<functional>中.

std::bind 是一个函数模板, 它就像一个函数适配器，可以把一个原本接收N个参数的函数fn，通过绑定一些参数，返回一个接收M个参数的函数ret，同时还可以实现参数顺序调整等操作。

它的原型有两种形式，如下：

原型

// simple(1)    template <class Fn, class... Args>  /* unspecified */ bind (Fn&& fn, Args&&... args); // with return type (2)    template <class Ret, class Fn, class... Args>  /* unspecified */ bind (Fn&& fn, Args&&... args);

bind返回一个基于fn的函数对象(function object), 其参数被绑定到args上.

fn的参数要么是绑定到值，要么是绑定到placeholders(占位符，如_1, _2, …, _N)

参数:

fn：一个Callable对象(可以是function objects，函数指针或引用，成员函数指针或成员变量指针), 它的参数将被args绑定
args: 可变长参数，或者是具体的值，或者是占位符(placeholder). 注意：其长度必须与fn接收的参数个数一致

返回值

令bind的返回值为ret:

auto ret = std::bind(fn, args&&...)// orauto ret = std::bind<Ret>(fn, args&&...)

其返回值ret是一个未指定类型T的function object，T满足如下条件：std::is_bind_expression<T>::value == true.

ret这个类型，包含如下的成员：

1.成员变量:

1: decay<Fn>::type类型的对象(暂且叫_Myfun), 由std::forward<Fn>(fn)构造得来。简单来说，就是保存了bind时候传过来的fn对象.
2: tuple<typename decay<Types>::type> 类型的对象(暂且叫它_Mybargs), 这个tuple的每个元素的类型是decay<Args_i>::type, 是由调用bind时，第二个参数args…转发而来, 即forward<Args_i>(arg_i), Args_i 表示args中的第i个. 通俗来说，这个对象保存了bind时传过来的所有的参数args…。

ret的这个两个成员对象分别保存了bind传来的函数和参数以实现将来的调用任务。

2. 构造函数:

如果ret的所有成员对象都是可以拷贝构造的，那么它自身也是可拷贝构造的
同理，如果所有成员都是可移动构造的，那么它自身也是可移动构造的

3. 成员类型：result_type

如果Fn是一个函数指针或者成员函数指针，那么ret的result_type就是Fn的返回值类型.
如果Fn是一个类，并且它内部定义了一个result_type, 那么result_type就等于Fn::result_type.
如果ret是使用第二种形式调用bind得到的，即auto ret = bind<Ret>(fn , args), 那么result_type就是Ret.

4. 成员函数 operator() （此为重点，毕竟bind的返回值ret，就是用来当做函数调用的）

ret作为bind的返回值，假设我们这样调用ret: ret(a1, a2, a3, … ai); 此时ret内部保存的那个decay<Fn>::type类型的对象：_MyFun, 将被调用, 它将会按照如下的方式来为a1, a2, …, ai 来绑定值：

如果调用bind时指定的是reference_wrapper<T>类型的，比如在调用bind时使用了std::ref 或者 std::cref来包装args，那么调用ret内部的_MyFun时，对应参数会以T&类型传入_MyFun.
如果在创建ret时候，使用了嵌套的bind，即ret = bind(fn, args…)的参数列表args中，存在某个arg：使得std::is_bind_expression<decltype(arg)>::value == true, 那么这个嵌套的bind表达式会被立即调用，其返回值会被传给ret里的_MyFun作为参数(也就是说嵌套的bind返回值会被当做ret调用时的参数)，如果嵌套的bind里用到了占位符placeholder, 这些placeholder将会从ret的调用参数ret(a1, a2, … ai)中对应位置选择.
如果在创建ret时候，使用了占位符placeholders, 即 ret = bind(fn, arg1, arg2, …, _1, _2, …), (对于_1, _2…, 有std::is_placeholder<T>::value != 0). 那么a1, a2, …, ai会以转发的形式forward<ai>(ai)传递给_MyFun, a1对应_1, a2对应_2, 以此类推.
否则，ret内部保存的args，即上文提到的_Mybargs(bind调用时绑定的参数们)将被以左值的形式传给_MyFun以完成调用，这些参数和g有相同cv限定属性.

如果g(a1, a2, …, ai)中，有哪些ai没有匹配任何的placeholders，比如在调用bind时，placeholder只有_1, 而g(a1, a2, a3), 那么a2, a3就是没有匹配的，没有被匹配的参数将被求值，但是会被丢弃。

如果g被指定为volatile(volatile or const volatile)，结果是未定义的.

“说了那么多，你就是想装b”，还是看看bind在实际代码中的应用吧

从两个极端情况出发，正确理解bind过程和std::placeholders的使用

为了更容易理解并使用bind，再强调一下这句话：fn的参数要么是绑定到值，要么是绑定到placeholders

极端1：完全绑定到值

void f(int n1, int n2, int n3){    cout << n1 << " " << n2 << " " << n3 << endl;}// f的三个参数，全部绑定到值，对empty_args的调用将不需要提供参数auto empty_args = bind(f, 1, 2, 3);     empty_args();               // 1 2 3

极端2：完全绑定到std::placeholders

void f(int n1, int n2, int n3){    cout << n1 << " " << n2 << " " << n3 << endl;}int ret4() {     cout << "ret4() called" << endl;    return 4; }// f参数都使用占位符绑定, 需要提供至少三个参数auto need_3args = bind(f, _1, _2, _3);need_3args(1, 2, 3);            // 1 2 3need_3args(1, 2, 3, 4, 5);      // 1 2 3; 4和5被丢弃need_3args(1, 2, 3, ret4());    // ret4() called<cr> 1 2 3; 会调用ret4(), 但是返回的4被丢弃

除了这两种极端的情况，大部分情形下，bind是混合着值和占位符来进行绑定的。

bind过程分析及调用传参控制

在分析bind的绑定过程时，如何确定bind调用有没有错误，以及调用bind返回值ret的时候如何正确传参？比如，对下面的bind调用：

void f(int n1, int n2, int n3, int n4, int n5){    cout << n1 << " " << n2 << " " << n3 << " " << n4 << " " << n5 << endl;}// 如何分析bind的调用是否正确auto mix1 = bind(f, 1, 2, 3, _1, _2);auto mix2 = bind(f, 1, 2, 3, 4, _1, _2);auto mix3 = bind(f, 1, 2, 3, _2, _1);auto mix4 = bind(f, _3, 2, 3, 4, _1);auto mix5 = bind(f, _1, _1, _1, _1, _1);auto mix6 = bind(f, _100, _50, _10, _5, _1);// 如何填写mix的调用参数，他需要几个参数？// mix1(...); // mix3(...); // mix4(...); // mix5(...);

分析过程：

1. bind(f, args…)的合法性分析

设f需要的参数个数为N， bind(f…)中，提供的值的个数为V，提供的占位符个数为S.

对于合法的bind调用，必有 N == V + S. 如果V + S 超出N或者小于N, 编译都会报错。

所以上面的mix定义中，只有mix1, mix3, mix4, mix5是合法的。mix2中参数个数已经有6个，而f只需要5个。mix6的参数个数对，但是占位符太大了, 在VC++(2013)编译器实现中最大为20。

2. bind返回值ret的调用传参写法

设bind(f, args…)中最大的占位符为_M. ( 如mix1, mix2, mix3中 M=2； mix4中 M=3; mix5中 M=1; mix6中M=100; )

则：

参数个数
ret的调用中至少要提供 M 个参数，因为_1~_M正是从ret(args…)参数列表中从左到右来按下标顺序绑定参数的，少于M个会报错，多于M个则被丢弃.
参数顺序
ret(args…)中参数与placeholders: _1~_M的对应是很简单的，下标从1开始，依次对应。但是绑定到f的顺序是由bind(fn, args…)中placeholders的顺序决定的.如bind(f, _1, _2, _3, _4, _5)就是从左到右的顺序把ret(args…)里的参数绑定到f；而bind(f, _5, _4, _3, _2, _1)则是按相反的顺序绑定。

于是，对于上文中定义的合法mix的调用示例及输出可以是：

auto mix1 = bind(f, 1, 2, 3, _1, _2);auto mix3 = bind(f, 1, 2, 3, _2, _1);auto mix4 = bind(f, _3, 2, 3, 4, _1);auto mix5 = bind(f, _1, _1, _1, _1, _1);mix1(4, 5);                 // 1 2 3 4 5; M = 2;//mix1(4);                  // no, 参数太少了mix3(5, 4);                 // 1 2 3 4 5; M = 2; mix4(5, 0, 1);              // 1 2 3 4 5; M = 3; 第一个参数5给_1, 第三个参数1给_3, 第二个参数0被丢弃，因为bind中没用到_2.mix5(5);                    // 5 5 5 5 5; M = 1;

你可能注意到mix6中的_100, _50, 这样大的占位符是编译不过的。

placeholders的最大值，在VC++上是20，它的最大值依赖于具体的编译器实现，不需要纠结这个最大值. 一般不会使用很大的占位符，因为一旦你使用了一个占位符_100，虽然只用了一个，但是这就意味着调用者需要提供至少100个参数，你是想弄死谁？

下面就按照fn的分类给出bind的调用示例：

std::bind 绑定普通函数、lambda表达式

#include <functional>// 定义两个函数，乘、除法double multiply(double d1, double d2){    return d1 * d2;}double divide(double d1, int n){    assert(n != 0);    return d1 / n;}//----------------------------- begin of new test -----------------------------RUN_GTEST(FunctorTest, Bind, @);        // google gtest 的简单封装，可以当做一个普通函数的开始！using std::bind;                        // for std::bindusing namespace std::placeholders;      // for _1, _2, _3 ...// 做“无用功”， same函数跟multiply一样，接收两个参数，并且顺序也是一致auto same = bind(multiply, _1, _2);EXPECT_EQ(200.0, same(2, 100));         // 第一个参数使用占位符，第二个单数绑定为2.0, 从而返回一个函数仅需要传入一个参数，// 返回其2倍。auto doublize = bind(multiply, _1, 2.0);EXPECT_EQ(200.0, doublize(100));// 全部使用参数绑定，ret_20不需要参数即可调用，返回20auto ret_20 = bind(multiply, 2, 10);EXPECT_EQ(20.0, ret_20());// 正常的相除函数, arg1/arg2double d1 = divide(10, 2);EXPECT_EQ(5, d1);// 通过bind，交换两个参数的顺序，revertDivide(arg1, arg2)将返回arg2/arg1auto revertDivide = bind(divide, _2, _1);double d2 = revertDivide(10, 2);EXPECT_EQ(1 / 5.0, d2);// bind的第二种形式，显式指定返回值类型为intauto rounding = bind<int>(divide, _1, _2);auto i1 = rounding(10, 3);bool isSameType = is_same<int, decltype(i1)>::value;    // i1 是intEXPECT_TRUE(isSameType);EXPECT_EQ(3, i1);// bind lambda函数auto lambda_func = [](int x) -> int { return x; };auto ret_100 = bind(lambda_func, 100);EXPECT_EQ(100, ret_100);// 使用bind适配一个函数 std::function<void(int)> func_with_1args;func_with_1args = bind(multiply, 10, _1);END_TEST;

std::bind 绑定类成员函数、成员变量

成员函数区别于普通函数的一个特殊之处在于，其第一个参数必须是该类型的一个对象(或对象的指针或引用)

class Foo{public:    void f(int n1, int n2, int n3)    {        cout << n1 << " " << n2 << " " << n3 << endl;    }    int a_ { 100 };};//----------------------------- begin of new test -----------------------------RUN_GTEST(FunctorTest, Bind, @);Foo foo;Foo& foo_ref= foo;// 成员函数原型：Foo::f(int n1, int n2, int n3);// 使用Foo::f, 需要四个参数，1.Foo类型的对象(或其指针或引用); 2~4个参数则赋值给n1, n2, n3// 对返回值mfarg4的调用将需要4个参数: 按顺序绑定到占位符_1, _2, _3, _4.auto mfarg4 = bind(&Foo::f, _1, _2, _3, _4);// 使用对象本身调用mfarg4(foo, 10, 20, 30);        // 10 20 30; // 使用对象指针调用mfarg4(&foo, 10, 20, 30);       // 10 20 30; // 使用对象引用mfarg4(foo_ref, 10, 20, 30);    // 10 20 30; // 对返回值mfarg3的调用将需要三个参数：分别绑定到三个占位符，f的第四个参数将使用固定左值30.auto mfarg3 = bind(&Foo::f, _1, _2, _3, 30);mfarg3(foo, 10, 20);            // 10 20 30; // 对返回值mfarg2的调用将需要两个参数：分别绑定到两个占位符，f的后两个参数将使用固定左值20, 30.auto mfarg2 = bind(&Foo::f, _1, _2, 20, 30);mfarg2(foo, 10);                // 10 20 30; // 对返回值mfarg1的调用将仅需要一个参数foo对象，绑定到唯一的占位符，后单个参数将使用bind中的固定左值10,20,30.auto mfarg1 = bind(&Foo::f, _1, 10, 20, 30);mfarg1(foo);                    // 10 20 30;// 完全使用左值绑定，返回值mfarg0将不需要使用参数进行调用.auto mfarg0 = bind(&Foo::f, foo, 10, 20, 30);mfarg0();                       // 10 20 30// 使用对象指针或引用也可以auto mfarg01 = bind(&Foo::f, &foo, 10, 20, 30);mfarg01();                      // 10 20 30auto mfarg02 = bind(&Foo::f, foo_ref, 10, 20, 30);mfarg02();                      // 10 20 30// 把一个成员函数赋值给一个std::functionstd::function<void(int, int, int)> normal_func;normal_func = bind(&Foo::f, foo, _1, _2, _3);normal_func(10, 20, 30);        // 10 20 30//------------------------------ 绑定成员变量a_ ---------------------------// bind成员变量，其第一个参数必须是该类型的一个对象(或对象或引用), 指针不行！！auto bind_mv = bind(&Foo::a_, _1);cout << bind_mv(foo);           // 100cout << bind_mv(foo_ref);       // 100//cout << bind_mv(&foo);        // error, 成员变量不能用对象指针来绑定END_TEST;

std::bind 绑定模板函数

// 定义一个函数模板，返回两数之和，返回值是两数之和的类型。使用了c++11中的trailing return types特性.template <typename T1, typename T2>auto add(const T1 & t1, const T2& t2) -> decltype(t1 + t2){    return t1 + t2;}// work with template function.auto addby2 = bind(add<double, double>, _1, 2.0);cout << addby2(10.2);                             // 12.2

嵌套std::bind共享std::placeholder.

void print(int n1, int n2, int n3){    cout << n1 << " " << n2 << " " << n3 << endl;}// 定义一个辅助函数auto addby1 = [] (int x) -> int {     cout << "addby1() called" << endl;    return (x+1); };// 嵌套的bind在使用外层bind()中的placeholdersauto nested_f = bind(print, _1, bind(addby1, _1), _2); nested_f(1, 3);                 // addby1() called<cr> 1 2 3

`reference_wrapper<T>`类型, 实现绑定引用

int x(10);// 第二个参数使用引用x，第三个参数使用值xauto bind_ref = bind(print, 1, std::cref(x), x);  bind_ref();                // 1 10 10; x = 100;bind_ref();                // 1 100 10; 第二个参数跟着x变化了，第三个则没变

bind与标准库协同工作

RUN_GTEST(FunctorTest, BindPredefinedFunctors, @);// all predefined functors:// negate, plus, minus, multiplies, divides, modulus, equal_to, // not_equal_to, less, greater, less_equal, greater_equal,// logical_not, logical_and, logical_or, bit_and, bit_or, bit_xorauto tenTimes = bind(multiplies<int>(), _1, 10);EXPECT_EQ(100, tenTimes(10));EXPECT_EQ(200, tenTimes(20));EXPECT_EQ(300, tenTimes(30));vector<int> v{ 1, 2, 3, 4, 5, 6, 7, 8 };// nested bind. output v[i] if 10*v[i] > 50.copy_if(v.begin(), v.end(),    ostream_iterator<int>(cout, ", "),    bind(greater<int>(),        bind(multiplies<int>(), _1, 10),        50));                               // 6,7,8,cr;END_TEST;

bind与智能指针

RUN_GTEST(FunctorTest, BindSmartPointer, @);struct Temp {    Temp(int i=0) : i_(i) {}    void print() { pln(i_); }    int i_;};vector<shared_ptr<Temp>> vs ={    shared_ptr<Temp>(new Temp(1)),    shared_ptr<Temp>(new Temp(2)),    shared_ptr<Temp>(new Temp(3)),};for_each(vs.begin(), vs.end(), bind(&Temp::print, _1));  // 1<cr>2<cr>3<cr>bind(&Temp::print, vs[0])();        // 1bind(&Temp::print, vs[1])();        // 2bind(&Temp::print, vs[2])();        // 3END_TEST;

last but not least

bind中的参数是被copy或者是被move到目标函数的，除非显示指定按引用传递, 用std::ref 或者std::cref来包裹参数，否则是不会按引用来传递的。这意味着你要意识到, 在bind一个大的对象作为参数的时候可能存在的拷贝开销, 应该尽量用引用**

同时，因为move会改变对象的状态，因此，所以当你在bind参数列表里重用placeholders的时候，要考虑到参数已经被moved掉的情况, 标准建议：只有在参数是左值或者不可移动的右值的时候，重用placeholders才有意义。

源码

标准c++参考的测试代码1
标准c++参考的测试代码2
本文的测试代码

作者水平有限，对相关知识的理解和总结难免有错误，还望给予指正，非常感谢！

欢迎访问github博客，与本站同步更新

1 0