转：Boost中应用的泛型编程技术

来源：互联网发布：中国山脉和河流的数据编辑：程序博客网时间：2024/05/22 10:47

英文原文：http://www.boost.org/more/generic_programming.html
1、何谓泛型编程

泛型编程（Generic Programming）关注于产生通用的软件组件，让这些组件在不同的应用场合都能很容易地重用。在C++中，类模板和函数模板是进行泛型编程极为有效的机制。有了这两大利器，我们在实现泛型化的同时，并不需要付出效率的代价。

作为泛型编程的一个简单例子，让我们看一下在C库中如何让memcpy()函数泛型化。一种实现方法可能是这样的：

    void* memcpy(void* region1, const void* region2, size_t n)
    {
        const char* first = (const char*)region2;
        const char* last = ((const char*)region2) + n;
        char* result = (char*)region1;
        while (first != last)
            *result++ = *first++;
        return result;
    }


这个memcpy()函数已经在一定程度上进行了泛型化，采取的措施是使用void*，这样该函数就可以拷贝不同类型的数组。但如果我们想拷贝的数据不是放在数组里，而是由链表来存放呢？我们能不能扩展这个概念，让它可以拷贝任意的序列？看看memcpy()的函数体，这个函数对传入的序列有一个_最小需求_：它需要用某种形式的指针来遍历这个序列；访问指针正指向的元素；把元素写到目的地；比较指针以判断何时停止拷贝。C++标准库把这样的需求进行分组，称之为概念（concepts）。在这个例子中就有输入迭代器（对应于region1）和输出迭代器（对应于region2）这两个概念。

如果我们把memcpy()用函数模板重写，使用输入迭代器和输出迭代器作为模板参数来描述对序列的需求，我们就可以写出一个具有较高重用性的copy()函数：

    template <typename InputIterator, typename OutputIterator>
    OutputIterator
    copy(InputIterator first, InputIterator last, OutputIterator result)
    {
        while (first != last)
            *result++ = *first++;
        return result;
    }


使用这个泛型的copy()函数，我们可以拷贝各种各样的序列，只要它满足了我们指定的需求。对外提供了迭代器的链表，比如std::list，也可以通过我们的copy()函数来拷贝：

    #include <list>
    #include <vector>
    #include <iostream>
    int main()
    {
        const int N = 3;
        std::vector<int> region1(N);
        std::list<int> region2;

        region2.push_back(1);
        region2.push_back(0);
        region2.push_back(3);

        std::copy(region2.begin(), region2.end(), region1.begin());

        for (int i = 0; i < N; ++i)
            std::cout << region1[i] << " ";
        std::cout << std::endl;
    }


2、何谓概念？

概念就是需求的集合，这些需求可以包含有效表达式、相关类型、不变性，以及复杂度保证。满足概念中所有需求的类型，称之为此概念的一个样例。一个概念可以是对别的概念的扩展，称之为概念的细化。

    * 有效表达式：任意的C++表达式。若某类型是概念的一个样例，那么把该类型的一个对象代入此表达式中，该表达式必能通过编译。
    * 相关类型：与样例相关的一些类型，它们和样例共同出现在一个或多个有效表达式中。如果样例类型是自定义类型，则相关类型可以由类定义中所嵌套的一些typedef来访问。相关类型经常也通过traits类来访问。
    * 不变性：对象的一些运行时特征，必须为真。所有用到这个对象的函数，都必须保持这种特征。不变性通常以前置条件和后置条件的形式出现。
    * 复杂度保证：对概念中的有效表达式执行所需时间或资源所做的限制。

C++标准库中所使用的概念在SGI STL网站上有详细的文档说明。
3、Traits

traits类为访问编译时实体（类型、整数常量，或者地址）的相关信息提供了一条途径。比如，类模板std::iterator_traits<T>看起来是这个样子：

    template <class Iterator>
    struct iterator_traits {
        typedef ... iterator_category;
        typedef ... value_type;
        typedef ... difference_type;
        typedef ... pointer;
        typedef ... reference;
    };


该traits的value_type可以让泛型代码得知该迭代器所“指向”的是何种类型的数据；而iterator_category对迭代器的能力进行分类，针对不同类型的迭代器我们选择与之适应的最高效的算法。

traits模板有一个很重要的特点：它们是非侵入的（non-intrusive）。我们可以为任何类型提供相关信息，不管它是内建的类型，还是第三方的库中提供的类型。为了给某一特定类型指定traits，一般采用部分特化或者全特化traits模板的方式。

欲更深入的了解std::iterator_traits，可以参阅SGI提供的资料。std::numeric_limits<T>也采用了traits技术，提供表示各内建数值类型取值范围的常量值。
4、标记分派

另外有一种技术经常与traits合用，那就是标记分派。它依据类型的属性，通过函数重载进行分派。一个很好的例子就是std::advance()函数。这个函数的功能是将一个迭代器递增n次，对于不同类型的迭代器可以有各自优化的实现方法。如果是随机访问迭代器（可以以任意的距离前后跳转），advance()函数可以用i+=n来实现，既简单又高效，只需要常量时间。而其它的迭代器必须一步一步地递增，需要线性的时间复杂度。如果是双向迭代器，n就可能为负值，因此必须判断对迭代器到底是增还是减。

标记分派和traits类的联系很紧密。分派所依据的属性（在这个例子中是iterator_category）一般都是通过traits类来取得。主advance()函数从iterator_traits中获得对应于该iterator的iterator_category，然后调用重载过的advance_dispach()函数。编译器依据作为参数传给advance_dispach()的iterator_category，选择合适的重载版本。标记只是一个极其简单的类，它的唯一任务就是为标记分派或者其它类似技术传递必要的信息。

    namespace std {
      struct input_iterator_tag { };
      struct bidirectional_iterator_tag { };
      struct random_access_iterator_tag { };

      namespace detail {
        template <class InputIterator, class Distance>
        void advance_dispatch(InputIterator& i, Distance n, input_iterator_tag) {
          while (n--) ++i;
        }

        template <class BidirectionalIterator, class Distance>
        void advance_dispatch(BidirectionalIterator& i, Distance n,
           bidirectional_iterator_tag) {
          if (n >= 0)
            while (n--) ++i;
          else
            while (n++) --i;
        }

        template <class RandomAccessIterator, class Distance>
        void advance_dispatch(RandomAccessIterator& i, Distance n,
           random_access_iterator_tag) {
          i += n;
        }
      }

      template <class InputIterator, class Distance>
      void advance(InputIterator& i, Distance n) {
        typename iterator_traits<InputIterator>::iterator_category category;
        detail::advance_dispatch(i, n, category);
      }
    }


5、适配器

适配器是一种类模板，建立在其它类型之上，提供新的接口或者行为。标准库中就使用了适配器，比如std::reverse_iterator通过反转迭代器的递增/递减行为，适配了迭代器，还有std::stack，通过适配标准容器，提供一个简单的堆栈接口。

在这里可以找到标准库中所用适配器的深入阐述。
6、类型生成器

类型生成器的工作是依据它的模板参数合成新的类型[注]。类型生成器产生的新类型一般作为生成器中嵌套的typedef出现。用类型生成器的主要目的是为了让复杂的类型表达式显得更简单些。比如boost::filter_iterator_generator：

    template <class Predicate, class Iterator,
        class Value = complicated default,
        class Reference = complicated default,
        class Pointer = complicated default,
        class Category = complicated default,
        class Distance = complicated default
             >
    struct filter_iterator_generator {
        typedef iterator_adaptor<
            Iterator,filter_iterator_policies<Predicate,Iterator>,
            Value,Reference,Pointer,Category,Distance> type;
    };


看起来可真够复杂的。但现在生成一个合适的filter iterator可就容易多了，只需要写：

    boost::filter_iterator_generator<my_predicate,my_base_iterator>::type


就行了。
7、对象生成器

对象生成器是一种函数模板，依据其参数产生新的对象。可以把它想象成泛型化的构造函数。有些情况下，欲生成的对象的精确类型很难甚至根本无法表示出来，这时对象生成器可就管用了。对象生成器的优点还在于它的返回值可以直接作为函数参数，而不像构造函数那样只有在定义变量时才会调用。Boost和标准库中用到的对象生成器大多都加了个前缀make_，比如std::make_pair(const T&, const U&)。

看看下面的例子：

    struct widget {
      void tweak(int);
    };
    std::vector<widget *> widget_ptrs;


通过把两个标准的对象生成器bind2nd和mem_fun合用，我们可以很轻松地tweak所有的widget：

    void tweak_all_widgets1(int arg)
    {
       for_each(widget_ptrs.begin(), widget_ptrs.end(),
          bind2nd(std::mem_fun(&widget::tweak), arg));
    }


如果不用对象生成器，上面的函数可能就得这样来实现：

    void tweak_all_widgets2(int arg)
    {
       for_each(struct_ptrs.begin(), struct_ptrs.end(),
          std::binder2nd<std::mem_fun1_t<void, widget, int> >(
              std::mem_fun1_t<void, widget, int>(&widget::tweak), arg));
    }


表达式越复杂，就越需要缩短这些冗长的类型说明，对象生成器的好处也就越能显现。
8、策略类

策略类就是用来传递行为的模板参数。标准库中的std::allocator就是策略类，把内存管理的行为应用到标准容器中。

Andrei Alexandrescu在他的文章中对策略类进入了全面而深入的分析，他写道：

“策略类精确地反映了设计时的抉择。他们要么从其它类中继承，要么包含在其它类中。策略类在同样的句法结构上提供了不同的策略。使用策略的类把它用到的每一个策略都作为模板参数，这样，用户就可以自由地选择需要使用的策略。

策略类的强大在于它们能够自由地组合在一起。通过把策略类作为模板参数的办法来组合多种策略，代码量与使用的策略数只成线性关系。”

Andrei认为策略类的强大源于其小粒度和正交性。Boost在迭代适配器库中的策略类运用可能淡化了这一卖点。在这个库中，所有已适配的迭代器的行为都放在一个策略类里面。其实，Boost并不是开先河者。std::char_traits就是一个策略类，它决定了std::basic_string的行为，尽管它的名字叫traits而不叫policy。

注：因为C++缺少模板化的typedef，类型生成器可以作为其替代方案。