STL(标准模板库)理论基础与容器

来源:互联网 发布:俄罗斯科技实力知乎 编辑:程序博客网 时间:2024/05/07 05:42

10.1 STL(标准模板库)理论基础

10.1.1基本概念

STLStandard Template Library,标准模板库)是惠普实验室开发的一系列软件的统称。现然主要出现在C++中,但在被引入C++之前该技术就已经存在了很长的一段时间。

STL的从广义上讲分为三类:algorithm(算法)、container(容器)和iterator(迭代器)容器和算法通过迭代器可以进行无缝地连接。几乎所有的代码都采用了模板类和模板函数的方式,这相比于传统的由函数和类组成的库来说提供了更好的代码重用机会。在C++标准中,STL被组织为下面的13个头文 件:<algorithm><deque><functional><iterator><vector><list><map><memory><numeric><queue><set><stack><utility>

STL详细的说六大组件

– 容器(Container

– 算法(Algorithm

– 迭代器(Iterator

– 仿函数(Function object

– 适配器(Adaptor

– 空间配制器(allocator

使用STL的好处

1STLC++的一部分,因此不用额外安装什么,它被内建在你的编译器之内。

2STL的一个重要特点是数据结构和算法的分离。尽管这是个简单的概念,但是这种分离确实使得STL变得非常通用。

例如,STLvector容器中,可以放入元素、基础数据类型变量、元素的地址;

STLsort()函数可以用来操作vector,list等容器。

1) 程序员可以不用思考STL具体的实现过程,只要能够熟练使用STLOK了。这样他们就可以把精力放在程序开发的别的方面。

2) STL具有高可重用性,高性能,高移植性,跨平台的优点。

高可重用性:STL中几乎所有的代码都采用了模板类和模版函数的方式实现,这相比于传统的由函数和类组成的库来说提供了更好的代码重用机会。关于模板的知识,已经给大家介绍了。

高性能:如map可以高效地从十万条记录里面查找出指定的记录,因为map是采用红黑树的变体实现的。(红黑树是平横二叉树的一种)

高移植性:如在项目A上用STL编写的模块,可以直接移植到项目B上。

  跨平台:如用windowsVisual Studio编写的代码可以在Mac OSXCode上直接编译。

3) 程序员可以不用思考STL具体的实现过程,只要能够熟练使用STLOK了。这样他们就可以把精力放在程序开发的别的方面。

4) 了解到STL的这些好处,我们知道STL无疑是最值得C++程序员骄傲的一部分。每一个C++程序员都应该好好学习STL只有能够熟练使用STL的程序员,才是好的C++程序员。

5) 总之:招聘工作中,经常遇到C++程序员对STL不是非常了解。大多是有一个大致的映像,而对于在什么情况下应该使用哪个容器和算法都感到比较茫然。STLC++程序员的一项不可或缺的基本技能,掌握它对提升C++编程大有裨益。

10.1.2容器 

在实际的开发过程中,数据结构本身的重要性不会逊于操作于数据结构的算法的重要性,当程序中存在着对时间要求很高的部分时,数据结构的选择就显得更加重要。

  经典的数据结构数量有限,但是我们常常重复着一些为了实现向量、链表等结构而编写的代码,这些代码都十分相似,只是为了适应不同数据的变化而在细节上有所出入。STL容器就为我们提供了这样的方便,它允许我们重复利用已有的实现构造自己的特定类型下的数据结构,通过设置一些模板STL容器对最常用的数据结构提供了支持,这些模板的参数允许我们指定容器中元素的数据类型,可以将我们许多重复而乏味的工作简化。

容器部分主要由头文 <vector>,<list>,<deque>,<set>,<map>,<stack> 和<queue>组成。对于常用的一些容器和容器适配器(可以看作由其它容器实现的容器),可以通过下表总结一下它们和相应头文件的对应关系。

10.1.2.1容器的概念

用来管理一组元素

10.1.2.2容器的分类

序列式容器(Sequence containers)

每个元素都有固定位置--取决于插入时机和地点,和元素值无关。

vector、deque、list  

关联式容器(Associated containers)

元素位置取决于特定的排序准则,和插入顺序无关

set、multiset、map、multimap

 

数据结构

描述

实现头文件

向量(vector)

连续存储的元素

<vector>

列表(list)

由节点组成的双向链表,每个结点包含着一个元素

<list>

双队列(deque)

连续存储的指向不同元素的指针所组成的数组

<deque>

集合(set)

由节点组成的红黑树,每个节点都包含着一个元素,节点之间以某种作用于元素对的谓词排列,没有两个不同的元素能够拥有相同的次序

<set>

多重集合(multiset)

允许存在两个次序相等的元素的集合

<set>

栈(stack)

后进先出的值的排列

<stack>

队列(queue)

先进先出的执的排列

<queue>

优先队列(priority_queue)

元素的次序是由作用于所存储的值对上的某种谓词决定的的一种队列

<queue>

映射(map)

由{键,值}对组成的集合,以某种作用于键对上的谓词排列

<map>

多重映射(multimap)

允许键对有相等的次序的映射

<map>

10.1.3迭代器

迭代器从作用上来说是最基本的部分,可是理解起来比前两者都要费力一些。软件设计有一个基本原则,所有的问题都可以通过引进一个间接层来简化,这种简化在STL中就是用迭代器来完成的。概括来说,迭代器在STL中用来将算法和容器联系起来,起着一种黏和剂的作用。几乎STL提供的所有算法都是通 过迭代器存取元素序列进行工作的,每一个容器都定义了其本身所专有的迭代器,用以存取容器中的元素。

  迭代器部分主要由头文件<utility>,<iterator><memory>组 成。<utility>是一个很小的头文件,它包括了贯穿使用在STL中的几个模板的声明,<iterator>中提供了迭代器 使用的许多方法,而对于<memory>的描述则十分的困难,它以不同寻常的方式为容器中的元素分配存储空间,同时也为某些算法执行期间产生 的临时对象提供机制,<memory>中的主要部分是模板类allocator,它负责产生所有容器中的默认分配器。

10.1.4算法

函数库对数据类型的选择对其可重用性起着至关重要的作用。举例来说,一个求方根的函数,在使用浮点数作为其参数类型的情况下的可重用性肯定比使用整型作为它的参数类性要高。而C++通过模板的机制允许推迟对某些类型的选择,直到真正想使用模板或者说对模板进行特化的时候,STL就利用了这一点提 供了相当多的有用算法。它是在一个有效的框架中完成这些算法的——可以将所有的类型划分为少数的几类,然后就可以在模版的参数中使用一种类型替换掉同一种 类中的其他类型。

STL提供了大约100个实现算法的模版函数,比如算法for_each将为指定序列中的每一个元素调用指定的函数,stable_sort以 你所指定的规则对序列进行稳定性排序等等。这样一来,只要熟悉了STL之后,许多代码可以被大大的化简,只需要通过调用一两个算法模板,就可以完成所需要 的功能并大大地提升效率。

算法部分主要由头文件<algorithm><numeric><functional>成。<algorithm>是所有STL头文件中最大的一个(尽管它很好理解),它是由一大堆模版函数组成的,可以认为每个函数在很大程度上 都是独立的,其中常用到的功能范围涉及到比较、交换、查找、遍历操作、复制、修改、移除、反转、排序、合并等等。<numeric>体积很 小,只包括几个在序列上面进行简单数学运算的模板函数,包括加法和乘法在序列上的一些操作。<functional>中则定义了一些模板类, 用以声明函数对象。

10.1.5C++标准库

C++强大的功能来源于其丰富的类库及库函数资源。C++标准库的内容总共在50个标准头文件中定义。在C++开发中,要尽可能地利用标准库完 成。这样做的直接好处包括:(1)成本:已经作为标准提供,何苦再花费时间、人力重新开发呢;(2)质量:标准库的都是经过严格测试的,正确性有保证; (3)效率:关于人的效率已经体现在成本中了,关于代码的执行效率要相信实现标准库的大牛们的水平;(4)良好的编程风格:采用行业中普遍的做法进行开发。

C++程序设计课程中,尤其是作为第一门程序设计课程,我们注重了语法、语言的机制等方面的内容。程序设计能力的培养有个过程,跨过基本的原 理性知识直接进入到工程中的普遍做法,由于跨度决定了其难度。再者,在掌握了基本原理的基础上,在认识标准库的问题上完全可以凭借实践,逐步地掌握。标准 库的学习不需要认认真真地读书,需要的是在了解概貌的情况下,在实践中深入。

这个任务就是要知道C++程序设计课程中不讲的,但对程序设计又很重要的这部分内容。至少我们要能先回答出有什么的问题。

 

C++标准库的内容分为10类,分别是(建议在阅读中,将你已经用过或听说过的头文件划出来):  

C1. 标准库中与语言支持功能相关的头文件

头文件

描        述

<cstddef>

定义宏NULL和offsetof,以及其他标准类型size_t和ptrdiff_t。与对应的标准C头文件的区别是,NULL是C++空指针常量的补充定义,宏offsetof接受结构或者联合类型参数,只要他们没有成员指针类型的非静态成员即可。

<limits>

提供与基本数据类型相关的定义。例如,对于每个数值数据类型,它定义了可以表示出来的最大值和最小值以及二进制数字的位数。

<climits>

提供与基本整数数据类型相关的C样式定义。这些信息的C++样式定义在<limits>中

<cfloat>

提供与基本浮点型数据类型相关的C样式定义。这些信息的C++样式定义在<limits>中

<cstdlib>

提供支持程序启动和终止的宏和函数。这个头文件还声明了许多其他杂项函数,例如搜索和排序函数,从字符串转换为数值等函数。它与对应的标准C头文件 stdlib.h不同,定义了abort(void)。abort()函数还有额外的功能,它不为静态或自动对象调用析构函数,也不调用传给 atexit()函数的函数。它还定义了exit()函数的额外功能,可以释放静态对象,以注册的逆序调用用atexit()注册的函数。清除并关闭所有 打开的C流,把控制权返回给主机环境。

<new>

支持动态内存分配

<typeinfo>

支持变量在运行期间的类型标识

<exception>

支持异常处理,这是处理程序中可能发生的错误的一种方式

<cstdarg>

支持接受数量可变的参数的函数。即在调用函数时,可以给函数传送数量不等的数据项。它定义了宏va_arg、va_end、va_start以及va_list类型

<csetjmp>

为C样式的非本地跳跃提供函数。这些函数在C++中不常用

<csignal>

为中断处理提供C样式支持

 

C2. 支持流输入/输出的头文件 

头文件

描        述

<iostream>

支持标准流cin、cout、cerr和clog的输入和输出,它还支持多字节字符标准流wcin、wcout、wcerr和wclog。

<iomanip>

提供操纵程序,允许改变流的状态,从而改变输出的格式。

<ios>

定义iostream的基类

<istream>

为管理输出流缓存区的输入定义模板类

<ostream>

为管理输出流缓存区的输出定义模板类

<sstream>

支持字符串的流输入输出

<fstream>

支持文件的流输入输出

<iosfwd>

为输入输出对象提供向前的声明

<streambuf>

支持流输入和输出的缓存

<cstdio>

为标准流提供C样式的输入和输出

<cwchar>

支持多字节字符的C样式输入输出

 

C3. 与诊断功能相关的头文件 

头文件

描        述

<stdexcept>

定义标准异常。异常是处理错误的方式

<cassert>

定义断言宏,用于检查运行期间的情形

<cerrno>

支持C样式的错误信息

 

C4. 定义工具函数的头文件 

头文件

描        述

<utility>

定义重载的关系运算符,简化关系运算符的写入,它还定义了pair类型,该类型是一种模板类型,可以存储一对值。这些功能在库的其他地方使用

<functional>

定义了许多函数对象类型和支持函数对象的功能,函数对象是支持operator()()函数调用运算符的任意对象

<memory>

给容器、管理内存的函数和auto_ptr模板类定义标准内存分配器

<ctime>

支持系统时钟函数

 

C5. 支持字符串处理的头文件    

头文件

描        述

<string>

为字符串类型提供支持和定义,包括单字节字符串(由char组成)的string和多字节字符串(由wchar_t组成)

<cctype>

单字节字符类别

<cwctype>

多字节字符类别

<cstring>

为处理非空字节序列和内存块提供函数。这不同于对应的标准C库头文件,几个C样式字符串的一般C库函数被返回值为const和非const的函数对替代了

<cwchar>

为处理、执行I/O和转换多字节字符序列提供函数,这不同于对应的标准C库头文件,几个多字节C样式字符串操作的一般C库函数被返回值为const和非const的函数对替代了。

<cstdlib>

为把单字节字符串转换为数值、在多字节字符和多字节字符串之间转换提供函数

 

C6. 定义容器类的模板的头文件   

<vector>

定义vector序列模板,这是一个大小可以重新设置的数组类型,比普通数组更安全、更灵活

<list>

定义list序列模板,这是一个序列的链表,常常在任意位置插入和删除元素

<deque>

定义deque序列模板,支持在开始和结尾的高效插入和删除操作

<queue>

为队列(先进先出)数据结构定义序列适配器queue和priority_queue

<stack>

为堆栈(后进先出)数据结构定义序列适配器stack

<map>

map是一个关联容器类型,允许根据键值是唯一的,且按照升序存储。multimap类似于map,但键不是唯一的。

<set>

set是一个关联容器类型,用于以升序方式存储唯一值。multiset类似于set,但是值不必是唯一的。

<bitset>

为固定长度的位序列定义bitset模板,它可以看作固定长度的紧凑型bool数组

 

C7. 支持迭代器的头文件   

头文件

描        述

<iterator>

给迭代器提供定义和支持

 

C8. 有关算法的头文件   

头文件

描        述

<algorithm>

提供一组基于算法的函数,包括置换、排序、合并和搜索

<cstdlib>

声明C标准库函数bsearch()和qsort(),进行搜索和排序

<ciso646>

允许在代码中使用and代替&&

 

C9. 有关数值操作的头文件   

头文件

描        述

<complex>

支持复杂数值的定义和操作

<valarray>

支持数值矢量的操作

<numeric>

在数值序列上定义一组一般数学操作,例如accumulate和inner_product

<cmath>

这是C数学库,其中还附加了重载函数,以支持C++约定

<cstdlib>

提供的函数可以提取整数的绝对值,对整数进行取余数操作

 

C10. 有关本地化的头文件   

头文件

描        述

<locale>

提供的本地化包括字符类别、排序序列以及货币和日期表示。

<clocale>

对本地化提供C样式支持

 

C++标准库的所有头文件都没有扩展名。C++标准库以<cname>形式的标准头文件提供。在<cname>形式标准的头文件中,与宏相关的名称在全局作用域中定义,其他名称在std命名空间中声明。在C++中还可以使用name.h形式的标准C库头文件名 

 

10.1.6模板简要回顾

² 模板是实现代码重用机制的一种工具,实质就是实现类型参数化,即把类型定义为参数。

² C++提供两种模板:函数模板,类模板

 

函数模板的简介

² 函数模板就是建立一个通用的函数,其函数返回类型和形参类型不具体指定,而是用虚拟的类型来代表。

² 凡是函数体相同的函数都可以用函数模板来代替,不必定义多个函数,只需在模板中定义一次即可。

² 在调用函数时系统会根据实参的类型来取代模板中的虚拟类型,从而实现了不同函数的功能。

类模板的简介

² 我们先来看一下下面这个类,求最大值的类

² 和函数模板一样,类模板就是建立一个通用类,其数据成员的类型、成员函数的返回类型和参数类形都可以不具体指定,而用虚拟的类型来代表。

² 当使用类模板建立对象时,系统会根据实参的类型取代类模板中的虚拟类型,从而实现不同类的功能。

10.2容器

10.2.1 STLstring

1String概念

² stringSTL的字符串类型,通常用来表示字符串。而在使用string之前,字符串通常是用char*表示的。stringchar*都可以用来表示字符串,那么二者有什么区别呢。

stringchar*的比较

² string是一个类, char*是一个指向字符的指针。

         string封装了char*,管理这个字符串,是一个char*型的容器。

² string不用考虑内存释放和越界。

         string管理char*所分配的内存。每一次string的复制,取值都由string类负责维护,不用担心复制越界和取值越界等。

² string提供了一系列的字符串操作函数(这个等下会详讲)

       查找find,拷贝copy,删除erase,替换replace,插入insert

2string的构造函数

² 默认构造函数:

string();    //构造一个空的字符串string s1

² 拷贝构造函数:

string(const string &str); //构造一个与str一样的string。如string s1(s2)

² 带参数的构造函数

    string(const char *s);    //用字符串s初始化

    string(int n,char c);    //n个字符c初始化

3string的存取字符操作

² string类的字符操作:

const char &operator[] (int n) const;

const char &at(int n) const;

char &operator[] (int n);

char &at(int n);

² operator[]at()均返回当前字符串中第n个字符,但二者是有区别的。

        主要区别在于at()在越界时会抛出异常,[]在刚好越界时会返回(char)0,再继续越界时,编译器直接出错。如果你的程序希望可以通过try,catch捕获异常,建议采用at()

4string取得const char*的操作

² const char *c_str() const;   //返回一个以'\0'结尾的字符串的首地址

5string拷贝到char*指向的内存空间的操作

² int copy(char *s, int n, int pos=0) const;  

把当前串中以pos开始的n个字符拷贝到以s为起始位置的字符数组中,返回实际拷贝的数目。注意要保证s所指向的空间足够大以容纳当前字符串,不然会越界。

6string的长度

int length() const;   //返回当前字符串的长度。长度不包括字符串结尾的'\0'

bool empty() const;     //当前字符串是否为空

7string的赋值

string &operator=(const string &s);//把字符串s赋给当前的字符串

string &assign(const char *s); //把字符串s赋给当前的字符串

string &assign(const char *s, int n); //把字符串s的前n个字符赋给当前的字符串

string &assign(const string &s);  //把字符串s赋给当前字符串

string &assign(int n,char c);  //用n个字符c赋给当前字符串

string &assign(const string &s,int start, int n);  //把字符串s中从start开始的n个字符赋给当前字符串

8string字符串连接

string &operator+=(const string &s);  //把字符串s连接到当前字符串结尾

string &operator+=(const char *s);//把字符串s连接到当前字符串结尾

string &append(const char *s);    //把字符串s连接到当前字符串结尾

string &append(const char *s,int n);  //把字符串s的前n个字符连接到当前字符串结尾

string &append(const string &s);   //同operator+=()

string &append(const string &s,int pos, int n);//把字符串s中从pos开始的n个字符连接到当前字符串结尾

string &append(int n, char c);   //在当前字符串结尾添加n个字符c

9string的比较

int compare(const string &s) const;  //与字符串s比较

int compare(const char *s) const;   //与字符串s比较

compare函数在>时返回1<时返回-1==时返回0。比较区分大小写,比较时参考字典顺序,排越前面的越小。大写的A比小写的a小。

10string的子串

string substr(int pos=0, int n=npos) const;    //返回由pos开始的n个字符组成的子字符串

11string的查找 替换

查找

int find(char c,int pos=0) const;  //pos开始查找字符c在当前字符串的位置

int find(const char *s, int pos=0) const;  //pos开始查找字符串s在当前字符串的位置

int find(const string &s, int pos=0) const;  //pos开始查找字符串s在当前字符串中的位置

find函数如果查找不到,就返回-1

int rfind(char c, int pos=npos) const;   //pos开始从后向前查找字符c在当前字符串中的位置

int rfind(const char *s, int pos=npos) const;

int rfind(const string &s, int pos=npos) const;

//rfind是反向查找的意思,如果查找不到, 返回-1

 

替换

string &replace(int pos, int n, const char *s);//删除从pos开始的n个字符,然后在pos处插入串s

string &replace(int pos, int n, const string &s);  //删除从pos开始的n个字符,然后在pos处插入串s

void swap(string &s2);    //交换当前字符串与s2的值

 

//4 字符串的查找和替换

void main25()

{

string s1 = "wbm hello wbm 111 wbm 222 wbm 333";

size_t index = s1.find("wbm", 0);

cout << "index: " << index;

 

 

//itcast出现的次数

size_t offindex = s1.find("wbm", 0);

while (offindex != string::npos)

{

cout << "在下标index: " << offindex << "找到wbm\n";

offindex = offindex + 1;

offindex = s1.find("wbm", offindex);

}

 

//替换

string s2 = "wbm hello wbm 111 wbm 222 wbm 333";

s2.replace(0, 3, "wbm");

cout << s2 << endl;

 

//itcast出现的次数

offindex = s2.find("wbm", 0);

while (offindex != string::npos)

{

cout << "在下标index: " << offindex << "找到wbm\n";

s2.replace(offindex, 3, "WBM");

offindex = offindex + 1;

offindex = s1.find("wbm", offindex);

}

cout << "替换以后的s2" << s2 << endl;

}

12String的区间删除和插入

string &insert(int pos, const char *s);

string &insert(int pos, const string &s);

//前两个函数在pos位置插入字符串s

string &insert(int pos, int n, char c);  //在pos位置插入n个字符c

 

string &erase(int pos=0, int n=npos);  //删除pos开始的n个字符,返回修改后的字符串

 

13string算法相关

void main27()

{

string s2 = "AAAbbb";

transform(s2.begin(), s2.end(), s2.begin(), toupper);

cout << s2 << endl;

 

string s3 = "AAAbbb";

transform(s3.begin(), s3.end(), s3.begin(), tolower);

cout << s3 << endl;

}

2 0