boost-string_algo字符串算法库

来源:互联网 发布:凯特王妃母亲 知乎 编辑:程序博客网 时间:2024/06/07 12:24

1.lexical_cast:可以进行字符串,整数/浮点数之间的字面值转换。

#include <boost/lexical_cast.hpp>//所在头文件int main(){    int x = lexical_cast<int>("100");  //string->int     double y = lexical_cast<double>("3.14159e3");  //string->double     cout<<x<<endl;//100;    cout<<y<<endl;//314.159;    string str1 = lexical_cast<string>(100);//int -> string    string str2 = lexical_cast<string>(3.14159);//double -> string    cout<<str1<<str1[0]<<endl;//1001    cout<<str2<<str2[0]<<endl;//3.14158999999999993    bool flag = lexical_cast<bool>("1");//string -> bool    cout<<flag<<endl;    return 0;   }
此外还有一个bad_lexical_cast类,用来捕获lexical_cast过程中出现的异常。
try{lexical_cast<int>("hello");}catch(bad_lexical_cast& e){cout<<e.what()<<endl;}
2.format
#include <boost/format.hpp>支持格式化输出。

3.string_algo库,是一个针对string字符串的一个比较完备的算法库。

位置:#include <boost/algorithm/string.hpp>

算法库分类:大小写转换、判断式与分类、修剪、查找和替换、分割和合并。

3.1大小写转换:
to_upper()//修改源字符串。转换成大写字符
to_upper_copy()//不改变源字符串,返回修改后的值。
to_lower()//转换成小写字符

3.2判断式与分类:
starts_with()
ends_with()
contains()
equals()
lexicographical_compare() //根据字典顺序检测一个字符串是否小于另一个。
all() //检测字符串中所有的字符是否满足判断式。
使用带前缀 i 的算法可以实现大小写无关的,判断如:ilexicographical_compare

3.3函数对象判断式:
is_equal()
is_less()
is_not_gteater()

代码:

#include <boost/algorithm/string.hpp>#include <cassert>//注意添加使用命名空间int main(){string str("I don't Know");//to_upper(str);//转换成小写;assert( iends_with(str, "know") );assert( ends_with(str, "Know") );assert( contains(str, "no") );assert( icontains(str, "NO") );assert( ilexicographical_compare("abc", str) );is_equal()(str, "abc");//is_equal是一个函数对象,//第一对括号用于创建一个对象。然后使用函数对象重载的()函数调用符。cout<<str<<endl;return 0;   }
3.4分类:
is_space
is_alnum
is_alpha
is_cntrl
is_digit
is_graph
is_lower
is_print
is_punct  

3.5 修剪算法:
trim_letf, trim_right, trim //可以删除字符串开头和结尾的部分的空格
同时他们都有_if和_copy两种后缀版本。trime_letf_copy_if(str, is_digit());

3.6查找算法:
find_first, find_last, find_nth, find_head, find_tail.
//返回值为iterator_range<string::iterator> rge类型
如:iterator_range<string::iterator> rge;
rge = find_first(str, "long");

3.7 替换和删除:
replace/erase_first;//替换或删除在输入中第一次出现的时候。
replace/erase_last;
replace/erase_nth;
replace/erase_head;
replace/erase_tail;
//前两个算法都有前缀i,后缀_copy和组合,后四个只有后缀_copy的两个版本。
string str = "long long ago, there was a king";
string str1 = replace_first_copy(str, "long", "small");

3.8 分割算法:
find_all;有忽略大小写的前缀i的版本。
split;

3.9 合并算法:
join是分割算法的逆运算。

3.10 tokenizer:
是一个专门用于分词的字符串处理库。
#include <boost/tokenzier.hpp>
string str = "a b c d ,.e ";
tokenizer<> tok(str);//默认的分词谓词是空格和标点。

for(BOOST_AUTO(pos, tok.begin()); pos!=tok.end(); pos++)
cout<<*pos<<endl;
缺点:只支持使用单个字符进行分词,不知道多个字符如".."

4 正则表达式库:
xpressive:能够解决文本的绝大数问题如:验证、匹配、查找、替换。//虽然正则库覆盖了string_algo的所有算法,但是前者比较庞大,没有后者效率高。
动态用法:#include <boost/xpressive/xpressive_dynamic.hpp>//动态库是正则库的主体部分。
using namespace boost::xpressive;
正则表达式:
. 是单字符的通配符。
^ 匹配行的开头
$ 匹配行的末尾
* 表示可以重复任意多次(n>=0)
+ 表示可以重复一次或多次(n>0)
? 表示n=0或1
()定义一个正则表达式子元素,可以引用或重复。
{} 可以手工指定重复的次数,{n}重复x=n次。
[] 用于定义字符集合。
\ 转义字符,特殊字符转以后自身匹配。\.
\d相当于[0-9],\w=[a-z],\s 匹配空格。
| 或,匹配它两的元素之一。

#include <boost/xpressive/xpressive_dynamic.hpp>using namespace boost::xpressive;int main() {    using namespace boost::xpressive;    cregex reg = cregex::compile("a*c");//产生正则表达式对象。    assert( regex_match("abc", reg) );//匹配成功    assert( regex_match("abbc", reg) );//判断字符,是否匹配reg的正则。cregex reg = cregex::compile("\\d{6}((1|2)\\d{3})((0|1)\\d)([0-3]\\d)(\\d{3}(X|\\d))"        , icase);//产生正则表达式对象。 icase用于忽略大小写。    //子括号里仍是表达式,共有七个表达式。    cmatch what;    assert( regex_match("32940119910903403X", what, reg) );//匹配成功        for(BOOST_AUTO(pos, what.begin()); pos != what.end(); ++pos)        cout<<*pos<<endl;    cout<<"date:"<<what[1]<<what[3]<<what[5]<<endl;regex_replace(str, reg1, "manual");//将str中和reg1匹配的表达式替换为"manual"    return 0;   }
//如果同一行的str有多个内容匹配正则式。可以使用,(比较特殊的一种情况)int main() {    using namespace boost::xpressive;    std::ifstream ifs;    ifs.open("test.txt");    //std::ifstream ifs("test.txt");    string str = "there is a power-suit item";;    sregex reg = sregex::compile("(power)-(.{4})", icase);    sregex_iterator end;    smatch what;    while( getline(ifs, str) )    {        sregex_iterator pos(str.begin(), str.end(), reg);//迭代器模板。        while( pos != end )        {            cout<<(*pos)[0]<<" ";            ++pos;        }           cout<<endl;    }        return 0;   }

5.boost容器

boost容器很多,而且在STL的基础上添加了很多容器,但是使用范围比较狭窄,所以我们只需要了解就可以。

1.array;
速度、性能上与原始数组相差无几。只是包装了普通的数组。属于静态数组,不支持动态分配。
2.dynamic_bitset//位数组
3.散列容器:unordered_set, unordered_map; //其实就是hash_map
4.bimap是双向映射容器。分为左右视图。
5.circular_buffer :循环缓冲区的数据结构。
6.tuple(元组):有固定数目元素的容器,是std::pair的泛化。
7.any只能容纳一个元素,但是这个元素可以是任意类型。
8.variant和any有些类似,是一种可变类型。variant是对union的扩展。
9.multi_array多维数组。
10.property_tree库容器可以解析xml,json,ini,info的配置文件。

  


0 0
原创粉丝点击