使用boost库拆分字符串
来源:互联网 发布:途风旅游 怎么样 知乎 编辑:程序博客网 时间:2024/06/05 05:41
在日常开发中经常会遇到分割字符串的要求,boost库为我们提供了一个方便的分词器——boost::tokenizer。现在就让我们学习一下boost库的分词器。
- #include <iostream>
- #include <boost/format.hpp>
- #include <boost/tokenizer.hpp>
- #include <boost/algorithm/string.hpp>
- int _tmain(int argc, _TCHAR* argv[])
- {
- // 待分割的字符串
- std::string strTag = _T("I Come from China");
- // 定义分割方式为英文逗号,中文逗号和空格,构造一个分词器,
- boost::char_separator<char> sep(" ,,");
- typedef boost::tokenizer<boost::char_separator<char> >
- CustonTokenizer;
- CustonTokenizer tok(strTag,sep);
- // 输出分割结果
- std::vector<std::string> vecSegTag;
- for(CustonTokenizer::iterator beg=tok.begin(); beg!=tok.end();++beg)
- {
- vecSegTag.push_back(*beg);
- }
- for (size_t i =0;i<vecSegTag.size();i++)
- {
- std::cout<<vecSegTag[i]<<std::endl;
- }
- // 尝试下分割中文字符
- vecSegTag.clear();
- std::string strTag2 = _T("我叫小明,你呢,今天天气不错");
- CustonTokenizer tok2(strTag2,sep);
- for(CustonTokenizer::iterator beg=tok2.begin(); beg!=tok2.end();++beg)
- {
- vecSegTag.push_back(*beg);
- }
- for (size_t i =0;i<vecSegTag.size();i++)
- {
- std::cout<<vecSegTag[i]<<std::endl;
- }
- getchar();
- return 0;
- }
#include <string>#include <iostream>#include <boost/format.hpp>#include <boost/tokenizer.hpp>#include <boost/algorithm/string.hpp>int _tmain(int argc, _TCHAR* argv[]){ // 待分割的字符串std::string strTag = _T("I Come from China"); // 定义分割方式为英文逗号,中文逗号和空格,构造一个分词器,boost::char_separator<char> sep(" ,,");typedef boost::tokenizer<boost::char_separator<char> >CustonTokenizer;CustonTokenizer tok(strTag,sep);// 输出分割结果std::vector<std::string> vecSegTag;for(CustonTokenizer::iterator beg=tok.begin(); beg!=tok.end();++beg){vecSegTag.push_back(*beg);}for (size_t i =0;i<vecSegTag.size();i++){std::cout<<vecSegTag[i]<<std::endl;}// 尝试下分割中文字符vecSegTag.clear(); std::string strTag2 = _T("我叫小明,你呢,今天天气不错");CustonTokenizer tok2(strTag2,sep);for(CustonTokenizer::iterator beg=tok2.begin(); beg!=tok2.end();++beg){vecSegTag.push_back(*beg);}for (size_t i =0;i<vecSegTag.size();i++){std::cout<<vecSegTag[i]<<std::endl;}getchar();return 0;}
但是boost::tokenizer的一个缺点是它不支持分割unicode字符串。所以要分割unicode字符串我们需要使用boost库提供的另一个接口——boost::split。它的使用比boost::tokenizer还要方便,请看下面代码:
- #include <string>
- #include <iostream>
- #include <boost/format.hpp>
- #include <boost/tokenizer.hpp>
- #include <boost/algorithm/string.hpp>
- int _tmain(int argc, _TCHAR* argv[])
- {
- std::wcout.imbue(std::locale("chs"));
- // 待分割的字符串
- std::wstring strTag = _T("I Come from China");
- std::vector<std::wstring> vecSegTag;
- // boost::is_any_of这里相当于分割规则了
- boost::split(vecSegTag, strTag,boost::is_any_of(_T(" ,,")));
- for (size_t i =0;i<vecSegTag.size();i++)
- {
- std::wcout<<vecSegTag[i]<<std::endl;
- }
- vecSegTag.clear();
- std::wstring strTag2 = _T("我叫小明,你呢,今天天气不错");
- boost::split(vecSegTag, strTag2, boost::is_any_of(_T(" ,,")));
- for (size_t i =0;i<vecSegTag.size();i++)
- {
- std::wcout<<vecSegTag[i]<<std::endl;
- }
- getchar();
- return 0;
- }
- 使用boost库拆分字符串
- 使用boost库拆分字符串
- 使用boost/tokenizer对字符串解析拆分
- boost之tokenizer库,字符串拆分
- 使用gdal库拆分字符串
- 使用PARSENAME拆分字符串
- 使用StringTokenizer进行字符串拆分
- boost.string_algo - 字符串算法库 使用点滴
- 使用boost库生成 随机数 随机字符串
- boost使用split分割字符串
- boost使用split分割字符串
- C++ 使用std::getline()拆分字符串
- 拆分字符串
- 字符串拆分
- 拆分字符串
- 拆分字符串
- 拆分字符串
- 拆分字符串
- android开发时,xml文件中总是提示某一个错误,修改后仍然提示。
- C/C++语法知识:typedef struct 用法详解
- Android最佳实践之:StrictMode介绍
- 好压haozip 命令帮助
- java中static作用详解
- 使用boost库拆分字符串
- 好的数据挖掘推荐
- sql server 2008数据库还原出错解决
- tomcat dbcp
- Jmeter 从csv文件中读取参数化数据
- EJBCA 接口的调用
- Android DPAD not enabled in AVD
- Android的AlertDialog详解
- json格式转换