c++中的字符串分割

来源:互联网 发布:淘宝账户暂时被冻结 编辑:程序博客网 时间:2024/05/20 16:52


分割字符串应该是一种非常常用的功能

c语言中提供了strtok函数,但是c++标准库中偏偏没有

虽然实现这个功能并不困难,但如果有标准的,谁会自己去写各种乱七八糟的实现呢

关于这个问题,cplusplus.com有一篇专门讨论它的专题

www.cplusplus.com/faq/sequences/strings/split/

这里面提到了几种实现和使用方法

因为平时不使用boost库,所以就来看看c++的实现和Qt实现的使用

c++流的实现来自Jonathan Boccara's blog 点击打开链接


先来看看Qt的QString::split,使用非常方便,输出到一个QStringList

    QString text = "Let,me,split,this,into,words";    auto start_timepoint = std::chrono::system_clock::now();    for (int i = 0; i < 100000; ++i) {        QStringList sl = text.split(',');    }    auto end_timepoint = std::chrono::system_clock::now();    qDebug() << std::chrono::duration_cast<std::chrono::milliseconds>(end_timepoint - start_timepoint).count();
在我的机器上输出一般是在700毫秒左右


来试试c++标准库中提供的iostreams和getline配合使用

    std::string str;    for (int i = 0; i < 100000; ++i) {        std::istringstream iss(text);        std::vector<std::string> results;        while (!iss.eof()) {            getline(iss, str, ',');            results.push_back(str);        }    }
也来测一下时间,2400毫秒左右,也太差了点吧
来,在push_back的地方加上std::move,肯定是没有优化的原因

加上后,效果非常明显,提高到了2350毫秒左右,看来这玩意效率不行啊


现在请出Jonathan Boccara博客里面更为高大上的实现,原理也是流和getline的配合使用,使用了iterator貌似更符合stl的使用习惯

template<char delimiter>class WordDelimitedBy : public std::string{};template<char delimiter>std::istream& operator>>(std::istream& is, WordDelimitedBy<delimiter>& output) {   return std::getline(is, output, delimiter);}for (int i = 0; i < 100000; ++i) {   std::istringstream iss(text);    std::vector<std::string> results((std::istream_iterator<WordDelimitedBy<','>>(iss)),                                 std::istream_iterator<WordDelimitedBy<','>>());}
继续测时间,3000毫秒,越来越慢了

再试试c++中最直观的解决方法std::string的find和substr

std::vector<std::string> splitString(const std::string &str, char delimiter){    std::vector<std::string> vec;    std::string::size_type start_pos = 0;    std::string::size_type end_pos = str.find(delimiter);    while(end_pos != std::string::npos) {        vec.push_back(str.substr(start_pos, end_pos - start_pos));        start_pos = end_pos + 1;        end_pos = str.find(start_pos, delimiter);    }    vec.push_back(str.substr(start_pos));    return vec;}for (int i = 0; i < 100000; ++i) {    auto results = splitString(text, ',');}
850毫秒左右,和QString的split差得不太多


Qt的实现这么牛!以后就只能老老实实地用了?

再做个实验

给每个待分割的字符串加长

    for (int i = 0; i < 100; ++i)        text += ",Let,me,split,this,into,words";

然后计时,开始分割1000次(这次不是100000次了)

看看现在是个什么情况?

结果有点令我吃惊!
c++流的实现在5000毫秒左右,Qt的实现在2500左右

而用string的find和substr方法的实现仅需40毫秒左右!!!


赶紧的,还等什么,用string的find和substr写个函数放那儿,万一性能不行的时候换上试试呗。


原创粉丝点击