使用hash法高效替换多个字符

来源:互联网 发布:自然语言处理余弦算法 编辑:程序博客网 时间:2024/05/21 15:27

在项目中经常要遇到要对字符串中的特殊的字符进行替换,例如字符串中如果多了个回车键、换行符或是制表符,那么将该string写成行表形式的数据时,该行数据将不能满足需求。而如果替换过程中,不注意算法的设计,替换的时间复杂度将很高。本文介绍使用hash的方式,以空间的浪费的代价来换取替换时间的降低,使得时间复杂度达到O(N).

假设待替换的字符为\t,\r,\n,要将他们替换为*。方法是,将待替换的字符映射到hash中(以vector实现,vector下标为字符的ASCII码)。替换时,遍历字符串的每个字符,以hash的方式判断该字符是否在待替换的字符表中。
此次还用到一个特性,就是 char ch = 9;与 char ch = ‘\t’;定义效果一样。

示例代码

#include <iostream>#include <string>#include <vector>using namespace std;void hashRepalce(vector<int> vecChs,string &str){    int idx ;    for(size_t i = 0 ; i < str.length() ;++i)    {        //获取遍历字符的ASCii码        idx = str[i];        //注意 idx > 0  && idx < vecChs.size() 判断的必要性,如果不判断,那么对于汉字,或者其他字符,        //它们的ASCII码不在hash表的范围内,将导致内存访问越界        //vecChs[idx]即可判断该字符是否在hash的待替换字符之列        if(idx > 0  && idx < vecChs.size() && vecChs[idx])        {            str[i] = '*';        }    }}int main(){    string str = "hello \t,world \n";    vector<int> vec;    //初始化vector,大小为256,初始值为0    vec.resize(256,0);    //将要替换的字符的下标对于的vector值置为1    vec[9] = 1 ; // \t    vec[10] = 1 ; // \n    vec[13] = 1 ; // \r    hashRepalce(vec,str);    cout<<str<<endl;    return 0;}
原创粉丝点击