字符串的包含

来源:互联网 发布:paparecipe软件可靠吗 编辑:程序博客网 时间:2024/05/16 17:16

来源:编程之法-面试和算法心得 July

题目描述:给定一长字符串a和一短字符串b。请问,如何最快地判断出短字符串b中的所有字符是否都在长字符串a中?编写函数bool StringContain(string &a,string &b)。

假定输入的字符串只包含大写英文字母。

分析与解法:

解法一:蛮力轮询

思路:轮询短字符串b中的每一个字符,逐个与长字符串a中的每个字符进行比较,看是否都在字符串a中

代码:

bool StringContain(string &a, string &b){    for(int i = 0; i < b.length(); ++i)    {        ;    }    if(j >= a.length())    {        return false;    }    return true;}

如果字符串a长度为m,b字符串长度为n,那么算法需要比较O(mn)次,时间开销太大。
解法二:排序后轮询

可以考虑先排序后轮询。通常,连个字符串的排序需要O(m log m)+ O(n log n)次操作,之后线性扫描O(m+n)次

代码:

bool StringContain(string &a, string &b){    sort(a.begin(), a.end());    sort(b.begin(), b.end());    for(int pa = 0, pb = 0; pb < b.length();)    {        while(pa < a.length() && a[pa] < b[pb])        {            ++pa;        }        if(pa >= a.length() || a[pa] > b[pb])        {            return false;        }        ++pb;    }    return true;}

解法三:素数相乘

思路:按照从小到大的顺序,用26个素数分别代替长字符串a中的所有字母;遍历长字符串a,求得a中的所有字母对应的素数的乘积;遍历短字符串b,判断上一步得到的乘积能否被b中的字母对应的素数整除;输出结果。

代码:

bool StringContain(string &a, string &b){     const int p[26] = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37,     41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101 };     int f = 1;     for(int i = 0; i < a.length(); ++i)     {         int x = p[a[i] - 'A'];         if (f % x) { f *= x; }     }     for(int i = 0; i < b.length(); ++i)     {         int x = p[b[i] - 'A'];         if(f % x)         {             return false;         }     }    return true;}

这种素数相乘的方法看似可行,实则不行,因为素数相乘的而结果会很大,从而导致整数溢出(前16个字母对应的素数相乘便会超出long long类型所能表示的最大整数范围)解法四:

位运算法思路:可以将长字符串a中的所有字符都放入一个散列表(hash table)中,然后轮询短字符串b,看b中的每个字符是否都在散列表里,如果都在,说明长字符串a包含短字符串b;否则,说明不包含。再进一步,可以用位运算(26位整数表示)位长字符串a计算出一个签名,再逐一将短字符串b中的字符放到a中进行查找。

代码:

bool StringContain(string &a, string &b){    int hash = 0;    for(int i = 0; i < a.length(); ++i)    {        hash |= (1 << (a[i] - 'A'));    }    for(int i = 0; i < b.length(); ++i)    {        if((hash & (1 << (b[i] - 'A'))) == 0)        {            return false;        }    }    return true;}

这个位运算方法的实质是用一个整数代替了散列表,空间复杂度为O(1),时间复杂度为O(n+m)。




0 0