模式串的快速匹配算法,kmp算法,尊重前人成果,创造新未来

来源:互联网 发布:jsp连接sql server2005 编辑:程序博客网 时间:2024/05/19 22:28

我们知道很多时候会用到一些匹配的算法,比如串的查找什么的,我不太擅长对数学公式进行推导,所以看到数据结构树上的一些抽象的函数表达式就头疼

所以数据结构老是学不好,所以对于KMP快速模式匹配串的算法给出一种通俗的理解,希望对大家有所帮助,或者一种参考,有什么不对的希望不吝批评

举个例子:一个查找串 Mstr = a b c a b c a c a b来说吧,当然可以更加复杂

最常见的一种算法就是采用两个for循环,若全部匹配那么就打印出位置,否则重头Mstr来进行匹配,总的最坏的时间就是O((m-n)*n)(就是匹配最后的一个失效)

那么能否将其减小到O(n)的线性维度呢,分析一下Mstr

                                                                                                0  1  2  3  4  5  6

 a  b  c  a  b  c  a  c  a  b

                                                                            ........ ........ ..a  b  c  a   x..........

通过比较发现如果在位置4失配,我们无需从Mstr开始就进行比较,因为我们注意到3位置和0位置是一致的,因此可以将失配的位置和1位置进行比较,因为3位置和0位置一致

由此得出的结论是能否观察mstr的规律获得一种较优算法,因此对于书本上的内容我概括如下:从Mstr开始我们找到这么一种串,例如拿位置3的a来说,依次比较与0处的a的

最大的错位相等串,比如a[0] = a[3] k= 0 ; a[0]b[1]!=c[2]a[3];a[0]b[1]c[2]!=b[1]c[2]a[3];不得等于0-3因为没有意义,由此得出一个规律,从某一个字符找到往前k个字符等于从0开始的往后k个字符,相等则得出基于MStr的回溯信息令生成该函数为f则当前字符串索引index 有回溯信息f[index] = k-1;如图6位置往前4个和0开始往后4个得到f[6] = 4-1;

得到所有的f函数的值之后进行匹配就好办了

失配的时候只需将失配字符与Mstr的最后匹配的串的f值加一,例如7位置失配,那么只需回溯到Mstr的4位置 = f[6]+1 = 3+1;

下面是实现

f函数获取

void StringMatch::fGeneration(int *a,const char *str,int length)
{
    int j = -1;
    a[0] = -1;

//0的f值都是-1,这是为了便于后面的计算,属于一个小的手法
    for(int i=1;i<length;i++)
    {
        j=a[i-1];

//获取上一个f值
        while(str[i]!=str[j+1]&&j>=0) j=a[j];//主要是多个相同之后若存在不同的,那么就是回溯到之前的值

//从第一个开始比较,相同就加一,如果j>=0表示多个相同,那么就是累加效果
        if(str[i] == str[j+1])
            a[i] = ++j;
        else
            a[i] = -1;

//不等那么就是-1
    }    
}

int StringMatch::KMPStringFind(StringMatch &str)
{
    int pos = 0;
    int posm = 0;
    while(pos<str.record.length()&&posm<str.modString.length())
    {
        if(str.record[pos] == str.modString[posm])
        {
            pos++;
            posm++;
        }
        else
        {   
            if(posm == 0)
            {
                pos++;
            }
            else
               posm = str.f[posm-1]+1;//基于f函数的回溯
        }
    }
    if(posm<str.modString.length()) return -1;
    else
        return pos-posm;
}


0 0
原创粉丝点击