Vision_字符串_KMP

来源:互联网 发布:大赦国际 知乎 编辑:程序博客网 时间:2024/06/14 19:08
///定义:
/*
        KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和
    V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP
    算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹
    配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含
    了模式串的局部匹配信息。时间复杂度O(m+n)。
*/

///代码:

/***name:KMP**function:匹配模式串与母串**输入参数:模式串与母串**输出参数:模式串在母串中第一次出现的位置**时间复杂度:O(m+n)*/#include <iostream>#include <cstring>#include <cstdio>#include <cmath>#include <algorithm>using namespace std;const int maxn = 100;char s[maxn],str[maxn];///s是母串,str是模式串int next[maxn];void getnext(){    int i = 0,j = -1;    next[i] = -1;    int len = strlen(str);    while(i<len){        if(j==-1||str[i]==str[j]){            i++;            j++;            ///优化next数组            /*                if(str[i]!=sr[j])next[i]=j;                else next[i]=next[j];            */            ///非优化next数组            next[i] = j;        }        else j = next[j];    }    for(int i = 0;i<=len;i++)cout<<" "<<next[i];    cout<<endl;}int KMP(){    getnext();    int  i = 0,j = 0;    int lens = strlen(s);    int len = strlen(str);    ///判断str是否在s中出现过    while(i<lens&&j<len){        if(j==-1||s[i]==str[j]){            i++;            j++;        }        else j = next[j];    }    if(j>=len)return i-len;    else return -1;    ///计算可重叠str在s中出现的次数    /*        int num = 0;        while(i<lens){            if(j==-1||s[i]==str[j]){                i++;                j++;            }            else j = next[j];            if(j>=len){                num++;                j = next[j];            }        }        return num;    */}int main(){    cin>>s>>str;    cout<<KMP()<<endl;    return 0;}

///扩展:
/*
          (1)给定一个字符串,问最多是多少个相同子串不重叠连接构成。
    KMP的next数组应用。这里主要是如何判断是否有这样的子串,和子串的个数。
    若为abababa,显然除其本身外,没有子串满足条件。而分析其next数组,next[7] = 5,next[5] = 3,next[3] = 1即str[2..7]可由ba子串连接构成,那怎么否定这样的情况呢?很简单,若该子串满足条件,则len%sublen必为0。sunlen可由上面的分析得到为len-next[len]。
    因为子串是首尾相接,len/sublen即为substr的个数。
    若L%(L-next[L])==0,n = L/(L-next[L]),else n = 1
          (2)大意:给出一个字符串A,求A有多少个前缀同时也是后缀,从小到大
    输出这些前缀的长 度。
    *分析:KMP
    对于长度为len的字符串,由next的定义知:
    A[0]A[1]...A[next[len]-1]=A[len-next[len]]...A[len-1]此时
    A[0]A[1]...A[next[len]-1]为一个符合条件的前缀
    有A[0]A[1]....A[next[next[len]]-1] = A[len-next[next[len]
    - next[next[len]]]...A[next[len]-1],故A[0]A[1]....A[next[next[len]]-1]
    也是一个符合条件的前缀故从len=>next[len]=>next[next[len]] ....=>直到
    某个next[]为0均为合法答案,注意当首位单词相同时,也为答案。
*/