POJ 2774 Long Long Message (后缀数组求最长公共子串)

来源:互联网 发布:金润软件成都 编辑:程序博客网 时间:2024/04/30 09:39

http://poj.org/problem?id=2774

纪念下我后缀数组第二题,也是自己不看题解A的后缀数组第一题

题意就是给你两个很长的字符串之后求最长公共子串的长度。

套用的是那篇后缀数组论文里的模板,之后因为要求两个串的最长公共子串,要把两个串连在一起,中间用一个不会出现的字符链接。我是把两个串转换成 s[i]-‘a’+1的形式之后以0为连接符号。

之后套模板求出SA 和 height数组。之后因为height数组的性质,求出最长公共子串的长度。这里的最长长度不是height数组的最大值,因为很可能出现同一串里的公共子串比两个串的公共子串要长
比如:
aaaaaaaaaaaaaaaaaaaaimiss
imiss

这样就是一个例子,判断的时候要注意一下保证这两个sa[i] 和sa[i-1]是在两个不同的字符串里就行具体看代码

#include <stdio.h>#include <algorithm>#include <iostream>#define maxs 1000040#include <string.h>using namespace std;int s[maxs];char input1[maxs],input2[maxs];int sa[maxs],rank[maxs],height[maxs];int wa[maxs],wb[maxs],wv[maxs],wd[maxs];int cmp(int *r,int a,int b,int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void get_sa(int *r,int n,int m){    int i,j,p,*x=wa,*y=wb,*t=NULL;    for(i=0;    i<m;    i++) wd[i]=0;    for(i=0;    i<n;    i++) wd[x[i]=r[i]]++;    for(i=1;    i<m;    i++) wd[i] +=wd[i-1];    for(i=n-1;  i>=0;   i--) sa[--wd[x[i]]]=i;    for(j=1,p=1;p<n;j*=2,m=p){        for(p=0,i=n-j;i<n;i++) y[p++] = i;        for(i=0;i<n;i++) if(sa[i] >= j)  y[p++] = sa[i] -j;        for(i=0;i<n;i++) wv[i] = x[y[i]];        for(i=0;i<m;i++) wd[i] = 0;        for(i=0;i<n;i++) wd[wv[i]]++;        for(i=1;i<m;i++) wd[i]+=wd[i-1];        for(i=n-1;i>=0;i--) sa[--wd[wv[i]]] = y[i];        for(swap(x,y),p=1,x[sa[0]]=0,i=1; i<n; i++){                        x[sa[i]] = cmp(y,sa[i-1],sa[i],j) ? p-1:p++;        }    }  //  printf("This is SA\n");   /* for(int i=0;i<=n;i++)    {        printf("SA[%d] is %d\n",i,sa[i]);    }*/}void build_height(int *r,int n){    int i,j,k=0;    for(i=1;i<=n;i++) rank[sa[i]] =i;    for(i=0;i<n;height[rank[i++]] =k) {        for(k ? k-- : 0,j=sa[rank[i]-1]; r[i+k]==r[j+k];k++);    }   // printf("This is Height\n\n");    /*for(int i=0;i<=n;i++)    {        printf("h[%d] is %d\n",i,height[i]);    }*/}int abs(int aa){    if(aa>0)        return aa;    else return -aa;}int main(){    while(~scanf("%s",input1))    {        scanf("%s",input2);        memset(sa,0,sizeof(sa));        memset(height,0,sizeof(height));        memset(rank,0,sizeof(rank));        memset(s,0,sizeof(s));        int len1=strlen(input1);        int len2=strlen(input2);        int id,cnt=0;        for(int i=0;i<len2;i++)        {            id=input2[i]-'a'+1;            s[cnt++]=id;        }        s[cnt++]=0;//这里为连接字符      //  printf("len1 is %d This time cnt is %d\n",len1,cnt);        for(int i=0;i<len1;i++)        {            id=input1[i]-'a'+1;            s[cnt++]=id;        }        s[cnt]=0;//模板上说的这里为0        get_sa(s,cnt+1,40);//套用格式        build_height(s,cnt);//同理        int ans=0;        for(int i=0;i<cnt;i++)        {            if(height[i]>ans)            {                if((sa[i]<len2&&sa[i-1]>len2)||(sa[i]>len2&&sa[i-1]<len2))//判断两个后缀是否在不同的字符串中。                   {                        ans=height[i];                       // printf("i is %d  height[i] is %d SA[i] is %d\n",i,height[i],sa[height[i]]);                   }            }        }        printf("%d\n",ans);    }    return 0;}/*yeshowmuchiloveyoumydearmotherreallyicannotbelieveityeaphowmuchiloveyoumydearmotherhhhhhhhhhhhhimissyoujujumenimissyoujujumenwowowowwowowowoshinibabashinibaba*/
0 0
原创粉丝点击