poj_2774_Long Long Message(后缀数组)

来源:互联网 发布:海康威视网络摄像机ip 编辑:程序博客网 时间:2024/05/15 13:56

题型:字符串


题意:求两个串的最长公共子串


分析:

由于字符串长度为10^5,所以不同的dp做法是不可行的。

采用后缀数组,用后缀数组处理字符串,可以得到两个数组,一个是sa[],一个是height[]。

字符串从后往前进行切割,然后按照字典序排序。

sa[i]是第i个后缀字符串在原串中的起始位置。

height[i]是第i个后缀字符串与第i-1个后缀字符串的相同前缀长度。

例如:abcabc        其后缀字符串为:

c

bc

abc

cabc

bcabc

abcabc

字典序排序后

abc                        sa[0] = 3              height[0] = 0;

abcabc                  sa[1] = 0              height[1] = 3;

bc                          sa[2] = 4              height[2] = 0;

bcabc                    sa[3] = 1              height[3] = 2;

c                            sa[4] = 5              height[4] = 0;

cabc                      sa[5] = 2              height[5] = 1;

有了这俩个数组的信息,就可以解决许多问题。


对于本题,先将两个字符串拼接,中间用‘$’隔开。

然后后缀数组处理,遍历height,如果sa[i]与sa[i-1]分别在‘$’的两端,那么就可以尝试更新ans。


代码:

#include<iostream>#include<cstring>#include<cmath>#include<cstdio>#define mt(a,b) memset(a,b,sizeof(a))using namespace std;const int M = 200010;class Suffix_Array {  //后缀数组public:    int n,m,str[M],sa[M],height[M],wa[M],wb[M],wv[M],ws[M],Rank[M];    int getsa(int id) {        return sa[id];    }    int getheight(int id) {        return height[id];    }    int getrank(int id) {        return Rank[id];    }    bool cmp(int r[],int a,int b,int len) {        return r[a]==r[b]&&r[a+len]==r[b+len];    }    void build(char s[],int len,int cl) {        n=len;        m=cl;        for(int i=0; i<=len; i++) str[i]=s[i];        str[len]=0;        buildsa();        buildheight();    }    void buildsa() {        int i,j,k,p,*x=wa,*y=wb,*t;        for(i=0; i<m; i++) ws[i]=0;        for(i=0; i<n; i++) ws[x[i]=str[i]]++;        for(i=1; i<m; i++) ws[i]+=ws[i-1];        for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i;        for(j=p=1; p<n; j<<=1,m=p) {            for(p=0,i=n-j; i<n; i++) y[p++]=i;            for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;            for(i=0; i<m; i++) ws[i]=0;            for(i=0; i<n; i++) ws[wv[i]=x[y[i]]]++;            for(i=1; i<m; i++) ws[i]+=ws[i-1];            for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i];            for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1; i<n; i++)                x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;        }    }    void buildheight() {        int i,j,k;        for(i=1; i<=n-1; i++) Rank[sa[i]]=i;        for(i=k=0; i<n-1; height[Rank[i++]]=k)            for(k?k--:0,j=sa[Rank[i]-1]; str[i+k]==str[j+k]; k++);    }} gx;char a[M],b[M];int main() {    while(~scanf("%s%s",a,b)) {        int la = strlen(a);        int lb = strlen(b);        a[la] = '$';        la++;        a[la] = 0;        strcat(a,b);        int len = la+lb;        la--;//        printf("%d\n",len);        gx.build(a,len,256);        int maxn = 0;        for(int i=1; i<len; i++) {            int t = gx.getsa(i);            int s = gx.getsa(i-1);            if((t<la && s>la)||(s<la && t>la)) {                maxn = max(maxn,gx.getheight(i));            }        }        printf("%d\n",maxn);    }    return 0;}


0 0
原创粉丝点击