POJ 3450 Corporate Identity(后缀数组+二分)

来源:互联网 发布:大数据需要学什么语言 编辑:程序博客网 时间:2024/05/29 18:33

Description
求n个字符串的最长公共子串长度
Input
多组用例,每组用例第一行为字符串个数n(2<=n<=4000),之后n行每行一个字符串,每个串串长不超过200,以n=0结束输入
Output
对于每组用例,输出这n个字符串的最长公共子串长度
Sample Input
3
aabbaabb
abbababb
bbbbbabb
2
xyz
abc
0
Sample Output
abb
IDENTITY LOST
Solution
类似两个串最长公共前缀的做法,将n个串连在一次(相邻串之间用隔离字符隔离开以避免匹配越界),用id数组记录每个字符所属串的编号,二分最长长度,对于每个二分值k,将height数组分组,将每一组的id[sa[i]]值标记,如果被标记的id值有n个说明该组符合条件,记录答案,如果每一组都不符合条件则这个k不符合条件
Code

#include<cstdio>#include<iostream>#include<cstring>#include<algorithm>using namespace std;#define maxn 888888int t1[maxn],t2[maxn],c[maxn],sa[maxn],rank[maxn],height[maxn];bool cmp(int *r,int a,int b,int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int str[],int n,int m){    n++;    int i,j,p,*x=t1,*y=t2;    for(i=0;i<m;i++)c[i]=0;    for(i=0;i<n;i++)c[x[i]=str[i]]++;    for(i=1;i<m;i++)c[i]+=c[i-1];    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;    for(j=1;j<=n;j<<=1)    {        p=0;        for(i=n-j;i<n;i++)y[p++]=i;        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;        for(i=0;i<m;i++)c[i]=0;        for(i=0;i<n;i++)c[x[y[i]]]++;        for(i=1;i<m;i++)c[i]+=c[i-1];        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];        swap(x,y);        p=1;x[sa[0]]=0;        for(i=1;i<n;i++)        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;        if(p>=n)break;        m=p;    }    int k=0;    n--;    for(i=0;i<=n;i++)rank[sa[i]]=i;        for(i=0;i<n;i++)        {            if(k)k--;            j=sa[rank[i]-1];            while(str[i+k]==str[j+k])k++;            height[rank[i]]=k;        }}int n,res,a[maxn],id[maxn],vis[4444];char s[222],ans[222];int check(int k){    int cnt=0;    memset(vis,0,sizeof(vis));    for(int i=2;i<=res;i++)    {        if(height[i]<k)        {            memset(vis,0,sizeof(vis));            cnt=0;            continue;        }        if(!vis[id[sa[i-1]]])            vis[id[sa[i-1]]]=1,cnt++;        if(!vis[id[sa[i]]])            vis[id[sa[i]]]=1,cnt++;        if(cnt==n)        {            for(int j=0;j<k;j++)                ans[j]=a[sa[i]+j];            ans[k]='\0';            return 1;        }    }    return 0;}int main(){    while(~scanf("%d",&n),n)    {        res=0;        for(int i=0;i<n;i++)        {            scanf("%s",s);            int len=strlen(s);            for(int j=0;j<len;j++)                a[res]=s[j],id[res++]=i;            a[res]='#'+i;            id[res++]='#'+i;        }        a[res]=0;        da(a,res,5000);        int l=1,r=strlen(s),flag=0;        while(l<=r)         {            int mid=(l+r)>>1;            if(check(mid))            {                flag=1;                l=mid+1;            }            else r=mid-1;        }        if(flag)printf("%s\n",ans);        else printf("IDENTITY LOST\n");    }    return 0;}
0 0
原创粉丝点击