SPOJ 694 Distinct Substrings 后缀数组

来源:互联网 发布:利用淘宝规则赚钱 编辑:程序博客网 时间:2024/06/06 09:17

题目链接:http://www.spoj.com/problems/DISUBSTR/

题意:求一个字符串中有多少个不相同的字串
每一个子串都是字符串的一个后缀的前缀,这样问题就变为N个字符串有多少个不相同的前缀
按照sa[1],sa[2]….,sa[N]的顺序来考虑后缀
加入sa[i]时 一定有height[i]个前缀已经在前面被计数过
二期sa[i]的长度大于height[i]的前缀在前面没有被计数过,如果被计数过那么,存在一个后缀sa[k],sa[k]与sa[i]的lcp一定大于等于height[i]。但是有height数组的性质,LCP(sa[k],sa[i])等于height[k]~height[i]的最小值小于等于height[i],所以矛盾。以上可知,在加入后缀sa[i]时我们得到的新的前缀数量为sa[i] - height[i]

代码:

#include <cstdio>#include <cstring>#define sf scanf#define pf printfusing namespace std;const int maxn = 1000 + 5;int wa[maxn],wb[maxn],wv[maxn],ws[maxn];int cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int *r,int *sa,int n,int m){    int i,j,p,*x=wa,*y=wb,*t;    for(i=0;i<m;i++) ws[i]=0;    for(i=0;i<n;i++) ws[x[i]=r[i]]++;    for(i=1;i<m;i++) ws[i]+=ws[i-1];    for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;    for(j=1,p=1;p<n;j*=2,m=p)    {        for(p=0,i=n-j;i<n;i++) y[p++]=i;        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;        for(i=0;i<n;i++) wv[i]=x[y[i]];        for(i=0;i<m;i++) ws[i]=0;        for(i=0;i<n;i++) ws[wv[i]]++;        for(i=1;i<m;i++) ws[i]+=ws[i-1];        for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;    }    return;}int rank[maxn],height[maxn];void calheight(int *r,int *sa,int n){    int i,j,k=0;    for(i=1;i<=n;i++) rank[sa[i]]=i;    for(i=0;i<n;height[rank[i++]]=k)    for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);    return;}int sa[maxn],rr[maxn];char s[maxn];int main(){    int T;    sf("%d",&T);    while( T-- ){        sf("%s",s);        int len = strlen(s);        for(int i = 0;i <= len;++i) rr[i] = s[i];        da(rr,sa,len + 1,256);        calheight(rr,sa,len);        int cnt = len * (len + 1) / 2;        for(int i = 1;i <= len;++i) cnt -= height[i];        pf("%d\n",cnt);    }    return  0;}
0 0
原创粉丝点击