SPOJ 694 / SPOJ DISUBSTR Distinct Substrings【后缀数组】不相同的子串的个数

来源:互联网 发布:淘宝联盟是骗局吗 编辑:程序博客网 时间:2024/05/24 05:03

Description

Given a string, we need to find the total number of its distinct substrings.

Input

T- number of test cases. T<=20;
Each test case consists of one string, whose length is <= 1000

Output

For each test case output one number saying the number of distinct substrings.

Example

Sample Input:
2
CCCCC
ABABA

Sample Output:
5
9

Explanation for the testcase with string ABABA: 
len=1 : A,B
len=2 : AB,BA
len=3 : ABA,BAB
len=4 : ABAB,BABA
len=5 : ABABA
Thus, total number of distinct substrings is 9.

Hint

Added by:PrasannaDate:2006-01-13Time limit:0.159sSource limit:50000BMemory limit:1536MBCluster:Cube (Intel G860)Languages:All except: NODEJS PERL 6 VB.netResource:ByteCode '06


/*    SPOJ DISUBSTR/SPOJ 694    题意:给定一个字符串,求不相同子串个数.    类型:后缀数组    分析:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间          的前缀个数.          当n=5,字符串为"ABABA"          height    string     sa      前缀                    个数                    A          4       A                        1            1   <                    ABA        2       A AB ABA                 3            3   <                    ABABA      0       A AB ABA ABAB ABABA      5            0   <                    BA         3       B BA                     2            2   <                    BABA       1       B BA BAB BABA            4          把全部前缀个数加起来 - 前缀相同部分height = 答案          全部前缀个数可以写成(1+n)*n/2*/#include<iostream>#include<cstdio>#include<algorithm>#include<cstring>using namespace std;const int MAXN=1010;int sa[MAXN];//sa[i]表示排在第i名的下标是多少,取值范围[1~n]int rank[MAXN];//rank[i]表示以i为下标的后缀排在第几,取值范围[0~n-1]int height[MAXN];//height[i]表示排在i-1名与排在第i名的最长公共前缀,取值范围[2~n]int t1[MAXN],t2[MAXN],c[MAXN];//求sa数组需要的中间变量,不需要赋值初始化int s[MAXN];//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m.//除s[n]为0 外的所有s[i]都大于0;函数结束以后结果放在sa数组中void build_sa(int s[],int n,int m) //得到SA数组{    int i,j,p,*x=t1,*y=t2;    for(i=0;i<m;i++)c[i]=0;    for(i=0;i<n;i++)c[x[i]=s[i]]++;    for(i=1;i<m;i++)c[i]+=c[i-1];    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;    for(j=1;j<=n;j<<=1){        p=0;        for(i=n-j;i<n;i++)y[p++]=i;        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;        for(i=0;i<m;i++)c[i]=0;        for(i=0;i<n;i++)c[x[y[i]]]++;        for(i=1;i<m;i++)c[i]+=c[i-1];        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];        swap(x,y);        p=1;x[sa[0]]=0;        for(i=1;i<n;i++)            x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;        if(p>=n)break;        m=p;    }}void getHeight(int s[],int n){ //得到height数组    int i,j,k=0;    for(i=0;i<=n;i++)rank[sa[i]]=i;    for(i=0;i<n;i++){        if(k)k--;        j=sa[rank[i]-1];        while(s[i+k]==s[j+k])k++;        height[rank[i]]=k;    }}int main(){    //freopen("F:\\input.txt","r",stdin);    int n,t;    char ss[MAXN];    scanf("%d",&t);    while(t--){        scanf("%s",ss);        n=strlen(ss);        int Max=-1;        for(int i=0;i<n;i++){            s[i]=ss[i];            if(s[i]>Max)Max=s[i];        }        s[n]=0;        build_sa(s,n+1,Max+1);        getHeight(s,n);        int ans=(1+n)*n/2;        for(int i=2;i<=n;i++){            ans-=height[i];        }        printf("%d\n",ans);    }    return 0;}


1 0
原创粉丝点击