HDU 5769 Substring(后缀数组)

来源:互联网 发布:北京恩知教育 编辑:程序博客网 时间:2024/05/17 07:00

Description
给出一个字符串s以及一个字符x,求s的所有的含字符x的不同子串数量
Input
第一行一整数T表示用例组数,每组用例输入一个字符x以及一个字符串s
(x是一个小写字母,s全部由小写字母组成,T<=30,|s|<=10^5)
Output
对于每组用例,输出s的所有含字符x的不用子串数量
Sample Input
2
a
abc
b
bbb
Sample Output
Case #1: 3
Case #2: 3
Solution
首先对于s中第i个字符,用back[i]记录i右边第一个字符x出现的位置,然后对s做一遍后缀数组,答案即为n*(n+1)/2-sum{max(back[sa[i]],height[i]),i=1,2,…,n}
即字典序相邻的两个后缀,其前缀均是s的一个子串,但不合法的子串有两种,一种是不包含字符x的(即为back[sa[i]]),一部分是包含字符x但重复的(即为height[i])
Code

#include<cstdio>#include<iostream>#include<cstring>#include<algorithm>using namespace std;typedef long long ll;#define maxn 111111int t1[maxn],t2[maxn],c[maxn],sa[maxn],Rank[maxn],height[maxn];bool cmp(int *r,int a,int b,int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int str[],int n,int m){    n++;    int i,j,p,*x=t1,*y=t2;    for(i=0;i<m;i++)c[i]=0;    for(i=0;i<n;i++)c[x[i]=str[i]]++;    for(i=1;i<m;i++)c[i]+=c[i-1];    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;    for(j=1;j<=n;j<<=1)    {        p=0;        for(i=n-j;i<n;i++)y[p++]=i;        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;        for(i=0;i<m;i++)c[i]=0;        for(i=0;i<n;i++)c[x[y[i]]]++;        for(i=1;i<m;i++)c[i]+=c[i-1];        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];        swap(x,y);        p=1;x[sa[0]]=0;        for(i=1;i<n;i++)        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;        if(p>=n)break;        m=p;    }    int k=0;    n--;    for(i=0;i<=n;i++)Rank[sa[i]]=i;        for(i=0;i<n;i++)        {            if(k)k--;            j=sa[Rank[i]-1];            while(str[i+k]==str[j+k])k++;            height[Rank[i]]=k;        }}int T,n,m,l,r,a[maxn],pos[maxn],back[maxn];char s[maxn],x[3];int main(){    int Case=1;    scanf("%d",&T);    while(T--)    {        scanf("%s%s",x,s);        n=strlen(s);        for(int i=0;i<n;i++)a[i]=s[i];        a[n]=0;        da(a,n,333);        int res=0;        for(int i=0;i<n;i++)            if(s[i]==x[0])pos[res++]=i;        ll ans=1ll*n*(n+1)/2;         for(int i=0,j=0;i<n;i++)        {            if(s[i]==x[0])back[i]=0,j++;            else            {                if(j<res)back[i]=pos[j]-i;                else back[i]=n-i;            }        }        for(int i=1;i<=n;i++)ans-=max(back[sa[i]],height[i]);         printf("Case #%d: %I64d\n",Case++,ans);    }    return 0;}
0 0
原创粉丝点击