后缀数组模板

来源:互联网 发布:易语言文字游戏源码 编辑:程序博客网 时间:2024/06/18 13:15
bool cmp(int *y,int a,int b,int l){    return y[a]==y[b]&&y[a+l]==y[b+l];}void pd(int n,int m){    int i,j,p,*x=prnk,*y=psa;    for(i=0;i<m;++i)bucket[i]=0;    for(i=0;i<n;++i)++bucket[x[i]=s[i]];    for(i=1;i<m;++i)bucket[i]+=bucket[i-1];    for(i=n-1;i>=0;--i)sa[--bucket[x[i]]]=i;    for(j=1,p=1;p<n;j*=2,m=p)    {        for(i=n-j,p=0;i<n;++i)y[p++]=i;        for(i=0;i<n;++i)if(sa[i]>=j)y[p++]=sa[i]-j;        for(i=0;i<n;++i)pos[i]=x[y[i]];        for(i=0;i<m;++i)bucket[i]=0;        for(i=0;i<n;++i)++bucket[pos[i]];        for(i=1;i<m;++i)bucket[i]+=bucket[i-1];        for(i=n-1;i>=0;--i)sa[--bucket[pos[i]]]=y[i];        for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;++i)            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;    }}void geth(int n){    for(int i=1;i<=n;++i)rnk[sa[i]]=i;    for(int i=0,j,k=0;i<n;height[rnk[i++]]=k)        for(k?--k:0,j=sa[rnk[i]-1];s[i+k]==s[j+k];++k);}

几个经典例题
可重叠最长相同子串——height的最大值。
不可重叠最长相同子串——二分答案,对答案进行分组,每一组内的height值最小必须比答案大,并且还要不重叠(SA数组的差大于答案),如果有这样的组说明有这个答案。
不相同的子串的个数——考虑每个后缀对答案的贡献,不考虑重复有len-sa[i]个,然而后缀还要和其他前缀有相同前缀,于是还要-height[i]
最长回文子串——等下写manacher算法,但是后缀数组也可做。把原字符串翻转一下加到后面,然后求height。变成不可重叠最长相同子串。还要注意一点就是子串不能跨越中线,这个可以中间加一个没出现过的字符。
最多重复次数——这个本来是用kmp做的,但是后缀数组也可做。求所有height[rank[i]]到height[rank[1]]的最小值。然后枚举重复字符串的长度l,l必须是len的因子。如果heightmin[rank[l]+1]==len-l那说明找到了重复子串。
还有几个例题,等我完全弄明白再补。。

0 0
原创粉丝点击