后缀数组
来源:互联网 发布:电脑软件制作教程 编辑:程序博客网 时间:2024/05/18 03:31
后缀数组的模板是非常容易写错的
(注释内容都是需要注意的地方)
看好题目要求,字符集是小写字母/全字符,写法是有一点不一样的
//这里写代码片#include<cstdio>#include<cstring>#include<iostream>using namespace std;const int N=1000005;int sa[N],w1[N],w2[N],cc[200],hei[N],rak[N];int len;char s[N];int cmp(int *y,int a,int b,int k){ int ra1=y[a]; int rb1=y[b]; int ra2=a+k>=len ? -1:y[a+k]; int rb2=b+k>=len ? -1:y[b+k]; return ra1==rb1&&ra2==rb2;}void make_sa(){ int *x=w1,*y=w2; int i,m,p; m=128; //字符集 for (i=0;i<m;i++) cc[i]=0; for (i=0;i<len;i++) cc[x[i]=s[i]]++; for (i=1;i<m;i++) cc[i]+=cc[i-1]; for (i=len-1;i>=1;i--) sa[--cc[x[i]]]=i; for (int k=1;k<=len;k<<=1) { p=0; for (i=len-k;i<len;i++) y[p++]=i; //len-k ~ len for (i=0;i<len;i++) if (sa[i]>=k) y[p++]=sa[i]-k; //sa[i]>=k for (i=0;i<m;i++) cc[i]=0; for (i=0;i<len;i++) cc[x[y[i]]]++; for (i=1;i<m;i++) cc[i]+=cc[i-1]; for (i=len-1;i>=0;i--) sa[--cc[x[y[i]]]]=y[i]; swap(x,y); x[sa[0]]=0; p=1; //x[sa[0]] for (i=1;i<len;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],k) ? p-1:p++; //p-1:p++ if (p>=len) break; m=p; }}void make_hei(){ int k=0; for (int i=0;i<len;i++) rak[sa[i]]=i; hei[0]=0; for (int i=0;i<len;i++) { if (!rak[i]) continue; //!rak[i] int j=sa[rak[i]-1]; //sa[rak[i]-1] if (k) k--; while (s[i+k]==s[j+k]&&i+k<len&&j+k<len) k++; hei[rak[i]]=k; }}int main(){ scanf("%s",s); len=strlen(s); make_sa(); make_hei(); for (int i=0;i<len;i++) printf("%d ",sa[i]+1); return 0;}
阅读全文
0 0