后缀数组自学

来源:互联网 发布:阿里巴巴农村淘宝图片 编辑:程序博客网 时间:2024/06/05 20:12

sa[i],表示在所有后缀中,排在第i位的后缀是哪个后缀。
rank[i],表示以第i个字母为结尾的后缀在所有后缀中排第rank[i]个。
height 数组,表示height[i]=(suffix(SA[i-1])和suffix(SA[i])的最长公共前缀),也就是排名相邻的两个后缀的最长公共前缀的长度 。

#include<iostream>#include <cstdio>#include <iostream>#include <cstdlib>#include <algorithm>#include <cstring>using namespace std;const int maxn=200010;int wa[maxn],wb[maxn],wsf[maxn],wv[maxn];int rank[maxn],height[maxn],s[maxn],sa[maxn];void make_sa(int n,int m){    int i,j,p,*x=wa,*y=wb;    for(i=0;i<m;i++)  wsf[i]=0;    for(i=0;i<n;i++)  wsf[x[i]=s[i]]++;    for(i=1;i<m;i++)  wsf[i]+=wsf[i-1];    for(i=n-1;i>=0;i--)  sa[--wsf[x[i]]]=i;    for(p=1,j=1;p<n;j<<=1,m=p){        for(p=0,i=n-j;i<n;i++)  y[p++]=i;        for(i=0;i<n;i++) {            if(sa[i]>=j)  y[p++]=sa[i]-j;        }        for(i=0;i<n;i++)  wv[i]=x[y[i]];        for(i=0;i<m;i++)  wsf[i]=0;        for(i=0;i<n;i++)  wsf[wv[i]]++;        for(i=1;i<m;i++)  wsf[i]+=wsf[i-1];        for(i=n-1;i>=0;i--)  sa[--wsf[wv[i]]]=y[i];        swap (x,y);        x[sa[0]]=0;        for(p=1,i=1;i<n;i++){            x[sa[i]]=(y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]) ? p-1 : p++;        }    }}void make_height(int n){    int i,j,k=0;    for(i=1;i<=n;i++) rank[sa[i]]=i;    for(i=0;i<n;i++){        if(k)k--;        else k=0;        j=sa[rank[i]-1];        while(s[i+k]==s[j+k]) k++;        height[rank[i]]=k;    }}int main (){    make_sa (srelen (s)+1,s中不同字符种类);    make_height (strlen (s));}
0 0