后缀数组 模板

来源:互联网 发布:java微信 api好友列表 编辑:程序博客网 时间:2024/05/21 22:36

倍增算法

#include <cstdio>#include <cstring>/* * da函数中的m要小于SIZE; * m可以开很大,前提是SIZE 也要开很大 */int const SIZE = 1000;//分隔符,多串连接时需要用到,第0个为结束符,肯定用到char const DELIMETER[] = {'#'};int const DELIMETER_CNT = 1;//字母表的字母个数int const ALPHA_SIZE = DELIMETER_CNT + 26;//char转intinline int tr(char ch){    return ch - 'a' + 1;}//辅助数组,以下划线开头int _wa[SIZE],_wb[SIZE],_wv[SIZE],_ws[SIZE];//辅助函数int _cmp(int const r[],int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}//求后缀数组的倍增算法//r: 源数组,且除r[n-1]外,其余r[i]>0//n: r的长度//m: r中的元素取值的上界,即任意r[i]<m//sa:后缀数组,即结果void da(int const r[],int n,int m,int sa[]){    int i,j,p,*x=_wa,*y=_wb,*t;    for(i=0;i<m;i++) _ws[i] = 0;    for(i=0;i<n;i++) _ws[x[i] = r[i]]++;    for(i=1;i<m;i++) _ws[i] += _ws[i-1];    for(i=n-1;i>=0;i--) sa[--_ws[x[i]]]=i;    for(j=1,p=1;p<n;j*=2,m=p){        for(p=0,i=n-j;i<n;i++) y[p++]=i;        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;        for(i=0;i<n;i++) _wv[i]=x[y[i]];        for(i=0;i<m;i++) _ws[i]=0;        for(i=0;i<n;i++) _ws[_wv[i]]++;        for(i=1;i<m;i++) _ws[i] += _ws[i-1];        for(i=n-1;i>=0;i--) sa[--_ws[_wv[i]]] = y[i];        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)            x[sa[i]]=_cmp(y,sa[i-1],sa[i],j)?p-1:p++;    }    return;}//计算rank数组与height数组//r:  源数组//sa: 后缀数组//n:  源数组的长度//rank: rank数组,即计算结果//height: height数组,即计算结果void calHeight(int const r[],int const sa[],int n,int rank[],int height[]){    int i,j,k=0;    for(i=1;i<n;i++) rank[sa[i]]=i;    for(i=0;i<n-1;height[rank[i++]]=k)    for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);    return;}void dispArray(int const a[],int n){    for(int i=0;i<n;++i)printf("%d ",a[i]);    printf("\n");}int R[SIZE],SA[SIZE];int Rank[SIZE],Height[SIZE];char A[] = "aabaaaab";int main(){    int n = 0;    for(;A[n];++n) R[n] = tr(A[n]);    R[n++] = 0;    da(R,n,ALPHA_SIZE,SA);  //注意n是长度    calHeight(R,SA,n,Rank,Height); // 注意n是长度 跟上面一致    dispArray(R,n);    dispArray(SA,n);    dispArray(Rank,n);    dispArray(Height,n);    return 0;}

DC3 算法


#include <cstdio>#include <cstring>int const SIZE = 1000;//分隔符,多串连接时需要用到,第0个为结束符,肯定用到char const DELIMETER[] = {'#'};int const DELIMETER_CNT = 1;//字母表的字母个数int const ALPHA_SIZE = DELIMETER_CNT + 26;//char转intinline int tr(char ch){    return ch - 'a' + 1;}//辅助宏,以下划线开头#define _F(x) ((x)/3+((x)%3==1?0:tb))#define _G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)//辅助数组,以下划线开头int _wa[SIZE],_wb[SIZE],_wv[SIZE],_ws[SIZE];//辅助函数int _c0(int const r[],int a,int b){    return r[a] == r[b]        && r[a+1] == r[b+1]        && r[a+2] == r[b+2];}int _c12(int k,int *r,int a,int b){    if( 2 == k ) return r[a]<r[b] || ( r[a]==r[b]&&_c12(1,r,a+1,b+1) );    return r[a]<r[b] || ( r[a]==r[b]&&_wv[a+1]<_wv[b+1] );}void _sort(int const r[],int *a,int *b,int n,int m){    int i;    for(i=0;i<n;i++) _wv[i] = r[a[i]];    for(i=0;i<m;i++) _ws[i] = 0;    for(i=0;i<n;i++) _ws[_wv[i]]++;    for(i=1;i<m;i++) _ws[i] += _ws[i-1];    for(i=n-1;i>=0;i--) b[--_ws[_wv[i]]] = a[i];    return;}//后缀数组的dc3算法,使用此dc3算法一定要保证r与sa的最大长度不小于3倍原长度//r: 源数组,且除r[n-1]外,其余r[i]>0//n: r的长度//m: r中的元素取值的上界,即任意r[i]<m//sa:后缀数组,即结果void dc3(int r[],int n,int m,int sa[]){    int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;    r[n] = r[n+1] = 0;    for(i=0;i<n;i++) if(i%3!=0) _wa[tbc++]=i;    _sort(r+2,_wa,_wb,tbc,m);    _sort(r+1,_wb,_wa,tbc,m);    _sort(r,_wa,_wb,tbc,m);    for(p=1,rn[_F(_wb[0])]=0,i=1;i<tbc;i++)        rn[_F(_wb[i])] = _c0(r,_wb[i-1],_wb[i])?p-1:p++;    if(p<tbc) dc3(rn,tbc,p,san);    else for(i=0;i<tbc;i++) san[rn[i]]=i;    for(i=0;i<tbc;i++) if(san[i]<tb) _wb[ta++] = san[i]*3;    if(n%3==1) _wb[ta++]=n-1;    _sort(r,_wb,_wa,ta,m);    for(i=0;i<tbc;i++) _wv[_wb[i] = _G(san[i])] = i;    for(i=0,j=0,p=0;i<ta&&j<tbc;p++)        sa[p] = _c12(_wb[j]%3,r,_wa[i],_wb[j]) ? _wa[i++] : _wb[j++];    for(;i<ta;p++) sa[p] = _wa[i++];    for(;j<tbc;p++) sa[p] = _wb[j++];    return;}//计算rank数组与height数组//r:  源数组//sa: 后缀数组//n:  源数组的长度//rank: rank数组,即计算结果//height: height数组,即计算结果void calHeight(int const r[],int const sa[],int n,int rank[],int height[]){    int i,j,k=0;    for(i=1;i<n;i++) rank[sa[i]]=i;    for(i=0;i<n-1;height[rank[i++]]=k)    for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);    return;}void dispArray(int const a[],int n){    for(int i=0;i<n;++i)printf("%d ",a[i]);    printf("\n");}int R[SIZE*3],SA[SIZE*3];//3倍长度!!!int Rank[SIZE],Height[SIZE];char A[] = "aabaaaab";int main(){    int n = 0;    for(;A[n];++n) R[n] = tr(A[n]);    R[n++] = 0;    dc3(R,n,ALPHA_SIZE,SA); // 注意n是长度    calHeight(R,SA,n,Rank,Height); //注意n是长度跟上面保持一致    dispArray(R,n);    dispArray(SA,n);    dispArray(Rank,n);    dispArray(Height,n);    return 0;}


0 0
原创粉丝点击