HDU 5008 Boring String Problem 后缀数组 RMQ

来源:互联网 发布:人工智能技术与生活 编辑:程序博客网 时间:2024/04/27 04:40

题意:给出一个字符串,求出第k小的子串,并求出字符串的起止位置,如果有多个重复的子串,求出位置最靠左的子串。

思路:比赛时,想到了要用后缀数组,但是没想到如何做。

          其实,因为子串是后缀的前缀,后缀数组对后缀排序的同时,也对子串进行了排序。对于每一个sa[i],会产生不同的n - sa[i] - height[i]个子串,这些子串也是排好序的。

          这样,我们就我们就可以二分求出这些子串中的第k小的子串。

          但是,因为我们没有考虑LCP,这样会导致对于相同的第k小,有些位置更靠左,且存在于公共前缀中的子串没有考虑到,这样,我们还需要对这些字符串进行考虑。

          那如何求出最靠左的子串呢?首先要注意,前面找到的子串是在sa数组中,最先出现的子串,但不是在整个字符串最先出现的子串。我们从找到该子串的sa的位置开始,向后搜索,如果和该位置的LCP不小于找到子串的长度,那说明是可能的位置。因为,对于给定位置的LCP,他的长度是不增的,我们可以二分去找到整个可能的范围。最后在这个区间求一次RMQ就是最左的位置。


代码来自:http://blog.csdn.net/gauss_acm/article/details/39279545

#include<cstdio>#include<iostream>#include<cstring>#define Maxn 100010#define ll long longusing namespace std;char s[Maxn];int r[Maxn],sa[Maxn],rk[Maxn],height[Maxn];int wa[Maxn],wb[Maxn],rs[Maxn],wv[Maxn];ll a,b,k,v;int cmp(int *r,int a,int b,int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int n,int m){    int i,j,p,*x=wa,*y=wb;    for(i=0;i<m;i++) rs[i]=0;    for(i=0;i<n;i++) rs[x[i]=r[i]]++;    for(i=1;i<m;i++) rs[i]+=rs[i-1];    for(i=n-1;i>=0;i--) sa[--rs[x[i]]]=i;    for(j=1,p=1;p<n;j<<=1,m=p){        for(p=0,i=n-j;i<n;i++) y[p++]=i;        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;        for(i=0;i<m;i++) rs[i]=0;        for(i=0;i<n;i++) rs[wv[i]=x[y[i]]]++;        for(i=1;i<m;i++) rs[i]+=rs[i-1];        for(i=n-1;i>=0;i--) sa[--rs[wv[i]]]=y[i];        swap(x,y);        for(p=1,x[sa[0]]=0,i=1;i<n;i++)            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;    }}void calheight(int n){    int i,j,k=0;    for(int i=1;i<n;i++) rk[sa[i]]=i;    for(int i=1;i<n;height[rk[i++]]=k){        if(k) k--;        for(j=sa[rk[i]-1];r[i+k]==r[j+k];k++);    }}int p[Maxn];ll d[Maxn][20],d1[Maxn][20],sum[Maxn];void rmq_init(int n,int *height,ll (*d)[20]){    p[0]=-1;    for(int i=1;i<=n;i++)        p[i]=i&i-1?p[i-1]:p[i-1]+1;    for(int i=1;i<=n;i++) d[i][0]=height[i];    for(int j=1;j<=p[n];j++)        for(int i=1;i+(1<<j)-1<=n;i++)            d[i][j]=min(d[i][j-1],d[i+(1<<j-1)][j-1]);}ll rmq_ask(int l,int r,ll (*d)[20]){    int k=p[r-l+1];    return min(d[l][k],d[r-(1<<k)+1][k]);}ll lcp(int a,int b){    if(a<b) swap(a,b);    return rmq_ask(b+1,a,d);}int b_search1(int l,int r,ll k){    while(l<r){        int mid=l+r+1>>1;        if(sum[mid]<k) l=mid;        else r=mid-1;    }    return l;}ll b_search2(int s,int l,int r,ll k){    while(l<r){        int mid=l+r+1>>1;        if(lcp(s,mid)<k) r=mid-1;        else l=mid;    }    if(lcp(s,l)>=k) return rmq_ask(s,l,d1);    return a;}int main(){    int i,t,n;    while(~scanf("%s",s+1)){        for(i=1;s[i];i++)            r[i]=s[i]-'a'+1;        r[0]=r[n=i]=sum[0]=0;        da(n,27);        calheight(n);        for(i=1;i<n;i++) sum[i]=n-sa[i]-height[i];        for(i=1;i<n;i++) sum[i]+=sum[i-1];        rmq_init(n,height,d);        rmq_init(n,sa,d1);        a=b=0;        scanf("%d",&t);        while(t--){            scanf("%I64d",&v);            k=(a^b^v)+1;            if(k<=sum[n-1]){                int id=b_search1(0,n-1,k)+1;                a=sa[id];                a=min(a,b_search2(id,id+1,n-1,k-sum[id-1]+height[id]));                b=a+k-sum[id-1]+height[id]-1;            }            else a=b=0;            printf("%I64d %I64d\n",a,b);        }    }return 0;}


0 0