hdu 5008 (后缀数组 + rmq +二分)
来源:互联网 发布:调查问卷软件 编辑:程序博客网 时间:2024/03/28 18:51
题意:给出一个字符串,求出第k小的子串,并求出字符串的起止位置,如果有多个重复的子串,求出位置最靠左的子串。
思路:比赛时,想到了要用后缀数组,但是没想到如何做。
其实,因为子串是后缀的前缀,后缀数组对后缀排序的同时,也对子串进行了排序。对于每一个sa[i],会产生不同的n - sa[i] - height[i]个子串,这些子串也是排好序的。
这样,我们就我们就可以二分求出这些子串中的第k小的子串。
但是,因为我们没有考虑LCP,这样会导致对于相同的第k小,有些位置更靠左,且存在于公共前缀中的子串没有考虑到,这样,我们还需要对这些字符串进行考虑。
那如何求出最靠左的子串呢?首先要注意,前面找到的子串是在sa数组中,最先出现的子串,但不是在整个字符串最先出现的子串。我们从找到该子串的sa的位置开始,向后搜索,如果和该位置的LCP不小于找到子串的长度,那说明是可能的位置。因为,对于给定位置的LCP,他的长度是不增的,我们可以二分去找到整个可能的范围。最后在这个区间求一次RMQ就是最左的位置。
注意的点:第一个sa[0] 是最后添加的0字符,因为那个最大,第二个点 无论是sa 还是 height 从1开始,因为0都是最后我们添加的0,所以不会有影响。还有就是一些小细节 sa的值是从0开始的。
#include <bits/stdc++.h>using namespace std;const int MAXN = 1e5+100;int t1[MAXN],t2[MAXN],c[MAXN];typedef long long ll;ll tol[MAXN];char s[MAXN];bool cmp(int *r,int a,int b,int l){ return r[a]==r[b]&&r[a+l]==r[b+l];}void da(char str[],int sa[],int ra[],int height[],int n,int m){ n++; int i,j,p,*x=t1,*y=t2; for(i=0;i<m;i++) c[i]=0; for(i=0;i<n;i++) c[x[i]=str[i]]++; for(i=1;i<m;i++) c[i]+=c[i-1]; for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i; for(j=1;j<=n;j<<=1) { p=0; for(i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<m;i++) c[i]=0; for(i=0;i<n;i++) c[x[y[i]]]++; for(i=1;i<m;i++) c[i]+=c[i-1]; for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i]; swap(x,y); p=1;x[sa[0]]=0; for(i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; if(p>=n) break; m=p; } int k=0; n--; for(i=0;i<=n;i++) ra[sa[i]]=i; for(i=0;i<n;i++) { if(k) k--; j=sa[ra[i]-1]; while(str[i+k]==str[j+k])k++; height[ra[i]]=k; }}int ra[MAXN],height[MAXN];int sa[MAXN];int f1[MAXN][22],f2[MAXN][22];void init1(int n){ for(int i=1;i<=n;i++) f1[i][0]=sa[i]; for(int j=1;(1<<j)<=n;j++) { for(int i=1;i+(1<<j)-1<=n;i++) { f1[i][j]=min(f1[i][j-1],f1[i+(1<<(j-1))][j-1]); } }}int rmq1(int i,int j){ int k=0; while(1<<(k+1)<=(j-i+1)) k++; return min(f1[i][k],f1[j-(1<<k)+1][k]);}void init2(int n){ for(int i=1;i<=n;i++) f2[i][0]=height[i]; for(int j=1;(1<<j)<=n;j++) { for(int i=1;i+(1<<j)-1<=n;i++) { f2[i][j]=min(f2[i][j-1],f2[i+(1<<(j-1))][j-1]); } }}int rmq2(int i,int j){ int k=0; while(1<<(k+1)<=(j-i+1)) k++; return min(f2[i][k],f2[j-(1<<k)+1][k]);}int main(){ while(~scanf(" %s",s)) { int t; scanf("%d",&t); int len=strlen(s); da(s,sa,ra,height,len,130); int n=len; for(int i=1;i<=n;i++) tol[i]=tol[i-1]+n-sa[i]-height[i]; init1(len); init2(len); int lll=0,rrr=0; int ans=0; while(t--) { ll k; scanf("%lld",&k); k=(lll^rrr^k)+1; if(k>tol[n]) { lll=rrr=0; puts("0 0"); continue; } int num=lower_bound(tol+1,tol+1+n,k)-tol; k-=tol[num-1]; int st=sa[num]; int ed=sa[num]+height[num]+k-1; int lenn=ed-st+1; int l=num+1,r=n; while(l<=r) { int mid=(l+r)>>1; int pan=rmq2(num+1,mid); if(pan>=lenn) l=mid+1; else r=mid-1; } if(r>=num+1) ans=rmq1(num,r); else ans=st; lll=ans+1; rrr=ans+lenn; printf("%d %d\n",lll,rrr); } }}
阅读全文
0 0
- hdu 5008 (后缀数组 + rmq +二分)
- [后缀数组+二分+rmq] hdu 5008 Boring String Problem
- HDU - 5008 Boring String Problem (后缀数组+二分+RMQ)
- HDU 5558 (后缀数组 二分 RMQ)
- hdoj 5008 后缀数组+RMQ+二分
- hdu 5853 Jong Hyok and String (二分+后缀数组+RMQ)
- HDU 4622 后缀数组+RMQ
- hdu 6194 后缀数组+RMQ
- CodeForces 653F Paper task(rmq+二分+后缀数组)
- bzoj 3230: 相似子串 (后缀数组+RMQ+二分)
- HDU 5008 Boring String Problem 后缀数组 RMQ
- [后缀数组+rmq] hdu 4691 Front compression
- hdu 4691 后缀数组+RMQ+LCP
- 【HDU】4691 Front compression 后缀数组+RMQ
- hdu 4691 Front compression (后缀数组+rmq)
- HDU 6194 后缀数组+lcp+rmq
- HDU 5769 后缀数组+二分
- hdu 5869 RMQ+二分+离线树状数组
- 中文分词的python实现-基于HMM算法
- APC 基本概念及APC注入的实现(Ring3 + Ring0)----实现
- vs2012编译cocos2dx 3.10报错解决方法
- python中文错误
- [USACO2.3]货币系统 Money Systems
- hdu 5008 (后缀数组 + rmq +二分)
- Request头和Response头
- Java实现AES的128、256位密钥加解密算法 并 解决Illegal key size or default parameters问题
- Python 浅拷贝 深拷贝 及引用机制
- Linux github提交方法
- 解决Win7系统无法睡眠问题
- 1702
- C++中memset函数的用法注意事项
- uva 11584