HDU 5769 Substring (后缀数组)
来源:互联网 发布:罪恶之城和亵渎 知乎 编辑:程序博客网 时间:2024/05/22 02:29
后缀数组确实不愧为处理字符串的有力工具,花了几个小时看“研读”了一番论文和资料之后,可能了解了后缀数组的十分之一都不到。好在仍可以做这题
在罗穗骞关于后缀数组的文论中有这么一段:
例 5:不相同的子串的个数(spoj694,spoj705)
给定一个字符串,求不相同的子串的个数。
算法分析:
每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相
同的前缀的个数。如果所有的后缀按照 suffix(sa[1]), suffix(sa[2]),
suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加
进来的后缀 suffix(sa[k]),它将产生 n-sa[k]+1 个新的前缀。但是其中有
height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”
出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法
的时间复杂度为 O(n)。
即:在不考虑是否包含字符ch的情况,不同子串的个数为为 ∑1lengthlength−(sa[i]+height[i])
比如上图,对suffix(sa[1])来说,它增加了,a,aa,aaa,aaaa,aaaab这 8 - sa[1]5个新前缀(即子串)
对suffix(sa[2])来说,它有a,aa,aaa,aaab,四个前缀,但是前三个都在sa[1]时出现过了,而出现的
次数正好是heigt[i]。
所以最终不同子串的个数是 ∑1lengthlength−(sa[i]+height[i])。
现在要求包含字符ch,即,对每个suffix(sa[i])来说,并不是所有新增加的前缀都可以被计做答案。
只有包含字符ch的前缀才计数。比如对于后缀aacaab来说,ch=c;它只有前缀:aac,aaca,aacaa,aacaab是
符合的,a和aa都不行。所以对每个suffix(sa[i]),我们找离sa[i]最近的那个ch,如果ch在
sa[i]+heigt[i]之前,那ch位置之前的前缀都是不符合的,如果在sa[i]+heigt[i]之后,所以
新增加的前缀都是符合的。
从后往前预处理一下ch的位置,用nxt[i]记录。
最后的答案就是:∑1lengthlength−max(nxt[sa[i]],sa[i]+height[i])
【代码】
#include<cstdio>#include<cstring>#include<algorithm>#define LL long longusing namespace std;const int N = 201000;int cmp(int *r,int a,int b,int l){ return r[a]==r[b] && r[a+l]==r[b+l];}int wa[N],wb[N],ws[N],wv[N];int height[N], rankk[N];int sa[N], n, r[N],nxt[N];void da(int *r,int *sa,int n,int m){ int i,j,p,*x=wa,*y=wb; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[x[i]=r[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[x[i]]] = i; for(j=1,p=1;p<n;j*=2,m=p) { for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) wv[i]=x[y[i]]; for(i=0;i<n;i++) ws[wv[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i]; for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++; if(p>=n) break; m=p; }}void calheight(int *r,int *sa, int n){ int i,j,k=0; for(i=1;i<=n;i++) rankk[sa[i]]=i; for(i=0;i<n; height[rankk[i++]] = k ) for(k?k--:0,j=sa[rankk[i]-1]; r[j+k]==r[i+k];k++);}char str[N],ch[10];int main(){ int T,cas=1; scanf("%d",&T); while( T-- ) { scanf("%s",ch); scanf("%s", str); n = strlen(str); for(int i = 0; i < n; i++) r[i] = (int)str[i]; r[n]=0; da(r,sa,n+1,128); calheight(r,sa,n); int idx=n; for(int i=n-1;i>=0;i--) { if(str[i]==ch[0]) { idx=i; } nxt[i]=idx; } LL ans=0; for(int i=0;i<=n;i++) { ans += n - (int)max(nxt[sa[i]],sa[i]+height[i]); } printf("Case #%d: %I64d\n",cas++,ans); } return 0;}
- HDU 5769 Substring(后缀数组)
- HDU 5769 Substring (后缀数组)
- HDU-5769-Substring(后缀数组)
- HDU 5769 Substring(后缀数组)
- HDU 5769 Substring (后缀数组)
- HDU 5769 Substring(后缀数组)
- hdu-5769-Substring-后缀数组
- hdu 5769 Substring 后缀数组
- HDU 5769 Substring(后缀数组)
- HDU 5769 Substring(后缀数组)
- HDU 5769 Substring (后缀数组)
- Hdu-5769 Substring (SA后缀数组)
- HDU 5769 Substring 多校赛 (后缀数组)
- hdu 5719Substring(后缀数组)
- hdu 1403 Longest Common Substring (后缀数组模板)
- HDU 1403 Longest Common Substring 【 后缀数组】
- hdu 1403 Longest Common Substring - 后缀数组
- hdu 1403 Longest Common Substring (后缀数组)
- 记百度地图jar包冲突问题com.android.build.api.transform.TransformException:com.android.ide.commom.process.Proce
- 工作中做着自己不敢做的事情——痛苦并且快乐着!
- 二叉排序树
- 【POJ】1061 - 青蛙的约会(扩展欧几里得)
- JSTL
- HDU 5769 Substring (后缀数组)
- Android RecyclerView完全解析
- hdu5754 博弈
- HDU 3085 Nightmare Ⅱ【BFS +曼哈顿距离+综合性较强】
- Android表情面板简单实现
- maskView 的使用
- JAVA tomcat配置多个端口对应多个应用(一般是指war包)
- Linux编程socket通信疑问
- iOS&Android集成微信支付-Server篇(PHP)