hiho一下 第122周 后缀数组三·重复旋律3
来源:互联网 发布:汪峰半壁江山知乎 编辑:程序博客网 时间:2024/05/22 06:39
时间限制:5000ms
单点时限:1000ms
内存限制:256MB
- 样例输入
abcdefgabacabca
- 样例输出
3
描述
小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后发现很多作品中的旋律有共同的部分。
旋律是一段连续的数列,如果同一段旋律在作品A和作品B中同时出现过,这段旋律就是A和B共同的部分,比如在abab 在 bababab 和 cabacababc 中都出现过。小Hi想知道两部作品的共同旋律最长是多少?
解题方法提示
输入
共两行。一行一个仅包含小写字母的字符串。字符串长度不超过 100000。
输出
一行一个整数,表示答案。
后缀数组比较基本的应用。
找2个串的最长公共子串
首先用非字符集的符号#将字符串连接起来,
求出height,sa等数组
显然两个串的LCS必然存在于排名相邻的后缀中,
如果两个相邻后缀出自于同一个字符串,显然不合要求,
如果她们出自于不同的字符串,那么他们的LCP,必然就是两个字符串的一个LCP
因此扫描一遍取最大即可。
#include<cstdio>#include<cstdlib>#include<cstring>#include<cmath>#include<vector>#include<algorithm>using namespace std;const int N = 200000+50;int cmp(int *r,int a,int b,int l){ return (r[a]==r[b]) && (r[a+l]==r[b+l]);}// 用于比较第一关键字与第二关键字,// 比较特殊的地方是,预处理的时候,r[n]=0(小于前面出现过的字符)/* DA(aa,sa,n+1,200); calheight(aa,sa,n);*/int wa[N],wb[N],ws[N],wv[N];int Rank[N];//后缀i在sa[]中的排名int height[N];//sa[i]与sa[i-1]的LCPint sa[N];//sa[i]表示排名第i小的后缀的下标void DA(int *r,int *sa,int n,int m) //此处N比输入的N要多1,为人工添加的一个字符,用于避免CMP时越界{ int i,j,p,*x=wa,*y=wb,*t; for(i=0; i<m; i++) ws[i]=0; for(i=0; i<n; i++) ws[x[i]=r[i]]++; for(i=1; i<m; i++) ws[i]+=ws[i-1]; for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i; //预处理长度为1 for(j=1,p=1; p<n; j*=2,m=p) //通过已经求出的长度J的SA,来求2*J的SA { for(p=0,i=n-j; i<n; i++) y[p++]=i; // 特殊处理没有第二关键字的 for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j; //利用长度J的,按第二关键字排序 for(i=0; i<n; i++) wv[i]=x[y[i]]; for(i=0; i<m; i++) ws[i]=0; for(i=0; i<n; i++) ws[wv[i]]++; for(i=1; i<m; i++) ws[i]+=ws[i-1]; for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i]; //基数排序部分 for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; //更新名次数组x[],注意判定相同的 }}void calheight(int *r,int *sa,int n) // 此处N为实际长度{ int i,j,k=0; // height[]的合法范围为 1-N, 其中0是结尾加入的字符 for(i=1; i<=n; i++) Rank[sa[i]]=i; // 根据SA求Rank for(i=0; i<n; height[Rank[i++]] = k ) // 定义:h[i] = height[ Rank[i] ] for(k?k--:0,j=sa[Rank[i]-1]; r[i+k]==r[j+k]; k++); //根据 h[i] >= h[i-1]-1 来优化计算height过程}int n;char ss[N];int aa[N];int idx;int belong[N];int solve(){ DA(aa,sa,n+1,30); calheight(aa,sa,n); int ans=0; for (int i=1;i<=n;i++) { if (sa[i]<idx)belong [i]=0; else belong[i]=1; } int maxx=0; for (int i=2;i<=n;i++) { if (belong[i]!=belong[i-1]) maxx=max(maxx,height[i]); } return maxx;} char s2[100005];int main (){ int t; scanf("%s",&ss); scanf("%s",&s2); idx=strlen(ss); ss[strlen(ss)]='#'; ss[idx+1]=0; strcat(ss,s2); n=strlen(ss); for (int i=0; i<n; i++) aa[i]=ss[i]-'a'+1; aa[idx]=28; aa[n]=0; int ans=solve(); printf("%d\n",ans); return 0;}
0 0
- hiho一下 第122周 后缀数组三·重复旋律3
- hiho一下 第121周后缀数组二·重复旋律2
- hiho一下 第120周后缀数组一·重复旋律
- hiho一下 第123周后缀数组四·重复旋律4
- Hiho 122 后缀数组三·重复旋律3(多个串的最长公共重复子串)
- 后缀数组三·重复旋律3
- Hiho 120 后缀数组一·重复旋律
- Hiho 123 后缀数组四·重复旋律4
- hihoCoder #1415 : 后缀数组三·重复旋律3
- Hiho 121 后缀数组二·重复旋律2(最长不可重叠重复子串问题)
- hihoCoder 1415 后缀数组三·重复旋律3(最长公共子串)
- 后缀数组一·重复旋律
- 后缀数组二·重复旋律2
- 后缀数组四·重复旋律4
- [hiho一下 第128周] 后缀自动机
- [hiho一下 第129周] 后缀自动机
- [hiho一下 第130周] 后缀自动机
- hihoCoder #1403 : 后缀数组一·重复旋律
- WEB容器小谈
- 同一台Windows机器中启动多个Memcached服务
- 441. Arranging Coins
- mpls vpn OSPF配置
- HDU 1521排列组合
- hiho一下 第122周 后缀数组三·重复旋律3
- codeforces - 444c DZY Loves Physics【水】
- Android Studio 运行项目发生instant Run requires启动不了程序
- 机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)
- AJAX基础
- Codeforces550A Two Substrings 暴力
- 学习Hadoop第二十五课(单节点HBase建表、插入数据及查询)
- iOS开发之AFN的基本使用
- php源码之路第三章第七节( 数据类型的转化)