长度不小于 k 的公共子串的个数(poj3415)
来源:互联网 发布:新编直指算法统宗 编辑:程序博客网 时间:2024/05/17 04:26
http://poj.org/problem?id=3415
给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)
两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,
如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,
于是可以将两个串连起来,中间加一个字符
然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼
就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,
考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和
找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈
循环两遍,eg统计后面串的前串和的时候,
走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个
出栈,然后当前是后面的串,就统计一下。
维护cnt 和当前height值 统计结果就好了
/*两个字符串得公共子串大于k的个数,那么一定是每个字符串后缀得所有前缀相同得数量,如果最长公共前缀为len,那么len-k+1就是这个串之中以头开头的大于等于k长度贡献的答案,于是可以将两个串连起来,中间加一个字符然后把height大于等于k的分块,一块之内的都是可行解,如果两个人的位置一个再n前一个再n吼就是两个字符串相同部分了,每个组内都这么算一遍的复杂度为n^2,考虑每次遇到b串就找同组前面(与后面a的前缀再后面的a统计时算)a串中所有公共前缀和找靠前的height时是所有height的最小值,这个值随着你往后走在变,所以维护两个单调递增栈循环两遍,eg统计后面串的前串和的时候,走到前面的串,放进栈里,每次经过一个点,就用她的height把栈前面的h值大于当前值的都改变为这个出栈,然后当前是后面的串,就统计一下。维护cnt 和当前height值 统计结果就好了*/#include <cstdio>#include <cstring>#include <iostream>#include <algorithm>using namespace std;const int maxn = 1e6+10;int n,lena;char a[maxn];typedef pair<char,int> pii;int A[maxn],B[maxn];int realrank[maxn],k;pii st[maxn];int s[maxn][2];long long h[maxn];int K;int C[maxn],D[maxn];void init(){ scanf("%s",a+1); lena = strlen(a+1); a[lena+1] = '#'; scanf("%s",a+lena+2); n = strlen(a+1); //cout << n<<a+1<<endl; for(int i = 1; i <= n ; i++){ st[i] = make_pair(a[i],i); } sort(st+1,st+1+n); k = realrank[st[1].second] = 1; for(int i = 2; i <= n ; i++){ if(st[i].first != st[i-1].first) k +=1; realrank[st[i].second] = k; }}void suffix_array(){ for(int i = 1; i <= n ; i *= 2){ for(int j = 0 ; j <= n ; j++) A[j] = B[j] = 0; for(int j = 1; j <= n ; j++){ A[s[j][0] = realrank[j]]++; if(j+i <= n) s[j][1] = realrank[j+i]; else s[j][1] = 0; B[s[j][1]]++; } for(int j = 1; j <= n ;j++) A[j] += A[j-1],B[j] += B[j-1]; for(int j = n ; j >= 1; j--){ C[B[s[j][1]]] = j; B[s[j][1]]--; } for(int j = n ; j >=1; j--){ D[A[s[C[j]][0]]] = C[j]; A[s[C[j]][0]]--; } k = realrank[D[1]] = 1; for(int j = 2 ; j <= n ; j++){ if(s[D[j]][0] != s[D[j-1]][0] ||s[D[j]][1] != s[D[j-1]][1]) k++; realrank[D[j]] = k; } }}void gethigh(){ int pre = 0,j; for(int i = 1; i <= n ; i++){ if(pre) pre--; j = D[realrank[i]-1]; while(i+pre <= n && j + pre <= n && a[i+pre] == a[j+pre]) pre++; h[realrank[i]] = pre; }}struct node{ long long cnt,height;}stka[maxn],stkb[maxn];long long ans ,tot;int topa ,topb,taila,tailb;void sov(){ //cout <<"len = "<<lena<<" "<<n<<endl; ans = topa = topb = taila = tailb = tot = 0; for(int i = 2; i <= n ; i++){ // printf("h[%d] = %d\n",i,h[i]); if(h[i] < K){ topa = topb = taila = tailb = 0; tot = 0; } else{ int num = 0; if(D[i-1] <= lena){ num++; tot += h[i] - K +1; // cout <<"i = "<<i<<" to "<<tot<<endl; } while(taila > topa && stka[taila-1].height >= h[i]){ // cout <<"i = "<<i<<endl; taila--; tot -= stka[taila].cnt*(stka[taila].height-h[i]); num += stka[taila].cnt; // cout << " tot = "<<tot <<endl; } stka[taila].height = h[i]; stka[taila].cnt = num; taila++; if(D[i] > lena){ ans += tot; } } } topa = topb = taila = tailb = tot = 0; for(int i = 2; i <= n ; i++){ if(h[i] < K){ topa = topb = taila = tailb = 0; tot = 0; } else{ int num = 0; if(D[i-1] > lena+1){ //printf("D[%d] = %d\n",i,D[i]); num++; tot += h[i] - K +1; } while(taila > topa && stka[taila-1].height >= h[i]){ taila--; tot -= stka[taila].cnt*(stka[taila].height-h[i]); num += stka[taila].cnt; } //cout <<"i = "<<i<<" stka[taila].height = "<<h[i]<<" stka[taila].cnt = "<<num<<endl; stka[taila].height = h[i]; stka[taila].cnt = num; taila++; if(D[i] <= lena){ ans += tot; } } } printf("%lld\n",ans);}int main(){ while(~scanf("%d",&K)&&K){ init(); suffix_array(); gethigh(); sov(); }}
0 0
- 长度不小于 k 的公共子串的个数(poj3415)
- poj3415之长度不小于k的公共子串个数
- hdu 3415 后缀数组 长度不小于 k 的公共子串的个数
- POJ 3415 求两个字符串间长度不小于k的公共子串的个数
- poj 3415 ( 后缀数组 长度不小于 k 的公共子串的个数)
- 后缀数组(长度不小于k的公共子串的个数)
- 后缀数组(长度不小于k的公共子串的个数)
- POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)
- POJ 3415 Common Substrings(长度不小于k 的公共子串的个数--后缀数组+单调栈优化)
- poj 3415 :长度不小于 k 的公共子串的个数(后缀数组+单调栈)
- POJ 3415 不小于k的公共子串的个数
- HUST 1352 求重复次数不小于k的子串的个数。
- poj 3415 长度超过K的公共子串个数
- (Relax 后缀数组1.3)POJ 3415 Common Substrings(求串A和串B中长度不小于k的公共子串数)
- [POJ3415]公共子串
- POJ 3415 Common Substrings (求长度大于K的公共子串个数,5级)
- 不小于N的素数个数
- POJ 题目3415 Common Substrings(后缀数组+栈,求可以匹配到的长度大于k的公共子串个数)
- Android属性动画总结
- .net UEditor 自定义上传 远程服务器
- 日常逗逼对话
- JVM的初步了解
- 验证数字的正则表达式集
- 长度不小于 k 的公共子串的个数(poj3415)
- iOS网络通信类库用AFNetworking替换ASHttpRequest的解决方案
- 洛谷——P1010 幂次方
- Git常见操作
- gulp入门(13)- browser-sync
- 基于Struts的Oracle分页查询
- 安装程序遇到错误0x80070422
- HTML5 表单详解
- Linux和Unix的关系