UVA 10829 L-Gap Substrings(后缀数组好题)

来源:互联网 发布:淘宝上怎么卖药品 编辑:程序博客网 时间:2024/05/19 12:26
题目大意:如果一个字符串它的形式是 UGU,U不为空,那么它就是 G 字符串,现在给你一个字符串,问你它的 L 字符串的个数为多少?
思路:很容易想到用后缀数组做,关键是时间复杂度的问题,普通枚举是 n^2,会爆时间。这里考虑和上一题POJ 3693 一样的思路,
枚举u的长度 u_len,然后每个 u_len ,可以把字符串分为len/u_len组,每组首字母位置为0、u_len、2*u_len...考虑U有且只包含一个位置的情况,
这里的U我们算左边的,考虑包含位置 i*u_len 如果我们知道这其中的某个位置,它和后面的+u_len+g的公共前缀最长为 w,那么就是 ans += (w-u_len+1)。
现在就是怎么求最长的问题,先是算 lcp(i*u_len,i*u_len+u_len+g),这个是后面的最长,当然前面还有可能存在,再反着算 lcp2(i*u_len-1,i*u_len+u_len+g-1),
另外注意,这两段在算的时候,有可能 lcp 很长,由于枚举的时候不能重复算,算后面时最大是 u_len,算前面最大是 u_len-1,取小即可。和poj那道一样,时间复杂度O(n*logn)。
自己做的时候,竟然没想到枚举 U 的长度,而是枚举 G 的起始位置,发现时间复杂度太高了,唉,失败啊。。。= = 

代码如下:

#include<cstdio>#include<cstring>#include<vector>#include<algorithm>using namespace std;const int MAXN = 55555<<1;char str[MAXN];int sa[MAXN],rank[MAXN],height[MAXN];int t[MAXN],t2[MAXN],c[MAXN];void cal_height(int n){    for(int i = 1;i <= n;i++) rank[sa[i]] = i;    int k = 0;    for(int i = 0;i < n;i++)    {        if(k) k--;        int j = sa[rank[i]-1];        while(str[i+k] == str[j+k]) k++;        height[rank[i]] = k;    }}void da(int n,int m){    int *x = t,*y = t2;    for(int i = 0;i < m;i++) c[i] = 0;    for(int i = 0;i < n;i++) c[x[i] = str[i]]++;    for(int i = 1;i < m;i++) c[i] += c[i-1];    for(int i = n-1;i >= 0;i--) sa[--c[x[i]]] = i;    for(int k = 1;k <= n;k <<= 1)    {        int p = 0;        for(int i = n-k;i < n;i++) y[p++] = i;        for(int i = 0;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k;        for(int i = 0;i < m;i++) c[i] = 0;        for(int i = 0;i < n;i++) c[x[y[i]]]++;        for(int i = 1;i < m;i++) c[i] += c[i-1];        for(int i = n-1;i >=0;i--) sa[--c[x[y[i]]]] = y[i];        swap(x,y);        p = 1;        x[sa[0]] = 0;        for(int i = 1;i < n;i++)            x[sa[i]] = y[sa[i]] == y[sa[i-1]] && y[sa[i]+k] == y[sa[i-1]+k] ? p-1 : p++;        if(p >= n) break;        m = p;    }    cal_height(n-1);}int d[MAXN][20];void rmq_init(int n){    for(int i = 1;i <= n;i++)        d[i][0] = height[i];    for(int j = 1;(1<<j) <= n;j++)        for(int i = 1;i+(1<<j) <= n;i++)            d[i][j] = min(d[i][j-1],d[i+(1<<(j-1))][j-1]);}int rmq(int a,int b){    int k = 0;    while((1<<(k+1)) < (b-a+1)) k++;    return min(d[a][k],d[b-(1<<k)+1][k]);}int lcp(int a,int b){    a = rank[a],b =rank[b];    if(a > b) swap(a,b);    return rmq(a+1,b);}int main(){    int _;    scanf("%d",&_);    for(int cas = 1;cas <= _;cas++)    {        int L;        scanf("%d%s",&L,str);        int len = strlen(str);        str[len] = 127;        for(int i = 0;i < len;i++)            str[len+i+1] = str[len-i-1];        str[len+len+1] = '\0';        da(len+len+2,128);        rmq_init(len+len+1);        int ans = 0;        //puts(str);        for(int u_len = 1;u_len < len/2;u_len++)        {            for(int i = 0;i < len;i += u_len)            {                int j = i+u_len+L;                int sum = 0;                if(j < len) sum += min(lcp(i,j),u_len);                if(i >= 1) sum += min(lcp(2*len-(i-1),2*len-(j-1)),u_len-1);                ans += max(0,sum-u_len+1);                //printf("u_len = %d,i = %d,j = %d,sum = %d\n",u_len,i,j,sum);            }        }        printf("Case %d: %d\n",cas,ans);    }    return 0;}


原创粉丝点击