HDU 6194 后缀数组+单调栈

来源:互联网 发布:mac删除应用程序还在 编辑:程序博客网 时间:2024/06/11 04:19

题意:

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6194
找到一个字符串中恰好出现k次的子串的数目。


思路:

计算出height数组,根据height数组进行操作,因为子串恰好出现k次,很显然需要找到一个长度为k-1的区间,这个区间要满足区间两边的height都比区间内的最小值要小,这样利用单调栈求出每个height左右两边第一个比height小的位置,如果左右两个位置包括的区间长度正好为k-1,那么所枚举的这个height减去左右两边height的最大值就是需要统计的恰好出现k次的子串数目。
有两点需要注意,第一是需要单独考虑k==1的情况,第二是对于同一段的相同数字,比如:1,2,3,2,1;此时两个2的左右区间都相同,只需要考虑一个2,这在求利用单调栈时标记一下即可。


代码:

#include <bits/stdc++.h>using namespace std;typedef long long LL;const int MAXN = 1e5 + 10;const int INF = 0x3f3f3f3f;int n;int t1[MAXN], t2[MAXN], c[MAXN];bool cmp(int *r, int a, int b, int l) {    return r[a] == r[b] && r[a + l] == r[b + l];}void build(int a[],int sa[],int rk[],int height[],int n,int m) {    n++;    int i, j, p, *x = t1, *y = t2;    //第一轮基数排序,如果s的最大值很大,可改为快速排序    for(i = 0; i < m; i++) c[i] = 0;    for(i = 0; i < n; i++) c[x[i] = a[i]]++;    for(i = 1; i < m; i++) c[i] += c[i-1];    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;    for(j = 1; j <= n; j <<= 1) {        p = 0;        //直接利用sa数组排序第二关键字        for(i = n-j; i < n; i++)y[p++] = i;//后面的j个数第二关键字为空的最小        for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;        //这样数组y保存的就是按照第二关键字排序的结果        //基数排序第一关键字        for(i = 0; i < m; i++) c[i] = 0;        for(i = 0; i < n; i++) c[x[y[i]]]++;        for(i = 1; i < m; i++) c[i] += c[i-1];        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];        //根据sa和x数组计算新的x数组        swap(x,y);        p = 1;        x[sa[0]] = 0;        for(i = 1; i < n; i++)            x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;        if(p >= n)break;        m = p;//下次基数排序的最大值    }    int k = 0;    n--;    for(i = 0; i <= n; i++)rk[sa[i]] = i;    for(i = 0; i < n; i++)    {        if(k)   k--;        j = sa[rk[i]-1];        while(a[i+k] == a[j+k])            k++;        height[rk[i]] = k;    }}int sa[MAXN], height[MAXN], rk[MAXN], a[MAXN];int L[MAXN], R[MAXN];char s[MAXN];bool vis[MAXN];stack <int> sta;int main(){    //freopen("in.txt", "r", stdin);    int T;    scanf("%d", &T);    while (T--) {        int k;        scanf("%d%s", &k, s);        n = strlen(s);        for (int i = 0; i < n; i++)            a[i] = s[i] - 'a' + 1;        a[n] = 0;        build(a, sa, rk, height, n, 27);        height[0] = height[n + 1] = 0;        LL ans = 0;        if (k == 1) {            for (int i = 1; i <= n; i++) {                    int tmp = n - sa[i] - max(height[i], height[i + 1]);                    if (tmp > 0) ans += tmp;            }        }        else {            while (!sta.empty()) sta.pop();            for (int i = 1; i <= n; i++) {                vis[i] = true;                while (!sta.empty() && height[sta.top()] >= height[i]) sta.pop();                if (sta.empty()) L[i] = 0;                else L[i] = sta.top();                sta.push(i);            }            while (!sta.empty()) sta.pop();            for (int i = n; i >= 1; i--) {                while (!sta.empty() && height[sta.top()] >= height[i]) {                    if (height[sta.top()] == height[i]) vis[sta.top()] = false;                    sta.pop();                }                if (sta.empty()) R[i] = n + 1;                else R[i] = sta.top();                sta.push(i);            }            for (int i = 1; i <= n; i++) {                if (!vis[i]) continue;                if (R[i] - L[i] != k) continue;                ans += (LL)(height[i] - max(height[L[i]], height[R[i]]));            }        }        printf("%I64d\n", ans);    }    return 0;}
原创粉丝点击