HDU 5008 Boring String Problem 二分 + 后缀数组

来源:互联网 发布:js 设置元素位置 编辑:程序博客网 时间:2024/04/20 23:35

传送门:HDU 5008

题意:给出一个字符串和q次询问,每次问字典序第k小的子串是哪个,若有多个字典序相同的第k小字符串,输出起始点最小的那个。

思路:后缀数组经典应用之一有求一个字符串的不同子串个数,由于后缀数组的后缀都是按字典序排好序的,因此每个后缀贡献的子串也是排好序的,这样我们可以搞一个不同子串个数的前缀和数组,然后就可以二分求出一个解来了,但是这个解不一定是起始点最小的解,因此我们还要在height数组上继续向下枚举,假设找出来的解长度为len,那么只要height[i] >= len我们就能继续向下找,枚举的过程中更新一下答案就好了。

还有一种把枚举换成了二分 + rmq的做法,看起来很骚,实际上还不如枚举快(可能是数据原因)。代码见:点击打开链接

代码:

#include<bits/stdc++.h>#define ll long long#define inf 0x3f3f3f3f#define showtime printf("time = %.15f\n",clock() / (double)CLOCKS_PER_SEC);using namespace std;const int MAXN = 100010;int t1[MAXN], t2[MAXN], c[MAXN];    int ra[MAXN], height[MAXN];  int sa[MAXN];    char str[MAXN]; int n;  /* 待排序数组长度为n,放在0~n-1中,在最后面补一个0  da(str, sa, ra, height, n, );//注意是n; ra即为rank数组  例如:  n = 8;  字符串存在num[0,n-1]   num[] = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0  ra[] = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };ra[0~n-1]为有效值,ra[n]必定为0无效值  sa[] = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值  height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值    */    bool cmp(int *r, int a, int b, int l)    {        return r[a]==r[b]&&r[a+l]==r[b+l];    }        void da(char str[], int sa[], int ra[], int height[], int n, int m)    {        n++;        int i, j, p, *x = t1, *y = t2;        for(i = 0; i < m; i++) c[i] = 0;        for(i = 0; i < n; i++) c[x[i]=str[i]]++;        for(i = 1; i < m; i++) c[i] += c[i-1];        for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;        for(j = 1; j <= n; j<<=1)        {            p = 0;            for(i = n-j; i < n; i++) y[p++] = i;            for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i]-j;            for(i = 0; i < m; i++) c[i] = 0;            for(i = 0; i < n; i++) c[x[y[i]]]++;            for(i = 1; i < m; i++) c[i] += c[i-1];            for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];            swap(x, y);            p = 1; x[sa[0]] = 0;            for(i = 1; i < n; i++)                x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;            if(p >= n) break;            m = p;        }        int k = 0;        n--;        for(i = 0; i <= n; i++) ra[sa[i]] = i;        for(i = 0; i < n; i++)        {            if(k) k--;            j = sa[ra[i]-1];            while(str[i+k]==str[j+k]) k++;            height[ra[i]] = k;        }    }ll num[MAXN];//不同字符串个数前缀和数组 int main(){int q, n, l, r;ll k;while(~scanf("%s", str)){n = strlen(str);da(str, sa, ra, height, n, 128);for(int i = 1; i <= n; i++)num[i] = num[i - 1] + n - sa[i] - height[i];scanf("%d", &q);l = r = 0;while(q--){scanf("%lld", &k);k = (k ^ l ^ r) + 1;if(k > num[n]){l = r = 0;//这里不要忘了赋值printf("0 0\n"); continue;}int id = lower_bound(num + 1, num + n + 1, k) - num;k -= num[id - 1];l = sa[id];r = sa[id] + height[id] - 1 + k;int len = r - l + 1;for(int i = id + 1; i <= n; i++){if(height[i] >= len){if(sa[i] < l)l = sa[i], r = sa[i] + len - 1;}else break;}printf("%d %d\n", ++l, ++r);//从0...n-1下标转换到1...n }} return 0;}


阅读全文
0 0
原创粉丝点击