蓝桥杯 2014 5 重复模式

来源:互联网 发布:聚合数据接口使用 编辑:程序博客网 时间:2024/06/07 09:10

作为 drd 的好朋友,技术男 atm 在 drd 生日时送给他一个超长字符串 S 。atm 要 drd 在其中找出一个最长的字符串 T ,使得 T 在 S 中至少出现了两次,而他想说的秘密就藏在 T 中。
由于字符串实在是太长了,drd 总是找不到合适的 T 。于是 drd 请你帮他找到这个 T 的长度。
【输入格式】
一行。一个字符串,即题目中说的S 。
【输出格式】
一行。一个整数,表示最长的 T 的长度。
【样例输入】
ababa
【样例输出】
3
「数据范围」
对于 30% 的数据,S长度 <= 100
对于 60% 的数据,S长度 <= 8000
对于 100% 的数据,S长度 <= 500000
资源约定:
峰值内存消耗 < 256M
CPU消耗 < 1000ms

经典的longest repeated substring问题
使用后缀数组suffix array解决
参考<<算法竞赛入门经典—训练指南>>上的代码,采用n*log(n)(基数排序)才行
如使用n*log(n)*log(n) (快速排序),则8,9,10三个测试点超时1s

#include <bits/stdc++.h>using namespace std;const int MAXN = 1E6;char s[MAXN];int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n, rk[MAXN], height[MAXN];void build_sa(int m){    int *x = t;    int *y = t2;    for (int i = 0; i < m; i++) c[i] = 0;    for (int i = 0; i < n; i++) c[x[i] = s[i]]++;    for (int i = 1; i < m; i++) c[i] += c[i - 1];    for (int i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;    for (int k = 1; k <= n; k *= 2) {        int p = 0;        for (int i = n - k; i < n; i++) y[p++] = i;        for (int i = 0; i < n; i++)            if (sa[i] >= k) y[p++] = sa[i] - k;        for (int i = 0; i < m; i++) c[i] = 0;        for (int i = 0; i < n; i++) c[x[y[i]]]++;        for (int i = 0; i < m; i++) c[i] += c[i - 1];        for (int i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];        swap(x, y);        p = 1;        x[sa[0]] = 0;        for (int i = 1; i < n; i++)            x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1] + k] == y[sa[i] + k] ? p - 1 : p++;        if (p >= n) break;        m = p;    }}void getHeight(){    int k = 0;    for (int i = 0; i < n; i++) rk[sa[i]] = i;    for (int i = 0; i < n; i++) {        if (k) k--;        int j = sa[rk[i] - 1];        while(s[i+k] == s[j+k]) k++;        height[rk[i]] = k;    }}int main(){    //freopen("in1.txt", "r", stdin);    scanf("%s", s);    strcat(s, "$");    n = strlen(s);    build_sa(256);    getHeight();    int ans = 0;    for (int i = 0; i < n; i++)        ans = max(ans, height[i]);    cout << ans << endl;}
0 0
原创粉丝点击