hihoCoder 1407 后缀数组二·重复旋律2 && POJ 1743 Musical Theme(最长不可重叠重复子串问题)

来源:互联网 发布:知乎二战德国石油 编辑:程序博客网 时间:2024/05/16 14:19

hihoCoder 1407:

描述

小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后发现很多作品自身包含一样的旋律。

旋律可以表示为一段连续的数列,相似的旋律在原数列不可重叠,比如在1 2 3 2 3 2 1 中 2 3 2 出现了一次,2 3 出现了两次,小Hi想知道一段旋律中出现次数至少为两次的旋律最长是多少?

解题方法提示

输入

第一行一个整数 N。1≤N≤100000

接下来有 N 个整数,表示每个音的数字。1≤数字≤1000

输出

一行一个整数,表示答案。

样例输入
81 2 3 2 3 2 3 1
样例输出

 2


思路:首先是和最长可重叠子串一样,需要去二分答案,但是check的时候有点不一样了,这里的check思想是遍历

Height数组,如果有连续的Height值大于等于K,那么它们为一组,对于每一组,我们检查其max(SA)-min(SA)是否大

于等于K来判断是否满足要求。


代码:

#include<iostream>#include<cstdio>#include<cstring>#include<algorithm>using namespace std;const int maxn = 1e5+5;int t1[maxn], t2[maxn], c[maxn];int ra[maxn], height[maxn];int sa[maxn], num[maxn];int n;bool cmp(int *r, int a, int b, int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int str[], int sa[], int ra[], int height[], int n, int m){    n++;    int i, j, p, *x = t1, *y = t2;    for(i = 0; i < m; i++) c[i] = 0;    for(i = 0; i < n; i++) c[x[i]=str[i]]++;    for(i = 1; i < m; i++) c[i] += c[i-1];    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;    for(j = 1; j <= n; j<<=1)    {        p = 0;        for(i = n-j; i < n; i++) y[p++] = i;        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i]-j;        for(i = 0; i < m; i++) c[i] = 0;        for(i = 0; i < n; i++) c[x[y[i]]]++;        for(i = 1; i < m; i++) c[i] += c[i-1];        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];        swap(x, y);        p = 1; x[sa[0]] = 0;        for(i = 1; i < n; i++)            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;        if(p >= n) break;        m = p;    }    int k = 0;    n--;    for(i = 0; i <= n; i++) ra[sa[i]] = i;    for(i = 0; i < n; i++)    {        if(k) k--;        j = sa[ra[i]-1];        while(str[i+k]==str[j+k]) k++;        height[ra[i]] = k;    }}bool judge(int x){    int mmin = 1, mmax = 1;    for(int i = 1; i <= n; i++)    {        if(height[i] < x)        {            mmin = sa[i];            mmax = sa[i];        }        else        {            mmin = min(mmin, sa[i]);            mmax = max(mmax, sa[i]);            if(mmax-mmin >= x) return 1;        }    }    return 0;}int main(void){    while(cin >> n )    {        for(int i = 0; i < n; i++)            scanf("%d", &num[i]);        da(num, sa, ra, height, n, 1024);        int l = 0, r = n, ans = 0;        while(l <= r)        {            int mid = (l+r)/2;            if(judge(mid)) l = mid+1, ans = mid;            else r = mid-1;        }        printf("%d\n", ans);    }    return 0;}




题意:

有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

    1.长度至少为5个音符。

    2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

    3.重复出现的同一主题不能有公共部分。

思路:跟hihoCoder1407有一点不一样,这里的子串不一定要数值相同,只要变化相同就行,所以可以首先将原序列变成与上一个差值的序列,这样求

得的长度需要+1.比如n = 10, 1 2 3 4 5  11 12 13 14 15, 处理后的序列n = 9, 1 1 1 1 6 1 1 1 1,求得的长度为4。


代码:

#include<iostream>#include<cstdio>#include<cstring>#include<algorithm>using namespace std;const int maxn = 1e5+5;int t1[maxn], t2[maxn], c[maxn];int ra[maxn], height[maxn];int sa[maxn], num[maxn];int n;bool cmp(int *r, int a, int b, int l){    return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int str[], int sa[], int ra[], int height[], int n, int m){    n++;    int i, j, p, *x = t1, *y = t2;    for(i = 0; i < m; i++) c[i] = 0;    for(i = 0; i < n; i++) c[x[i]=str[i]]++;    for(i = 1; i < m; i++) c[i] += c[i-1];    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;    for(j = 1; j <= n; j<<=1)    {        p = 0;        for(i = n-j; i < n; i++) y[p++] = i;        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i]-j;        for(i = 0; i < m; i++) c[i] = 0;        for(i = 0; i < n; i++) c[x[y[i]]]++;        for(i = 1; i < m; i++) c[i] += c[i-1];        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];        swap(x, y);        p = 1; x[sa[0]] = 0;        for(i = 1; i < n; i++)            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;        if(p >= n) break;        m = p;    }    int k = 0;    n--;    for(i = 0; i <= n; i++) ra[sa[i]] = i;    for(i = 0; i < n; i++)    {        if(k) k--;        j = sa[ra[i]-1];        while(str[i+k]==str[j+k]) k++;        height[ra[i]] = k;    }}bool judge(int x){    int mmin = 1, mmax = 1;    for(int i = 1; i <= n; i++)    {        if(height[i] < x)        {            mmin = sa[i];            mmax = sa[i];        }        else        {            mmin = min(mmin, sa[i]);            mmax = max(mmax, sa[i]);            if(mmax -mmin >= x) return 1;        }    }    return 0;}int main(void){    while(cin >> n && n)    {        for(int i = 0; i < n; i++)            scanf("%d", &num[i]);        for(int i = 0; i < n-1; i++)            num[i] = num[i+1]-num[i]+100;        n--;        da(num, sa, ra, height, n, 256);        int l = 4, r = n, ans = 0;        while(l <= r)        {            int mid = (l+r)/2;            if(judge(mid)) l = mid+1, ans = mid+1;            else r = mid-1;        }        printf("%d\n", ans);    }    return 0;}




阅读全文
1 0