poj 1743 Musical Theme 后缀数组

来源:互联网 发布:Linux 终端 color 编辑:程序博客网 时间:2024/06/06 10:00

题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

    1.长度至少为5个音符。

    2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

    3.重复出现的同一主题不能有公共部分。

首先构造差分序列,二分+height分段。至于不能重叠维护每一段最大值最小值。判断是否重叠即可

#include <iostream>#include <algorithm>#include <cstdio>#include <cstring>#include <cmath>#include <queue>#define INF 0x3f3f3f3fusing namespace std;#define F(x) ((x) / 3 + ((x) % 3 == 1 ? 0 : tb))#define G(x) ((x) < tb ? (x) * 3 + 1 :((x) - tb) * 3 + 2)const int MAXN = 70010;int wa[MAXN],wb[MAXN],ws[MAXN],wv[MAXN],wsd[MAXN],r[MAXN],sa[MAXN];int c0(int *r,int a,int b){return r[a] == r[b] && r[a + 1] == r[b + 1] && r[a + 2] == r[b + 2];}int c12(int k,int *r,int a,int b){if(k == 2) return r[a] < r[b] || r[a] == r[b] && c12(1,r,a + 1,b + 1);else return r[a] < r[b] || r[a] == r[b] && wv[a + 1]< wv[b + 1];}void sort(int *r,int *a,int *b,int n,int m){    int i;    for(i = 0 ; i < n ; i++) wv[i] = r[a[i]];    for(i = 0 ; i < m ; i++) wsd[i] = 0;    for(i = 0 ; i < n ; i++) wsd[wv[i]]++;    for(i = 1 ; i < m ; i++) wsd[i] += wsd[i - 1];    for(i = n - 1 ; i >= 0 ; i--) b[--wsd[wv[i]]] = a[i];}void dc3(int *r,int *sa,int n,int m){    int i,j,*rn = r + n ,*san = sa + n,ta = 0,tb = (n + 1) / 3,tbc = 0,p;    r[n] = r[n + 1] = 0;    for(i = 0 ; i < n ; i++) if(i % 3 != 0) wa[tbc++] = i;    sort(r + 2,wa,wb,tbc,m);    sort(r + 1,wb,wa,tbc,m);    sort(r,wa,wb,tbc,m);    for(p = 1,rn[F(wb[0])] = 0,i = 1 ; i < tbc ; i++)        rn[F(wb[i])] = c0(r,wb[i - 1],wb[i])?p - 1 : p++;    if(p < tbc) dc3(rn,san,tbc,p);    else for(i = 0 ; i < tbc ; i++) san[rn[i]] = i;    for(i = 0 ;i < tbc ; i++) if(san[i] < tb) wb[ta++] = san[i] * 3;    if(n % 3 == 1) wb[ta++] = n - 1;    sort(r,wb,wa,ta,m);    for(i = 0 ; i < tbc ; i++) wv[wb[i] = G(san[i])] = i;    for(i = 0,j = 0,p = 0 ; i < ta && j < tbc ; p++)        sa[p]=c12(wb[j] % 3,r,wa[i],wb[j]) ? wa[i++] : wb[j++];    for(;i < ta ; p++) sa[p] = wa[i++];    for(;j < tbc ; p++) sa[p] = wb[j++];}int Rank[MAXN],height[MAXN];void calheight(int *r,int *sa,int n){    int i,j,k = 0;    for(i = 1 ; i <= n ; i++) Rank[sa[i]] = i;    for(i = 0 ; i < n ; height[Rank[i++]] = k)    for(k ? k--:0,j = sa[Rank[i] - 1] ;r[i + k]==r[j + k];k++);}int a[MAXN];bool judge(int mid,int n){    int cas = 2;    while(true){        while(cas<=n && height[cas] < mid) cas++;        if(cas > n) return false;        int mn = sa[cas-1];        int mx = sa[cas-1];        while(cas<=n && height[cas] >= mid){            mn = min(mn,sa[cas]);            mx = max(mx,sa[cas]);            cas++;            if(mx-mn >= mid) return true;        }    }    return false;}int main(){    int n;    while(scanf("%d",&n),n){        for(int i = 0; i < n; ++i){            scanf("%d",&a[i]);        }        if(n < 10){            puts("0");            continue;        }        n--;        for(int i = 0; i < n; ++i){            a[i] = a[i+1]-a[i]+88;        }        a[n] = 0;//设定最后一个为最小        //176 为基数排序 在a[i]中出现最大的数加1        //n为字符串长度,m为字符的取值范围        dc3(a,sa,n+1,176);        //height数组的值应该是从height[1]开始的,而且height[1]应该是等于0的。        //原因是,因为我们在字符串后面添加了一个0号字符,        //所以它必然是最小的一个后缀。而字符串中的其他字符都应该是大于0的        //所以排名第二的字符串和0号字符的公共前缀(即height[1])应当为0.        //在调用calheight函数时,要注意height数组的范围应该是[1..n]。        //所以调用时应该是calheight(r,sa,n)而不是calheight(r,sa,n+1)。        calheight(a,sa,n);        int l = 4,r = n/2;        int ans = -1;        while(l <= r){            int mid = (l+r)>>1;            if(judge(mid,n)){                ans = mid;                l = mid+1;            }            else{                r = mid-1;            }        }        ans++;        printf("%d\n",ans);    }    return 0;}


0 0
原创粉丝点击