Distinct Substrings后缀数组

来源:互联网 发布:移动云计算 编辑:程序博客网 时间:2024/05/23 01:06

说好的每日一题,,今天的第二道后缀数组,睡觉前看了一眼,觉得比较简单,果然过了。

求不相同的子串的个数,很明显,求出相同的有几个,即height的和,用总的情况n*(n-\+1)/2减去就好了。

因为每个后缀串只能产生他长度个子串,(只能从后缀串的开头开始,如果不从开头的话那他后面那个后缀串就会和他重复!!)

#include<iostream>#include<stdio.h>#include<string.h>#define rep(i,n) for(int i = 0;i < n; i++)using namespace std;const int size  = 200005,INF = 1<<30;char s[size];int rk[size],sa[size],height[size],w[size],wa[size],res[size];void getSa (int len,int up) {int *k = rk,*id = height,*r = res, *cnt = wa;rep(i,up) cnt[i] = 0;rep(i,len) cnt[k[i] = w[i]]++;rep(i,up) cnt[i+1] += cnt[i];for(int i = len - 1; i >= 0; i--) {sa[--cnt[k[i]]] = i;}//初始化int d = 1,p = 0;while(p < len){for(int i = len - d; i < len; i++) id[p++] = i;rep(i,len)if(sa[i] >= d) id[p++] = sa[i] - d;//id保存了按后h/2排序的的序列,即排第i的后h/2的是原数组中的哪一个,往前d个找开头rep(i,len) r[i] = k[id[i]];   //重新构造串!rep(i,up) cnt[i] = 0;rep(i,len) cnt[r[i]]++;rep(i,up) cnt[i+1] += cnt[i];for(int i = len - 1; i >= 0; i--) {sa[--cnt[r[i]]] = id[i];}swap(k,r);p = 0;k[sa[0]] = p++; //更新字符上限rep(i,len-1) {if(sa[i]+d < len && sa[i+1]+d <len &&r[sa[i]] == r[sa[i+1]]&& r[sa[i]+d] == r[sa[i+1]+d])k[sa[i+1]] = p - 1;else k[sa[i+1]] = p++;}if(p >= len) return ; //超出len,直接结束d *= 2,up = p, p = 0;}}void getHeight(int len) {rep(i,len) rk[sa[i]] = i;height[0] =  0;for(int i = 0,p = 0; i < len - 1; i++) {int j = sa[rk[i]-1];while(i+p < len&& j+p < len&& w[i+p] == w[j+p]) {p++;}height[rk[i]] = p;p = max(0,p - 1);}}int main(){    int T,n,up;    scanf("%d",&T);    getchar();    while(T--)    {        up=0;        gets(s);        n=strlen(s);        for(int i=0;i<n;i++)            {                w[i]=s[i];                up=max(up,w[i]);            }        w[n++]=0;       // up=300;        getSa(n,up+1);       // printf("ASDF\n");        getHeight(n);        int ans=0;        for(int i=0;i<n;i++)            ans+=height[i];        printf("%d\n",(n-1)*n/2-ans);//前面n++过了,所以要减一    }    return 0;}

额,发现了一道一模一样的题目,数据范围大了点,名字叫New Distinct Substrings,串长50000(坑爹呢。。结果我就把刚刚的代码又交了一遍,wa,,,,这,原来是ans范围大了,用long long ...跪了

0 0
原创粉丝点击