HDU 4029 Distinct Sub-matrix 后缀数组 + Hash 2011年上海网络赛I题

来源:互联网 发布:学校宿舍网络设计 编辑:程序博客网 时间:2024/05/02 01:02
题目大意:

就是现在给出一个N*M的字符矩阵, 包含N*M个大写字母, 求其有多少个本质不同的子矩阵N, M <= 128


大致思路:

这个题目当时想的时候以为是AC自动机来进行匹配, 但是128*128*128*128的复杂度太高了
当时还是没有仔细想这个题, 其实考虑一维的字符串中计算不同的子串个数的时候, 用到的后缀数组的方法, 就应该知道这题怎么做的
首先需要降维, 我们枚举当前寻找的不同数量的矩阵的宽度w, 那么枚举一共M次, 
对于每一次枚举, 根据不同的起始列 i, 那么对于字符串矩阵S[N][M], 处理成这样的形式: S[0][0~w - 1], S[1][0~w - 1].... S[N - 1][0~w - 1], S[0][1~w], S[1][1~w].. S[N - 1][1~w], S[0][2~w + 1]...... S[N - 1][M - w ~ M - 1] 那么用对应的Hash值对应这些串的话, 将hash值离散化之后就能得到一个正常的整数序列, 将每N个整数中插入一个没有出现过的数作为分隔符, 那么宽度为w的不同矩阵个数就正好是这个整数序列的不同子串个数了, 当然要求不包含分隔符
于是剩下的就是一个简单的后缀数组解决的问题了, 总体时间复杂度 128*128*128*log128
降维的思想很重要, 将问题与低维度的类似问题进行类比也是很有用的思想

代码如下:
Result  :  Accepted     Memory  :  3172 KB     Time  :  1903 ms
/* * Author: Gatevin * Created Time:  2015/7/20 20:14:23 * File Name: A.cpp */#include<iostream>#include<sstream>#include<fstream>#include<vector>#include<list>#include<deque>#include<queue>#include<stack>#include<map>#include<set>#include<bitset>#include<algorithm>#include<cstdio>#include<cstdlib>#include<cstring>#include<cctype>#include<cmath>#include<ctime>#include<iomanip>using namespace std;const double eps(1e-8);typedef long long lint;typedef unsigned long long ulint;#define maxn 130*130#define rank rrank#define ws Ws#define end eeeeendint wa[maxn], wb[maxn], wv[maxn], ws[maxn];int cmp(int* r, int a, int b, int l){    return r[a] == r[b] && r[a + l] == r[b + l];}void da(int *r, int *sa, int n, int m){    int *x = wa, *y = wb, *t, i, j, p;    for(i = 0; i < m; i++) ws[i] = 0;    for(i = 0; i < n; i++) ws[x[i] = r[i]]++;    for(i = 1; i < m; i++) ws[i] += ws[i - 1];    for(i = n - 1; i >= 0; i--) sa[--ws[x[i]]] = i;    for(j = 1, p = 1; p < n; j <<= 1, m = p)    {        for(p = 0, i = n - j; i < n; i++) y[p++] = i;        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i] - j;        for(i = 0; i < n; i++) wv[i] = x[y[i]];        for(i = 0; i < m; i++) ws[i] = 0;        for(i = 0; i < n; i++) ws[wv[i]]++;        for(i = 1; i < m; i++) ws[i] += ws[i - 1];        for(i = n - 1; i >= 0; i--) sa[--ws[wv[i]]] = y[i];        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i++)            x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;    }    return;}int rank[maxn], height[maxn];void calheight(int *r, int *sa, int n){    int i, j, k = 0;    for(i = 1; i <= n; i++) rank[sa[i]] = i;    for(i = 0; i < n; height[rank[i++]] = k)        for(k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k++);    return;}ulint seed = 50009uLL;ulint H[130][130];ulint xp[130];int n, m;void init(){    xp[0] = 1;    for(int i = 1; i < 130; i++)        xp[i] = xp[i - 1]*seed;}ulint askHash(int i, int l, int r){    if(l == 0) return H[i][r];    else return H[i][r] - H[i][l - 1]*xp[r - l + 1];}char maz[130][130];ulint h[130*130];map<ulint, int> M;int s[130*130], sa[130*130];int end[130*130];int main(){    init();    int T;    scanf("%d", &T);    for(int cas = 1; cas <= T; cas++)    {        scanf("%d %d", &n, &m);        for(int i = 0; i < n; i++)            scanf("%s", maz[i]);        for(int i = 0; i < n; i++)        {            H[i][0] = maz[i][0] - 'A' + 1;            for(int j = 1; j < m; j++)                H[i][j] = H[i][j - 1]*seed + maz[i][j] - 'A' + 1;        }        lint ans = 0;        for(int w = 1; w <= m; w++)//枚举矩阵的宽度        {            M.clear();            int cnt = 1;            int len = 0;            for(int j = 0; j + w - 1 < m; j++)//多列的起点            {                for(int i = 0; i < n; i++)//                {                    h[j*n + i] = askHash(i, j, j + w - 1);                    if(M[h[j*n + i]] == 0)                        M[h[j*n + i]] = cnt++;                    s[len++] = M[h[j*n + i]];                }                for(int i = 0; i <= n; i++)                    end[len - i] = len;                s[len++] = cnt++;            }            len--;            s[len] = 0;            da(s, sa, len + 1, cnt);            calheight(s, sa, len);            for(int i = 1; i <= len; i++)                ans += end[sa[i]] - sa[i] - height[i];                    }        printf("Case #%d: %I64d\n", cas, ans);    }    return 0;}


0 0
原创粉丝点击