JZOJ5462. 【NOIP2017提高A组冲刺11.8】好文章

来源:互联网 发布:淘宝客采集器 编辑:程序博客网 时间:2024/06/01 22:19

Description

nodgd写了一篇文章,自认为这是一篇好文章。nodgd的文章由n个小写英文字母组成。文章的一个子串指的是文章中的一段连续的字母,子串的长度就是这一段的字母个数。nodgd在文章中用了排比、对偶、前后照应之类的手法,所以就有很多个子串是相同或者相近的。为了向大家证明这是一篇好文章,nodgd决定给自己的文章进行评分。nodgd首先确定了一个整数m,然后统计出文章中有多少个不相同的长度为m的子串,这个数量就是文章的评分。
然而,nodgd懒得老老实实计算这个评分了,就把任务丢给了你。

Input

第一行包含两个整数n,m,表示文章的长度和需要统计的子串长度。
第二行包含一个长度为n的只包含小写字母的字符串。

Output

输出一行一个整数,表示文章的评分。

Sample Input

输入1:
5 3
aaaab

输入2:
9 3
abcabacba

Sample Output

输出1:
2
样例解释1:
长度为3的子串有3个,分别是aaa,aaa,aab,其中不同的只有2个。
输出2:
7
样例解释2
共有7个长度为3的子串,每个长度为3的子串都不同。

Data Constraint

对于30%的数据,1≤m≤n≤200;
对于50%的数据,1≤m≤n≤2000;
对于另外20%的数据,1≤m≤50≤n≤200000;
对于100%的数据,1≤m≤n≤200000。

题解

字符串判断是否重复,
哈希判重。
将字符串转化成为一个数,
然后就可以了。
但是要用多几个质数,否则容易出错。
这里写图片描述

code

#include<cstdio>#include<algorithm>#include<queue>#include<cstring>#define N 200003#define ll long long#define M1 2333333#define M2 998244353using namespace std;char ch;void read(int& n){    n=0;    for(ch=getchar();ch<'0'||ch>'9';ch=getchar());    for(;'0'<=ch && ch<='9';n=(n<<3)+(n<<1)+ch-48,ch=getchar());}void G(char &ch){    for(ch=getchar();ch<'a'||ch>'z';ch=getchar());}int n,m,ans;ll z1[N],z2[N],p[N],s1,s2,h[M1][2];bool ins(){    int x=s1%M1;    while((h[x][0]!=0 || h[x][1]!=0)&&(h[x][0]!=s1 || h[x][1]!=s2))x=(x+1)%M1;    if(h[x][0]==s1 && h[x][1]==s2)return 0;    h[x][0]=s1;    h[x][1]=s2;    return 1;}int main(){    freopen("article.in","r",stdin);    freopen("article.out","w",stdout);    read(n);read(m);    z1[0]=z2[0]=1;    for(int i=1;i<=m;i++)        z1[i]=z1[i-1]*m%M1,z2[i]=z2[i-1]*m%M2,G(ch),p[i]=ch-48;    s1=s2=0;    for(int i=1;i<=m;i++)        s1=(z1[m-i]*p[i]+s1)%M1,s2=(z2[m-i]*p[i]+s2)%M2;    ans=1;    ins();    for(int i=m+1;i<=n;i++)    {        G(ch),p[i]=ch-48;        s1=(s1-z1[m-1]*p[i-m]%M1+M1)%M1;        s2=(s2-z2[m-1]*p[i-m]%M2+M2)%M2;        s1=(s1*m+p[i])%M1;        s2=(s2*m+p[i])%M2;        if(ins())ans++;    }    printf("%d\n",ans);    return 0;}
原创粉丝点击