阿里天池的新任务(简单)【字符串匹配哈希算法】 计蒜客初赛第一场

来源:互联网 发布:邮政网络培训学院登录 编辑:程序博客网 时间:2024/05/29 10:56

阿里天池的新任务(简单)【字符串匹配哈希算法】  计蒜客初赛第一场

阿里“天池”竞赛平台近日推出了一个新的挑战任务:对于给定的一串 DNA 碱基序列 tt,判断它在另一个根据规则生成的 DNA 碱基序列 ss 中出现了多少次。

首先,定义一个序列 ww

\displaystyle w_{i} = \begin{cases}b, & i = 0\\(w_{i-1} + a) \mod n, & i > 0\end{cases}wi={b,(wi1+a)modn,i=0i>0

接下来,定义长度为 nn 的 DNA 碱基序列 ss(下标从 00 开始):

\displaystyle s_{i} = \begin{cases}A , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\T , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\\G , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\C , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\end{cases}si=A,T,G,C,(LwiR)(wi mod 2=0)(LwiR)(wi mod 2=1)((wi<L)(wi>R))(wi mod 2=0)((wi<L)(wi>R))(wi mod 2=1)

其中 \land 表示“且”关系,\lor 表示“或”关系,a\ \mathrm{mod}\ ba mod b 表示 aa 除以 bb 的余数。

现给定另一个 DNA 碱基序列 tt,以及生成 ss 的参数 n , a , b , L , Rn,a,b,L,R,求 tt  ss 中出现了多少次。

输入格式

数据第一行为 55 个整数,分别代表 n , a , b , L , Rn,a,b,L,R。第二行为一个仅包含ATGC的一个序列 tt

数据保证 0 < a < n,0<a<n, 0 \le b < n,0b<n, 0 \le L \le R < n,0LR<n, |t| \le 10^{6}t106a,na,n 互质。

对于简单版本,1 \leq n \leq 10^{6}1n106

对于中等版本,1 \leq n \leq 10^{9}, a = 11n109,a=1

对于困难版本,1 \leq n \leq 10^{9}1n109

输出格式

输出一个整数,为 tt  ss 中出现的次数。

样例说明

对于第一组样例,生成的 ss TTTCGGAAAGGCC

样例输入1

13 2 5 4 9AGG
#include <stdio.h>#include <bits/stdc++.h>#define mod 1000000007typedef long long ll;using namespace std;ll n,a,b,l,r;char vis[1000005],s[1000005];int main(){ cin>>n>>a>>b>>l>>r;cin>>s;ll w=b;for(int i=0;i<n;i++){if(l<=w && w<=r){if(w%2==0) vis[i]='A';else vis[i]='T';}else{if(w%2==0) vis[i]='G';else vis[i]='C';}w=(w+a)%n;}int ans=0;int lenb=strlen(s);  ll k1=0,k2=0,t=1;       //k1计算 s串的哈希值 for(int i=0;i<lenb;i++) k1=k1*mod+s[i];        for(int i=0;i<lenb;i++) t=t*mod;     //计算最高位的哈希值 for(int i=0;i<lenb;i++) k2=k2*mod+vis[i];   //计算vis串跟 s长度一样的哈希值 for(int i=0;i<n-lenb+1;i++){if(k2==k1) ans++;     //哈希值相同 说明答案一样 k2=k2*mod+vis[i+lenb]-t*vis[i];  //计算下一个子串的哈希值 }cout<<ans<<endl;return 0;} 




阅读全文
1 0
原创粉丝点击