2017 计蒜客初赛 阿里天池的新任务(KMP算法)

来源:互联网 发布:js foreach 编辑:程序博客网 时间:2024/05/16 14:56

阿里“天池”竞赛平台近日推出了一个新的挑战任务:对于给定的一串 DNA 碱基序列 tt,判断它在另一个根据规则生成的 DNA 碱基序列 ss 中出现了多少次。

首先,定义一个序列 ww

\displaystyle w_{i} = \begin{cases}b, & i = 0\\(w_{i-1} + a) \mod n, & i > 0\end{cases}wi={b,(wi1+a)modn,i=0i>0

接下来,定义长度为 nn 的 DNA 碱基序列 ss(下标从 00 开始):

\displaystyle s_{i} = \begin{cases}A , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\T , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\\G , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\C , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\end{cases}si=A,T,G,C,(LwiR)(wi mod 2=0)(LwiR)(wi mod 2=1)((wi<L)(wi>R))(wi mod 2=0)((wi<L)(wi>R))(wi mod 2=1)

其中 \land 表示“且”关系,\lor 表示“或”关系,a\ \mathrm{mod}\ ba mod b 表示 aa 除以 bb 的余数。

现给定另一个 DNA 碱基序列 tt,以及生成 ss 的参数 n , a , b , L , Rn,a,b,L,R,求 tt 在 ss 中出现了多少次。

输入格式

数据第一行为 55 个整数,分别代表 n , a , b , L , Rn,a,b,L,R。第二行为一个仅包含ATGC的一个序列 tt

数据保证 0 < a < n,0<a<n, 0 \le b < n,0b<n, 0 \le L \le R < n,0LR<n, |t| \le 10^{6}t106a,na,n 互质。

对于简单版本,1 \leq n \leq 10^{6}1n106

对于中等版本,1 \leq n \leq 10^{9}, a = 11n109,a=1

对于困难版本,1 \leq n \leq 10^{9}1n109

输出格式

输出一个整数,为 tt 在 ss 中出现的次数。

样例说明

对于第一组样例,生成的 ss 为TTTCGGAAAGGCC

样例输入1

13 2 5 4 9AGG

样例输出1

1

样例输入2

103 51 0 40 60ACTG

样例输出2

5

思路:直接KMP即可;KMP算法链接点击打开链接


代码:

#include <bits/stdc++.h>using namespace std;char s[1000005];char t[1000005];int nexts[1000005];int lens,lent;void getnext() {    nexts[0]=-1;    int i=0,j=-1;    while(i<lent) {        if(j==-1||t[i]==t[j])            nexts[++i]=++j;else     j=nexts[j];    }}void KMP() {    int i=0,j=0,k=0;    while(i<lens) {        if(j==-1||s[i]==t[j])             ++i,++j;else     j=nexts[j];        if(j==lent)            k++,j=nexts[j];    }    printf("%d\n",k);}int main(){int n,a,b,l,r;scanf("%d %d %d %d %d",&n,&a,&b,&l,&r);int w=b-a;scanf("%s",t);for(int i=0;i<n;i++){w=(w+a)%n;if(l<=w&&w<=r&&w%2==0){s[i]='A';}else if(l<=w&&w<=r&&w%2==1){s[i]='T';}else if((w<l||r<w)&&w%2==0){s[i]='G';}else if((w<l||r<w)&&w%2==1){s[i]='C';}}lens=strlen(s),lent=strlen(t);    getnext();    KMP();return 0; }

阅读全文
1 0