《DNA比对》蓝桥杯复赛试题
来源:互联网 发布:爱克折弯机编程视频 编辑:程序博客网 时间:2024/06/05 09:13
题目描述
脱氧核糖核酸即常说的DNA,是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为:A、G、C、T。
DNA携带的遗传信息可以用形如:AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差,这才最终造就了生物的多样性。
为了简化问题,我们假设,DNA在复制的时候可能出现的偏差是(理论上,对每个碱基被复制时,都可能出现偏差):
1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为:AGT
2. 错码,例如把 AGGT 复制成了:AGCT
3. 重码,例如把 AGGT 复制成了:AAGGT
如果某DNA串a,最少要经过 n 次出错,才能变为DNA串b,则称这两个DNA串的距离为 n。
例如:AGGTCATATTCC 与 CGGTCATATTC 的距离为 2
你的任务是:编写程序,找到两个DNA串的距离。
【输入、输出格式要求】
用户先输入整数n(n<100),表示接下来有2n行数据。
接下来输入的2n行每2行表示一组要比对的DNA。(每行数据长度<10000)
程序则输出n行,表示这n组DNA的距离。
例如:用户输入:
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT
则程序应输出:
1
1
2
思路分析
看了好几篇动态规划的文章,终于明白这个题是怎么做的了,后天就是决赛了,只能水一把了~
相关文章链接:
动态规划:从新手到专家
最短编辑距离变形----DNA对比问题
动态规划经典五题
与其说是DNA比对,不如说是字符串比对,用户输入两个字符串str1和str2,我们把str1作为标准串,由str2变为标准串可以通过重复,丢失和修改三种方法。
重复就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = A ,str2[i+2]=C
丢失就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = T
修改就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = G,str2[i+2]=T
我们假设str1的长度为len1,str2的长度为len2,用数组dp[len1][len2]表示str2变化为str1最少需要几步,也就是我们最后的答案。
我们把这个问题细化,假设dp[i][j]表示str2的字串str1[0]~str1[i-1]变成str1的字串str2[0]~str2[j-1]最少需要的步数
那么对于dp[i][j]可能有两种情况:
str1[i] == str2[j] ,这个时候,dp[i][j] = dp[i-1][j-1]
str1[i] != str2[j] ,这个时候,分为三种情况:
重复的情况:dp[i][j] = dp[i][j-1] +1
ACT
ACTT
dp[3][4] = dp[3][3] +1,因为此时str2的子串比str1的子串多出了一个字符,所以让j回到多出的那个字符前面再进行比较,得到dp[i][j-1]然后在进行了一步重复操作,所以+1
丢失的情况:dp[i][j] = dp[i-1][j] +1
ACTT
ACT
dp[4][3] = dp[3][3] +1 ,因为此时str2的子串比str1的子串丢失了一个字符,所以让i回到丢失的那个字符的前面在进行比较,得到dp[i-1][j]然后再进行一步丢失操作,所以+1
修改的情况:dp[i][j] = dp[i-1][j-1]+1
ACT
AGT
dp[3][3] = dp[2][2]
dp[2][2] = dp[1][1]+1,因为此时str1的子串和str2的长度相同,但是字符不一样,所以i-1,j-1回到上一个状态,然后再+1
编写代码
show you code:
#include<iostream>#include<string.h> using namespace std;int dp[10000][10000];int min(int a,int b,int c){int min = (a<b)? a:b;return (min<c)? min:c; } int dp_fun(string &str1,string &str2){int len1 = str1.length();int len2 = str2.length();int i,j;for(i=0;i<len1;i++){dp[i][0] = i ;}for(j=0;j<len2;j++){dp[0][j] = j ;}for(i=1;i<=len1;i++){for(j=1;j<=len2;j++){if(str1[i-1] == str2[j-1]){dp[i][j] = dp[i-1][j-1];//对应字母相等,dp值不增加 }else{//三个形参分别对应str2在str1的基础上增加,减少和修改的情况 dp[i][j] = min( dp[i][j-1]+1 , dp[i-1][j]+1 , dp[i-1][j-1]+1 );} }}return dp[len1][len2];}int main(){int n;string str1,str2;cin>>n;while(n--){cin>>str1;cin>>str2;cout<<dp_fun(str1,str2)<<endl;}return 0;}
- 《DNA比对》蓝桥杯复赛试题
- 蓝桥杯 2012 4 DNA比对
- DNA比对(DP)
- DNA比对算法:BWT
- 蓝桥杯java第三届决赛第四题--DNA比对
- 【复赛模拟试题】新斯诺克 逆序对
- 《星期几》 蓝桥杯复赛试题
- DNA比对--蓝桥杯国赛j历年真题
- 【复赛模拟试题】求和
- 【复赛模拟试题】收费站
- 【复赛模拟试题】河床
- 2012年第三届蓝桥杯C/C++程序设计本科B组决赛 DNA比对
- NOIP2010提高组复赛试题
- NOIP2010提高组复赛试题
- 【复赛模拟试题】计数排序
- 【复赛模拟试题】 物品选取
- 【复赛模拟试题】学生公寓 贪心
- 用动态规划法求解生物信息学中DNA序列比对的问题 (交叉学科应用实验)
- JRE、JDK和SDK分别是什么
- VBA在Excel中的应用(四)
- 写的不错的文章
- MFC 定时器
- 【剑指offer】翻转单词顺序
- 《DNA比对》蓝桥杯复赛试题
- 网络管理实验2——MRTG软件的运行和应用
- xcode报错:Command /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/b
- android camera(一):camera模组CMM介绍
- 序列中的众数
- ruby on rails 中使用boot strap(先存起来,还没试过)
- AFNetworking使用
- XML Catalog 介绍
- linux下安装qq(苦海无涯回头是岸)