基序发现问题和中间字符串问题

来源:互联网 发布:淘宝囤货 编辑:程序博客网 时间:2024/05/22 14:56

1、如果P(s)表示对应于起始位点s的剖面矩阵,我们用MP(s)(j)来表示P(s)第j列中的最大计数。定义共有序列得分Score(s,DNA)为:
 l
MP(s)(j),可用来度量起始点为s的序列谱的强度。
j=1

2、给定一组DNA序列,从每条序列中发现一组L元组片段,使得共有序列得分为最大。

输入:一个t*n阶的DNA矩阵,以及试图发现的模式的长度L

输出:含t个起始位点的数组S=(S1,S2,....,St),使得共有序列得分Score(s,DNA)取最大。

3、汉明距离dH(v,w)计算2个字符串中不相同位点的数目。dH(ATTGTC,ACTCTC)=2,定义v与位于起始点s处的L元组的汉明距离总和dH(v,s)为:

 t
dH(s)(v,Si),用TotalDistance(v,DNA)=MINs(dH(v,s))表示一个给定字符串v与DNA中任

i=1
意一组起始位点之间的汉明距离总和可能取到的最小值。

4、中间字符串问题

给定一组DNA序列,发现一个中间字符串。

输入:一个t*n阶的DNA矩阵,以及试图找到的模式的长度L

输出:一个含L个核苷酸的字符串v,遍及所有此长度的字符串,使总的汉明距离TotalDistance(v,DNA)取最小值。

即计算

 

 min      min     dH(v,s)

所有可选择的      所有可选择的

L元组片段v        起始位点s

原创粉丝点击