DNA片段装配算法

来源:互联网 发布:阿里云天池大数据竞赛 编辑:程序博客网 时间:2024/04/30 06:40

一、步骤

交叠-查找潜在的交叠片段

排列-查明片段的顺序

共有-从排列中导出DNA片段

二、具体:

交叠问题:查找一个序列的后缀和另一个序列的最好的匹配。但由于测序误差问题,在序列联配中使用修改的动态规划算法。由于误差较小,可采取过滤方法,过滤掉成对的不共享一个显著的公共子串的片段。

排列问题:确定2个片段是否是真的交叠的,还是来自一个重复体的2个不同的拷贝。

片段装配问题:校正序列读出片段的误差