基因组测序中N50和N90到底指什么?
来源:互联网 发布:知著投资 编辑:程序博客网 时间:2024/05/29 15:58
N50、N90
举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思。如果中间有gap,但是可以知道gap的长度,这样的序列就叫做scaffold, 即脚手架(非连续)的意思。然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条 contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50。很明显这个数值越大说明组装的质量越好。
即:从最长的开始倒数,数到长度为总长度一半的片段,最后一个被数到的片段越长,说明长的片段越多,最后组装的质量越好。
N90:把50%改为90%即可。
举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思。如果中间有gap,但是可以知道gap的长度,这样的序列就叫做scaffold, 即脚手架(非连续)的意思。然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条 contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50。很明显这个数值越大说明组装的质量越好。
即:从最长的开始倒数,数到长度为总长度一半的片段,最后一个被数到的片段越长,说明长的片段越多,最后组装的质量越好。
N90:把50%改为90%即可。
阅读全文
0 0
- 基因组测序中N50和N90到底指什么?
- JDK版本1.6和6.0到底指什么
- 云计算到底指什么?
- 下载基因组注释gtf文件和下载参考基因组序列
- N50 长度
- Literal和Label到底有什么区别
- Literal和Label到底有什么区别
- 二进制文件和文本文件到底有什么区别
- 360和QQ到底在玩什么?
- CIO和CTO到底有什么不同?
- bios和bootloader到底有什么区别
- driver 和 hardware 到底什么关系
- Literal和Label到底有什么区别
- C和C++到底有什么关系
- ++a和a++到底有什么区别?
- C和C++到底有什么关系
- volatile到底有什么用?和regist有什么区别?
- javascript中的this到底指什么?
- Codeforces 118E Bertown roads【边双联通】
- 迭代与递归
- oracle配置database link遇到的问题一例
- 2017/9/18学习总结
- Oracle 存储过程练习小样例
- 基因组测序中N50和N90到底指什么?
- 判断浏览器
- LeetCode 515. Find Largest Value in Each Tree Row
- Cassandra 之 入门
- day16-EL&JSTL
- 引用与指针之间的故事
- Collection 线程安全
- 扎心了,老铁!mysql编码问题引发的血案
- Linux环境变量与文件查找