测序质量值的意义

来源:互联网 发布:石墨烯电池技术知乎 编辑:程序博客网 时间:2024/04/29 03:29

续上一篇,FASTQ格式的每第四行表示这条序列的质量值。用ACSII码表示。


测序仪一般是按照荧光信号来判断所测序的碱基是哪一种的,例如红黄蓝绿分别对应ATCG,因此对每个结果的判断都是一个概率的问题。

Phred Quality ScoreProbability of incorrect base callBase call accuracy101 in 1090 %201 in 10099 %301 in 100099.9 %401 in 1000099.99 %501 in 10000099.999 %

最初Sanger中心用Phred Quality Score来衡量该read中每个碱基的质量,Q=-10logP ,其中P代表该碱基被测序错误的概率,如果该碱基测序出错的概率为0.001,则Q应该为30,那么30+33=63,那么63对应的ASCii码为“?”,则在该碱基对应的质量值即“?”。

Solexa系列测序仪使用不同的公示来计算质量值:Q=-10log(P/1-P)

在测序质量较高时,这两个算法得到的Q值没有显著差异。如下图所示


不同测序平台,在表示质量值时选择的字符区段也有差异:

Sanger = Q+33;Solexa = Q+64


1 0
原创粉丝点击