生信 Fastq 文件讲解
来源:互联网 发布:淘宝卖家设置流量包 编辑:程序博客网 时间:2024/04/24 15:46
@HWUSI-EAS100R:6:73:941:1973#0/1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTT
+HWUSI-EAS100R:6:73:941:1973#0/1
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC6
上面4行为fastq文件的前4行 ,图如下
第一行以@开头,后面是reads的ID以及其他信息,例如上例中 HWUSI-EAS100R代表Illmina设备名称,6代表flowcell中的第六个lane,73代表第六个lane中的第73个tile,941:1973代表该read在该tile中的x:y坐标信息;#0,若为多样本的混合作为输入样本,则该标志代表样本的编号,用来区分个样本中的reads;/1代表paired end中的前一个read。第二行为read的序列。紧接着下面两行代表该read的质量。第三行以“+”开头,跟随者该read的名称(一般于@后面的内容相同),但有时可以省略,但“+”一定不能省。第四行代表reads的质量。这一行可以详细说一下!Illumina测序仪是按照荧光信号来判断所测序的碱基是哪一种的,例如红黄蓝绿分别对应ATCG,那么一旦出现一个紫色的信号该怎么判断呢,因此对每个结果都有一个概率的问题。起初sanger中心用Phred quality score来衡量该read中每个碱基的质量,既-10lgP ,其中P代表该碱基被测序错误的概率,如果该碱基测序出错的概率为0.001,则Q应该为30,那么30+33=63,那么63对应的ASCii码为“?”,则在第四行中该碱基对应的质量代表值即为“?”
ASCii参考如图
@HWUSI-EAS100R:6:73:941:1973#0/1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTT
+HWUSI-EAS100R:6:73:941:1973#0/1
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC6上面4行为fastq文件的前4行 ,图如下
0 0
- 生信 Fastq 文件讲解
- 生信脚本练习(5)求fastq文件的cg含量
- 生信脚本练习(7)求fastq文件质量值分布
- 生信软件之sratoolkit(sra格式转为fastq)
- FASTQ文件详解【转】
- sra文件转为fastq
- python 随机抽取Fastq文件
- 生信脚本练习(11)随机输出5条fastq序列
- 随机抽取一定比例的fastq文件
- 求大神指点,怎么读入fastq文件?
- window下使用sratoolkit将sra文件转换成fastq
- ubuntu下使用sratoolkit将sra文件转换成fastq文件
- python 从fastq文件中挑选出序列长度在规定范围的序列
- perl 从fastq文件中挑选出序列长度在规定范围的序列
- 微信开发源码讲解
- iOS-环信SDK讲解
- FastQ格式介绍
- Fastq格式详解
- JSONP实例
- MySQL中函数CONCAT及GROUP_CONCAT
- 梯度下降算法、随机梯度下降算法scala实现
- cocoa pod项目管理中的问题
- Python数组定义
- 生信 Fastq 文件讲解
- git合并分支,并且删除本地和远程分支
- Html中代码换行造成空格间距的问题解析
- afas
- 免费馅饼
- Ubuntu程序员编程利器
- block代码块基础使用(一)
- EventBus源码研读(上)
- MD5算法原理简要介绍并采用C#应用在桌面应用系统的用户登录与注册中