bam/sam 数据格式的介绍 (一)
来源:互联网 发布:python字典转化 编辑:程序博客网 时间:2024/05/16 08:40
1.bam文件读取
samtools view xxx.bam
samtools view xxx.bam |less
2.bam和sam的区别与一致
sam是带有比对信息的序列文件(即告诉你这个reads在染色体上的位置等),用于储存序列数据(SAM format is a generic format for storing large nucleotide sequence alignments. )。
BAM is the compressed binary version of the Sequence Alignment/Map (SAM) format. 生物信息中的二进制文件主要是为了节约空间,计算机机可读。可以用samtools工具实现sam和bam文件之间的转化。
二者都是fastq文件经过序列比对或者mapping后输出的格式(其储存的信息都是一致的)
3.资料来源:
Samtools官网:http://samtools.sourceforge.net/
UCSC 上对BAM Track Format介绍:genome.ucsc.edu/goldenPath/help/bam.html
Samtools应用实例:https://wikis.utexas.edu/display/CoreNGSTools/SAM+format+and+samtools
Samtools参考文献:The Sequence alignment/map (SAM) format and SAMtools
对SAM每一列的详细解释: http://genome.sph.umich.edu/wiki/SAM
SAM格式解释及specification介绍: http://davetang.org/wiki/tiki-index.php?page=SAM
能利用或产生SAM/BAM的NGS软件:http://samtools.sourceforge.net/swlist.shtml
4.格式(sam与bam格式是一致)
SAM格式分为header section(头部分,注释信息,以@开头,可有可无)和alignment section(比对结果)两个部分。
其中header section用不同的tag表示不同的信息,主要有@HD,说明符合标准的版本、对比序列的排列顺序;@SQ,参考序列说明;@RG,比对上的序列(read)说明;@PG,使用的程序说明;@CO,任意的说明信息。Tag以键值对的形式存在。
alignment section 必须由11个字段组成 ,以tab分开。如果其内容没有获得,可以用*或者0代替。
QNAME, FLAG, RNAME, POS, MAPQ, CIGAR, MRNM, MPOS, ISIZE, SEQ, QUAL
samtools view xxx.bam
samtools view xxx.bam |less
2.bam和sam的区别与一致
sam是带有比对信息的序列文件(即告诉你这个reads在染色体上的位置等),用于储存序列数据(SAM format is a generic format for storing large nucleotide sequence alignments. )。
BAM is the compressed binary version of the Sequence Alignment/Map (SAM) format. 生物信息中的二进制文件主要是为了节约空间,计算机机可读。可以用samtools工具实现sam和bam文件之间的转化。
二者都是fastq文件经过序列比对或者mapping后输出的格式(其储存的信息都是一致的)
3.资料来源:
Samtools官网:http://samtools.sourceforge.net/
UCSC 上对BAM Track Format介绍:genome.ucsc.edu/goldenPath/help/bam.html
Samtools应用实例:https://wikis.utexas.edu/display/CoreNGSTools/SAM+format+and+samtools
Samtools参考文献:The Sequence alignment/map (SAM) format and SAMtools
对SAM每一列的详细解释: http://genome.sph.umich.edu/wiki/SAM
SAM格式解释及specification介绍: http://davetang.org/wiki/tiki-index.php?page=SAM
能利用或产生SAM/BAM的NGS软件:http://samtools.sourceforge.net/swlist.shtml
4.格式(sam与bam格式是一致)
SAM格式分为header section(头部分,注释信息,以@开头,可有可无)和alignment section(比对结果)两个部分。
其中header section用不同的tag表示不同的信息,主要有@HD,说明符合标准的版本、对比序列的排列顺序;@SQ,参考序列说明;@RG,比对上的序列(read)说明;@PG,使用的程序说明;@CO,任意的说明信息。Tag以键值对的形式存在。
alignment section 必须由11个字段组成 ,以tab分开。如果其内容没有获得,可以用*或者0代替。
QNAME, FLAG, RNAME, POS, MAPQ, CIGAR, MRNM, MPOS, ISIZE, SEQ, QUAL
阅读全文
0 0
- bam/sam 数据格式的介绍 (一)
- bam/sam 数据格式的介绍 (二)
- sam to bam文件出错
- SAM/BAM ALIGNMENT FORMAT 格式说明
- SAM/BAM格式文件操作软件samtools使用说明
- GPS的数据格式介绍
- GPS的数据格式介绍
- 使用samtools来对sam/bam/cram相互转换
- WSO2-BAM的FAQ
- JSON数据格式(一)
- 转载:GPS的数据格式介绍
- 【hive】hive的数据格式介绍
- 跟Sam大叔学JS(一)
- SAM数据格式学习1之CIGAR理解
- SAM数据格式学习2之FLAG理解
- SAM数据格式学习3之官方文档
- .sam 文件介绍
- java中的一些数据格式的声明、使用(一)
- 动态代理之JDK
- java敏感词过滤
- 简单学生选课系统之课程基本信息
- Unity Shader之Stencil Buffer
- ini_set ( )—用来设置php.ini的各种配置值
- bam/sam 数据格式的介绍 (一)
- IOS-禁用右滑返回的两种方式
- 文化传媒婚纱摄影类网站织梦模板免费下载
- CSS工作原理及选择符
- Kafka 0.9+Zookeeper3.4.6集群搭建、配置
- 两个Integer的值比较
- 将多个BIN文件合成一个
- dialogActivity窗口化后避免点击区域外消失的办法
- Bugly的接入时出现 “已安装了存在签名冲突的同名数据包” 问题