RNA-Seq数据去接头(Adapter)
来源:互联网 发布:长沙军鸽软件怎么样 编辑:程序博客网 时间:2024/04/30 14:25
1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。
2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不同的样品。
3、insert是用于测序的目标片段,因为是包括在两个adapter之间,所以被称为“插入”片段。
一个常见测序片段类似与adapter--barcode--insert--adapter。测序开始时前几个碱基无法测得,第一个adapter在数据输出时被去除;由于测序仪读长限制,第二个adapter通常无法测得。所以,经常得到类似 barcode--部分insert的read。最后,把barcode去除,只保留测度insert的片段,这个操作的术语是demultiplexing。但是有时候测序时会测穿,也就是说会得到barcode--insert的read--部分adapter,那么这里就包含了接头了,这里的接头也就是大家经常说去接头要去除的部分。
假设我有一个双端测序的数据,最原始的没有去除接头的,然后公司也告诉了我接头序列
接头序列:
adapt1:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
adapt2:GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNNNNNATCTCGTATGCCGTCTTCTGCTTG
NNNNNN:barcode
barcode:
使用cutadapt进行去除接头操作
跟进cutadapt教程主要有几个参数:-a:左端reads的接头-A:右端reads的接头,注意右端出现的接头是因为侧穿了,所以他的接头序列是左端reads的接头的反向互补序列-m:表示去除接头后如果read长度小于这个m值就不要了--pair-filter:采用双末端模式来去除接头,保持两端数据匹配完整命令如下:cutadapt -a adapt2 -A adapt1_REV -m 20 --pair-filter=both -o out_fq1 -p out_fq2 fq1 fq2
例子完整命令:
先安装cutadapt:
pip install cutadapt
按照上面流程进行构建命令:
cutadapt -a GATCGGAAGAGCACACGTCTGAACTCCAGTCACAGTCAAATCTCGTATGCCGTCTTCTGCTTG -A AGATCGGAAGAGCGTCGTGTAGGGAA
结果如下:
- RNA-Seq数据去接头(Adapter)
- RNA-Seq数据分析
- RNA-Seq
- 关于RNA-seq数据集的小结
- NGS项目一:RNA-Seq数据的Workflow
- RNA-seq analysis (practice)
- RNA-Seq名词解释
- RNA-seq流程报告
- RNA-seq experiment
- RNA-seq与miRNA-seq联合分析
- RNA-seq 基本分析流程
- RNA-seq数据处理流程(以胶质瘤数据为例)
- RNA-seq 流程、问题总结(一)
- RNA-Seq De novo Assembly Using Trinity
- RNA-seq差异表达分析工作流程
- 基于参考注释的RNA-seq分析
- RNA-seq Experimental Design and Quality Control
- 基于RNA-seq的基因表达分析
- 如何使用Windows登录Linux
- java的设计模式,是什么?
- 遇见Servlet
- 冒泡排序及其优化
- java多线程总结(7)
- RNA-Seq数据去接头(Adapter)
- Zz
- 1030. 完美数列(25)
- 2017 计蒜之道 初赛 第五场@
- UI设计师不可不知的安卓屏幕知识
- 【计组】-- 存储系统和结构(2):主存储器的连接和控制
- shell测试判断
- python爬虫(多线程&锁&信号量)
- ipython安装