如何从NCBI下载SRA数据

来源:互联网 发布:修复tf卡数据 编辑:程序博客网 时间:2024/06/11 22:25

经常需要在GEO中下载测序数据原始文件,得到sra编号之后,有两种方法下载:
一、可以通过在ebi(http://www.ebi.ac.uk/)中搜索SRA编号,然后用aspera直接下载fastq文件,详情参考本博客《Chip-seq流程报告》
二、然而有的数据在ebi上并没有提供fastq文件,这个时候就只能下载SRA文件,然后用sratoolkit中的fastq-dump进行转换
后文将详细介绍第二种方法
1、首先,进入GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543
2、然后在GEO profile中搜索SRX2159543
点击:如下图所示:

点击Download data




4、右击鼠标,选择“复制下载链接”。


进入Linux下载。
5、

wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX/SRX215/SRX2159543/SRR4238252/SRR4238252.sra

或者使用aspera下载(最后那个.表示下载到当前目录)

ascp -QT -l 100M -i ~/asperaweb_id_dsa.openssh anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByExp/sra/SRX/SRX215/SRX2159543/SRR4238252/SRR4238252.sra .