whole-genome-sequencing Data Analysis 学习笔记2 软件安装

来源:互联网 发布:淘宝店铺免费推广平台 编辑:程序博客网 时间:2024/04/29 08:08

1.测序数据大小计算公式:

人类基因组(30亿个碱基)X 30(测序深度)=900亿个碱基(1800亿个字母)
900亿个碱基/150(测序策略PE150)=6亿条reads
6亿条reads X 45(每条reads的名字长度)=2070亿个字母(每个字母一个字节)
2070亿个字母 / 每个G所包含的字节数 (1024*1024*1024)=192.7838G

注释:
测序仪器下机数据的 fastq 文件中, 每条序列都对应了相同长度的质量值, 反映出每个碱基的准确性和可靠性, (现在主流用的) 计算公式为:
Q = -10log10p
而这个 p 值就是 Phred 计算出来的, 表示一个碱基被识别错误的可能性, Phred 一开始是一个软件 (或者说计算方法), 对测序仪器识别到的荧光强度 (三代的不了解) 进行评估, 针对不同仪器有不同的标准表, 然后根据表中荧光强度的范围和分辨率分析得出碱基的 p 值, Q 值为 10 就表示这个碱基有 90% 的概率是正确的, 20 就是 99%, 40 就是 4 个 9

2.查看计算资源
查看memory

free -g

反正我自己台式机很小,都是个位数,和Jimmy的没法比。。
查看core

cat /proc/cpuinfo |grep process |wc

查看storage

df -h

保证至少要有8core+16G+1T
我的台式机:3+3+14G。。不管了,先装软件

3.给笨兔兔装各种生信软件
优先挑选二进制可执行软件
创建并切换到新建文件夹biosoft
在biosoft 文件夹下创建cmake文件夹并切换,然后下载cmake

#注意这些代码是用来测试的,不要用mkdir biosoftcd ~/biosoftcd ~/biosoftmkdir cmake &&  cd cmakewget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz

又出现:正在解析主机 wget (wget)… 失败:域名解析暂时失败。
问题描述:无法解析下载网址
问题原因:DNS配置不正确
问题解决:通过命令 gedit /etc/resolv.conf 打开DNS配置文件,在文件中加入

 nameserver 8.8.8.8 nameserver 8.8.4.4

保存退出,好了 开始正常下载

下载完成后继续安装

重新来,以下面的代码为准,因为要创建Bin,方便以后卸载

mkdir -p  ~/biosoft/myBinecho 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrcsource ~/.bashrccd ~/biosoftmkdir cmake &&  cd cmakewget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gztar xvfz cmake-3.3.2.tar.gzcd cmake-3.3.2./configure --prefix=/home/mary/biosoft/myBinmakemake install#echo命令的功能是在显示器上显示一段文字,一般起到一个提示的作用。

Linux ./configure –prefix命令
以后便于卸载

## Download and install bowtiecd ~/biosoftmkdir bowtie &&  cd bowtiewget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zipunzip bowtie2-2.2.9-linux-x86_64.zip
## Download and install BWAmkdir -p  ~/biosoft/myBinecho 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrcsource ~/.bashrccd ~/biosoftmkdir bwa &&  cd bwawget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.15.tar.bz2tar xvfj bwa-0.7.15.tar.bz2 cd bwa-0.7.15./configure --prefix=/home/mary/biosoft/myBinmakemake install

**注意上面又出现了make无法执行的问题,尝试

sudo apt-get install zlib1g-dev

问题解决
不过最后是用系统提示语句安装的。。

sudo apt install bwasudo apt install bowtiesudo apt install bowtie

上面这三个软件都是这样直接装的,顶多新建了目录,反正是系统自己提示的,目前还不知为什么

然后装samtools

## Download and install samtools## http://samtools.sourceforge.net/## http://www.htslib.org/doc/samtools.htmlcd ~/biosoftmkdir samtools &&  cd samtoolswget https://github.com/samtools/samtools/releases/download/1.3.1/samtools-1.3.1.tar.bz2tar xvfj samtools-1.3.1.tar.bz2cd samtools-1.3.1./configure --prefix=/home/mary/biosoft/myBinmakemake install~/biosoft/myBin/bin/samtools --help

又提示找不到文件
那退出来到根目录,看看samtools安好了没,结果系统提示:

sudo apt install samtools

那。。安吧。好了

接下来安picardtools

## Download and install picardtools## https://sourceforge.net/projects/picard/## https://github.com/broadinstitute/picardcd ~/biosoftmkdir picardtools &&  cd picardtoolswget http://ncu.dl.sourceforge.net/project/picard/picard-tools/1.119/picard-tools-1.119.zipunzip picard-tools-1.119.zip

去问系统,有picard tools 么,系统说没有,

sudo apt install picard-tools

所以又按系统说的安了,其实还是没安好。。待解决
千万别按成picard了,那是另一个软件,好像是个播放器。。

然后安freebayes

## Download and install freebayes## https://github.com/ekg/freebayes## http://clavius.bc.edu/~erik/CSHL-advanced-sequencing/freebayes-tutorial.htmlcd ~/biosoftmkdir freebayes &&  cd freebayes## wget -O freebayes-master.zip  https://codeload.github.com/ekg/freebayes/zip/master## unzip freebayes-master.zipwget http://clavius.bc.edu/~erik/freebayes/freebayes-5d5b8ac0.tar.gztar xzvf freebayes-5d5b8ac0.tar.gzcd freebayesmake~/biosoft/freebayes/freebayes/bin/freebayes

系统未找到命令恩,先这样吧

然后安varscan

cd ~/biosoft## https://sourceforge.net/projects/varscan/files/## http://varscan.sourceforge.net/index.htmlmkdir VarScan  &&  cd VarScanwget https://sourceforge.net/projects/varscan/files/VarScan.v2.3.9.jar

看不出来像安好的。

cd ~/biosoftmkdir SnpEff &&  cd SnpEff##  http://snpeff.sourceforge.net/##  http://snpeff.sourceforge.net/SnpSift.html##  http://snpeff.sourceforge.net/SnpEff_manual.htmlwget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip## java -jar snpEff.jar download GRCh37.75## java -Xmx4G -jar snpEff.jar -i vcf -o vcf GRCh37.75 example.vcf > example_snpeff.vcfunzip snpEff_latest_core.zip
## https://github.com/najoshi/sicklecd ~/biosoftmkdir sickle && cd sicklewget https://codeload.github.com/najoshi/sickle/zip/master -O sickle.zipunzip sickle.zipcd sickle-mastermake~/biosoft/sickle/sickle-master/sickle -h

这种-h查看的都是安装好了的

cd ~/biosoft## http://www.usadellab.org/cms/?page=trimmomatic## http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/TrimmomaticManual_V0.32.pdfmkdir Trimmomatic && cd Trimmomaticwget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zipunzip Trimmomatic-0.36.zipjava -jar ~/biosoft/Trimmomatic/Trimmomatic-0.36/trimmomatic-0.36.jar -h

Linux下安装软件的一般步骤

0 0
原创粉丝点击