whole-genome-sequencing Data Analysis 学习笔记2 软件安装
来源:互联网 发布:淘宝店铺免费推广平台 编辑:程序博客网 时间:2024/04/29 08:08
1.测序数据大小计算公式:
人类基因组(30亿个碱基)X 30(测序深度)=900亿个碱基(1800亿个字母)
900亿个碱基/150(测序策略PE150)=6亿条reads
6亿条reads X 45(每条reads的名字长度)=2070亿个字母(每个字母一个字节)
2070亿个字母 / 每个G所包含的字节数 (1024*1024*1024)=192.7838G
注释:
测序仪器下机数据的 fastq 文件中, 每条序列都对应了相同长度的质量值, 反映出每个碱基的准确性和可靠性, (现在主流用的) 计算公式为:
Q = -10log10p
而这个 p 值就是 Phred 计算出来的, 表示一个碱基被识别错误的可能性, Phred 一开始是一个软件 (或者说计算方法), 对测序仪器识别到的荧光强度 (三代的不了解) 进行评估, 针对不同仪器有不同的标准表, 然后根据表中荧光强度的范围和分辨率分析得出碱基的 p 值, Q 值为 10 就表示这个碱基有 90% 的概率是正确的, 20 就是 99%, 40 就是 4 个 9
2.查看计算资源
查看memory
free -g
反正我自己台式机很小,都是个位数,和Jimmy的没法比。。
查看core
cat /proc/cpuinfo |grep process |wc
查看storage
df -h
保证至少要有8core+16G+1T
我的台式机:3+3+14G。。不管了,先装软件
3.给笨兔兔装各种生信软件
优先挑选二进制可执行软件
创建并切换到新建文件夹biosoft
在biosoft 文件夹下创建cmake文件夹并切换,然后下载cmake
#注意这些代码是用来测试的,不要用mkdir biosoftcd ~/biosoftcd ~/biosoftmkdir cmake && cd cmakewget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz
又出现:正在解析主机 wget (wget)… 失败:域名解析暂时失败。
问题描述:无法解析下载网址
问题原因:DNS配置不正确
问题解决:通过命令 gedit /etc/resolv.conf 打开DNS配置文件,在文件中加入
nameserver 8.8.8.8 nameserver 8.8.4.4
保存退出,好了 开始正常下载
下载完成后继续安装
重新来,以下面的代码为准,因为要创建Bin,方便以后卸载
mkdir -p ~/biosoft/myBinecho 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrcsource ~/.bashrccd ~/biosoftmkdir cmake && cd cmakewget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gztar xvfz cmake-3.3.2.tar.gzcd cmake-3.3.2./configure --prefix=/home/mary/biosoft/myBinmakemake install#echo命令的功能是在显示器上显示一段文字,一般起到一个提示的作用。
Linux ./configure –prefix命令
以后便于卸载
## Download and install bowtiecd ~/biosoftmkdir bowtie && cd bowtiewget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zipunzip bowtie2-2.2.9-linux-x86_64.zip
## Download and install BWAmkdir -p ~/biosoft/myBinecho 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrcsource ~/.bashrccd ~/biosoftmkdir bwa && cd bwawget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.15.tar.bz2tar xvfj bwa-0.7.15.tar.bz2 cd bwa-0.7.15./configure --prefix=/home/mary/biosoft/myBinmakemake install
**注意上面又出现了make无法执行的问题,尝试
sudo apt-get install zlib1g-dev
问题解决
不过最后是用系统提示语句安装的。。
sudo apt install bwasudo apt install bowtiesudo apt install bowtie
上面这三个软件都是这样直接装的,顶多新建了目录,反正是系统自己提示的,目前还不知为什么
然后装samtools
## Download and install samtools## http://samtools.sourceforge.net/## http://www.htslib.org/doc/samtools.htmlcd ~/biosoftmkdir samtools && cd samtoolswget https://github.com/samtools/samtools/releases/download/1.3.1/samtools-1.3.1.tar.bz2tar xvfj samtools-1.3.1.tar.bz2cd samtools-1.3.1./configure --prefix=/home/mary/biosoft/myBinmakemake install~/biosoft/myBin/bin/samtools --help
又提示找不到文件
那退出来到根目录,看看samtools安好了没,结果系统提示:
sudo apt install samtools
那。。安吧。好了
接下来安picardtools
## Download and install picardtools## https://sourceforge.net/projects/picard/## https://github.com/broadinstitute/picardcd ~/biosoftmkdir picardtools && cd picardtoolswget http://ncu.dl.sourceforge.net/project/picard/picard-tools/1.119/picard-tools-1.119.zipunzip picard-tools-1.119.zip
去问系统,有picard tools 么,系统说没有,
sudo apt install picard-tools
所以又按系统说的安了,其实还是没安好。。待解决
千万别按成picard了,那是另一个软件,好像是个播放器。。
然后安freebayes
## Download and install freebayes## https://github.com/ekg/freebayes## http://clavius.bc.edu/~erik/CSHL-advanced-sequencing/freebayes-tutorial.htmlcd ~/biosoftmkdir freebayes && cd freebayes## wget -O freebayes-master.zip https://codeload.github.com/ekg/freebayes/zip/master## unzip freebayes-master.zipwget http://clavius.bc.edu/~erik/freebayes/freebayes-5d5b8ac0.tar.gztar xzvf freebayes-5d5b8ac0.tar.gzcd freebayesmake~/biosoft/freebayes/freebayes/bin/freebayes
系统未找到命令恩,先这样吧
然后安varscan
cd ~/biosoft## https://sourceforge.net/projects/varscan/files/## http://varscan.sourceforge.net/index.htmlmkdir VarScan && cd VarScanwget https://sourceforge.net/projects/varscan/files/VarScan.v2.3.9.jar
看不出来像安好的。
cd ~/biosoftmkdir SnpEff && cd SnpEff## http://snpeff.sourceforge.net/## http://snpeff.sourceforge.net/SnpSift.html## http://snpeff.sourceforge.net/SnpEff_manual.htmlwget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip## java -jar snpEff.jar download GRCh37.75## java -Xmx4G -jar snpEff.jar -i vcf -o vcf GRCh37.75 example.vcf > example_snpeff.vcfunzip snpEff_latest_core.zip
## https://github.com/najoshi/sicklecd ~/biosoftmkdir sickle && cd sicklewget https://codeload.github.com/najoshi/sickle/zip/master -O sickle.zipunzip sickle.zipcd sickle-mastermake~/biosoft/sickle/sickle-master/sickle -h
这种-h查看的都是安装好了的
cd ~/biosoft## http://www.usadellab.org/cms/?page=trimmomatic## http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/TrimmomaticManual_V0.32.pdfmkdir Trimmomatic && cd Trimmomaticwget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zipunzip Trimmomatic-0.36.zipjava -jar ~/biosoft/Trimmomatic/Trimmomatic-0.36/trimmomatic-0.36.jar -h
Linux下安装软件的一般步骤
- whole-genome-sequencing Data Analysis 学习笔记2 软件安装
- whole-genome-sequencing Data Analysis 学习笔记1 基本概念
- whole-genome-sequencing Data Analysis 学习笔记3: 测试数据及参考基因组的准备
- whole-genome-sequencing Data Analysis 学习笔记4 变异位点注释数据库
- whole-genome-sequencing Data Analysis 学习笔记5 全基因组测序数据的变异位点
- 【测序平台】-CP0009-illunima数据质控软件安装-sequencing-analysis-viewer
- What comes after genome sequencing?
- Ucinet学习笔记二:Data Analysis
- A novel Bayesian network inference algorithm for integrative analysis of deep sequencing data
- Data Analysis学习笔记 --- Python数据分析入门知识
- Data Analysis学习笔记 --- Python数据清洗处理时间数据
- Data Analysis学习笔记 --- Python数据清洗对数据分组
- Data Analysis学习笔记 --- python数据清洗对数据聚合
- Data Analysis学习笔记 --- Python数据清洗对字符串处理
- Data Analysis学习笔记 --- Python数据清洗正则处理字符串
- Data Analysis学习笔记 --- python数据清洗矢量处理字符串
- Python For Data Analysis笔记
- Coursera学习笔记——Developing Data Products——Presenting Data Analysis
- 运行时验证概述
- JS-checkbox多选框之全选、反选、不选
- NodeJS多核多线程的解决方案 -- pm2 之二 自启动
- hibernate面对多表查询返回装载Object对象的list的处理办法 (补16年12月)
- 求n的质因子
- whole-genome-sequencing Data Analysis 学习笔记2 软件安装
- WordPress使用百度分享插件
- Codeforces Round #394 (Div. 2)
- 字符串拷贝源码
- P1049 装箱问题
- 树莓派开发(二)----树莓派系统安装
- 【codeforces 761D】Dasha and Very Difficult Problem
- optimization
- P1060 开心的金明