如何使用Mega cc
来源:互联网 发布:淘宝抽检一般发到哪里 编辑:程序博客网 时间:2024/04/29 23:30
如何使用Mega cc
Table of Contents
- 1 github地址:
- 2 下载
- 3 使用
- 3.1 安装
- 3.2 输入文件
- 3.3 输出文件
- 3.4 运行MEGA-CC
- 3.5 MEGA-Proto (分析模版)
- 3.6 Demo1:实例1
- 3.7 Demo2: 实例2
- 3.8 自我实例
- 4 mao 文件简单解析
- 5 在Linux下如何使用
1 github地址:
https://github.com/gaorongchao/Perl/tree/master/Bio/Mega
所有后续更新都在github上进行,其他地方不做同步。 发现任何错误,或者不当的地方,请先到github查看是否改正。 如果没有请留言。或者邮件交流:rongchaogao@gmail.com
2 下载
http://www.megasoftware.net/megaccusage.php
先从上面的网址下载,阅读上面的下载协议。 然后选“Accept Agreement”,然后就开始下载了。 下载以后我们得到“M6CC.zip”的文件。 然后解压。
解压以后得到几个文件。
- M6CC.exe
- M6Proto.exe #这两个是主程序,是我们要用到的
- MEGA-CC-Quick-Start-Tutorial.pdf # 这个是使用的教程
- Usage Agreement.pdf # 使用协议,不用看
- Examples # 这个文件夹提供了我们学习MEGACC所需要的文件
3 使用
使用过程是从解压以后得到的PDF手册翻译加工整理而来。
3.1 安装
你可以在上面得到的解压文件中直接使用。 也可以直接把起作用的两个执行文件M6CC.exe 和 M6Proto.exe 拷贝到你喜欢的文件夹中。 下面的两个实例需要你也把Example文件也拷贝过去。
3.2 输入文件
1:分析配置文件:也就是你要用MEGA的什么参数进行分析的一个参数设定的集合。 这个是用MEGA-Proto来生成的。 生成的文件是一个 .mao为后缀的文件。
2:数据文件(下面的任意一个都可以)
- Multiple sequence alignment in MEGA or Fasta format.
- Distance matrix in MEGA format.
- Unaligned sequences in Fasta format (f or alignment only)
3:树文件(某些分析需要) .nwk文件格式。
3.3 输出文件
一般情况下生成两种输出文件
- 1. Calculation-specific results file (Newick file, distance
matrix,…).
- 2. A summary file with additional info (likelihood, SBL,…).
, Some analyses produce additional output (bootstrap consensus tree).
输出的文件夹和文件名称
- 1:默认和输入文件在同一个文件夹
- 2:如果要改变文件夹或者文件名称,那么用-o 选项。
- 3: If no output filename is specified, MEGA-CC will assign a unique name.
错误和警告:
如果MEGA-CC产生了错误或者警告信息。那么会出现在summary file文件中。
3.4 运行MEGA-CC
用命令行运行非常简单。
M6CC.exe -a options.mao -d alignment.meg -o outFile
也可以用一些脚本程序来运行,比如Perl,Python。 这里我们用exec发现会出问题,所以这里改成用system来进行调用。
#exec('M6CC.exe -a options.mao -d alignment.meg -o outFile'); system ('M6CC.exe -a options.mao -d alignment.meg -o outFile');
MEGA-CC附带完善的文件迭代系统,来处理多个文件,而不用脚本来帮忙。 具体可以参考下面第二个实例。
其他的应用也可以调用MEGA-CC:
status = CreateProcess("M6CC.exe...");
如果要查看更多的命令选项,那么从命令行中调用M6CC.exe -h
3.5 MEGA-Proto (分析模版)
MEGA-Proto有以下特点:
- 第一:和图形界面版本一样的外观
- 第二:生成MEGA分析所需要的选项文件
- 第三:没有计算能力,只是一个模拟的过程
双击打开MEGA-Proto以后,图形界面会引导你进行一下步骤。
第一步:选择序列类型。 包含四种类型。
Nucleotide (non-coding)Nucleotide (coding)Protein (amino-acid)Distance matrix (MEGA format)
第二步:从上面的菜单中选择一项分析过程。
第三步:调整分析的参数设置。
第四步:保存你设置好的MEGA分析的选项到一个文件。
3.6 Demo1:实例1
本实例展现了如何用MEGA-Proto 和MEGA-CC来完成 “Maximum Likelihood phylogeny reconstruction”。
- 第0步:准备文件。
为了能够正确的完成这个实例,你需要确认你有了M6CC.exe, 以及M6Proto.exe这两个程序(我们上面下载的就是)。 实例所需要的文件就是我们上面解压得到的。
- 第1步:双击或者右键打开MEGA-Proto.exe。
- 第2步:选择输入的数据类型。这里我们用的是默认设置。Nucleotide (non-coding)。
- 第3步:在菜单栏中选择:Phylogeny => Construct/Test Maximum Likelihood Tree
- 第4步:调整参数,然后点击“Save Settings”。把文件“mlDemo.mao”保存在当前文件夹。
- 第5步:打开一个命令行界面。也就是win+R,cmd。然后用cd命令切换到M6CC.exe所在的文件夹。
- 第6步:用M6CC.exe执行程序来分析文件。
M6CC.exe -a mlDemo.mao -d Examples\Crab_rRNA.meg -o demoResults
- 第7步:程序开始执行。会有进度的显示。执行完成以后退出。
- 最后 :分析得到3个输出文件。
* demoResult.nwk这个文件是用我们给定的设置参数得到的Maximum Likelihood 树。* demoResult_consensus.nwk这个文件是Mega 从所有的bootstrap sample trees中得到的bootstrap consensus树。* demoResult_summary.txt这个文件给出了分析数据:比如log likelihood value of the Maximum Likelihood tree,ts/tv ratio etc...
3.7 Demo2: 实例2
下面这个例子展示了,如何用MEGA-CC中的文件迭代系统, 用同一个配置文件(也就是MEGA-Proto得到的文件)来处理多个输入文件。
第0步:启动
这个就是第一个Demo1中的前5个过程,如果还搞不定的话,自己去复习。
第1步:新建一个文件,命名为 demo2Data.txt。这里面包含我们要处理的多个文件。 一行是一个文件。 在这个文件中,有两个文件“Grab_rRNA.meg” 和“Drosophila_Adh.meg”。 文件添加完全的路径。大致是下面的样子。
D:\M6CC\Examples\Crab_rRNA.meg D:\M6CC\Examples\Drosophila_Adh.meg
第2步:然后在命令行中用如下命令调用MEGA-CC:
M6CC.exe -a mlDemo.mao -d demo2Data.txt
上面的命令行没有指定输出的文件夹,以及文件名称。不过不用担心。 所有的结果都会根据你的文件名来命名,并且输出到“M6CC_Out”文件夹中。
第3步:然后分析会启动。一个个的处理文件。处理的进度会显示在命令行界面中。
最后 :分析程序会对每一个输入文件产生一个输出结果。 在这个例子中,相同的分析配置文件用在每一个文件中。
3.8 自我实例
下面是一个用Perl调用的小脚本:
use strict;use warnings;my @files = glob "*.fasta";foreach my $file (@files){ system ("M6CC.exe -a huashu.mao -d $file -o $file.out");}
使用的huashu.mao都在github上。
同时我们也可以用MEGA-cc自带的多文件处理功能。 Perl脚本用来提取所有需要处理文件的文件名到file.txt,这个文件名要包含完全的路径。
use strict;use warnings;my $out_out = "file.txt";open my $out, '>', $out_out or die "Fail open $out_out\n";my @files = glob "*.fasta";foreach my $file (@files){ print $out "D:\\Less_less_region\\$file\n";}close $out;
然后用上面的多个文件处理的方法:
M6CC.exe -a huashu.mao -d file.txt
但是用上面的方法来处理文件的时候,只有一半的文件被处理,基本上是处理一个,跳过一个。 不知道是什么原因。解决办法是:在上面的输出文件名称到file.txt的时候, 每一个文件都输出两遍。仅仅是一种解决方案,没有找到真正原因。
use strict;use warnings;my $out_out = "file.txt";open my $out, '>', $out_out or die "Fail open $out_out\n";my @files = glob "*.fasta";foreach my $file (@files){ print $out "D:\\Less_less_region\\$file\n"; print $out "D:\\Less_less_region\\$file\n";}close $out;
4 mao 文件简单解析
mao文件是我们用M6Proto.exe通过模拟分析得到的一个参数列表。 但是他的本质就是一个文本文件。我们可以用文本编辑器打开。
; Please do not edit this file! If this file is modified, results are unpredictable.; Instead of modifying this file, simply create a new MEGA Analysis Options file by using the MEGA Prototyper.[ MEGAinfo ]ver=0[ DataSettings ]datatype=snNucleotidecontainsCodingNuc=FalsemissingBaseSymbol=?identicalBaseSymbol=.gapSymbol=-[ ProcessTypes ]ppInfer=trueppNJ=true[ AnalysisSettings ]Analysis=Phylogeny ReconstructionScope=All Selected TaxaStatistical Method=Neighbor-joiningPhylogeny Test=====================Test of Phylogeny=Bootstrap methodNo. of Bootstrap Replications=500Substitution Model=====================Substitutions Type=NucleotideModel/Method=p-distanceSubstitutions to Include=d: Transitions + TransversionsRates and Patterns=====================Rates among Sites=Uniform ratesGamma Parameter=Not ApplicablePattern among Lineages=Same (Homogeneous)Data Subset to Use=====================Gaps/Missing Data Treatment=Pairwise deletionSite Coverage Cutoff (%)=Not Applicable
虽然文件的第一行,不让我们修改,但是我们仔细看一下每一行的意思以后。 完全可以进行小的改动。这样就不必要每一个小的改动,都去使用M6Proto.exe 这个程序。
比如,上面有一行 No. of Bootstrap Replications=500。 这个我们非常容易理解,就是设置Bootstrap的次数,如果你想改成1000,那就直接从mao文件 中修改吧。
5 在Linux下如何使用
官方的说法是现在只支持windows系统,暂时还不支持Mac和Linux。 Mega只能用最大4G的内存。
MEGA CC is developed for use on Microsoft Windows operating systems, including XP, Vista, Windows 7, and Windows 8. The version is limited to 32-bit execution, but should run fine on 64-bit systems. 32-bit limitations will still apply ex. MEGA can only use max 4gb of memory. At this time Mac and Linux are not supported.
Date: 2014-03-30T19:13+0800
Org version 7.9.3f with Emacs version 24
Validate XHTML 1.0- 如何使用Mega cc
- 如何使用CC协议声明
- Mega的简单使用
- 如何在Linux使用Eclipse + CDT开发CC++程序
- 如何使用dreamweave cc给图片加热点链接?
- 如何防止 CC攻击
- solaris使用正确的编译器CC/cc
- 使用GNU cc
- 【Linux】GNU CC 使用
- CC-Mode使用
- ngrok.cc的使用
- photoshop cc使用技巧
- arduino mega 2560结合 ethernet shield拓展板使用心得
- Unity表情制作插件 - Mega Fiers 使用介绍
- 如何给cc debugger烧录固件?
- cc -c -o的使用
- cc
- cc
- 与丁又专老师讨论高年级课堂的一些事情
- UIView 和 CALayer
- linux下如何用GDB调试c++程序
- CodeForces 258A Vanya and Cards
- HashMap与Hashtable区别
- 如何使用Mega cc
- 2014年3.30广州华南理工(大学城校区)华为实习生招聘机试题 解析 及机试注意事项
- MySQL Replication常见异常整理
- 数据库查询优化的一些总结
- 面试题
- vim基本设置
- oracle 导入/导出遇到的 问题总结
- 从不经意的小动作看穿一个人
- ios IOS学习之基础UI界面总结4