使用KOG数据库进行注释

来源:互联网 发布:金玉满堂 知乎 编辑:程序博客网 时间:2024/06/06 01:48

进行KOG注释的方法和COG一致。对真核生物使用KOG注释:

$wget ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva

$makeblastdb -in kyva -dbtype prot -title kog -parse_seqids -out /opt/biosoft/ncbi-blast-2.2.28+/db/kog -logfile /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log

$cat /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log



然后,使用Blastp将基因组蛋白质序列比对到COG数据库

$blast.pl blastp kog proteins.fasta 1e-5 4 kog 5

$blast.pl blastp kog proteins.fasta 1e-5 4 cog 5


下载KOG数据库的koghefun.txt文件。kog文件包含KOG编号和KOG数据库中序列名的对应关系,也包含KOG编号和25个大类的对应关系;fun.txt是25个大类的描述性信息。我们根据这2个文件的信息来编写程序对Blast的结果进行处理,得到KOG注释。

$mkdir ~/bin/kog

$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/whog -P ~/bin/kog

$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/fun.txt -P ~/bin/kog

$kog_from_xml.pl kog.xml 1e-5


1 0
原创粉丝点击