GenomePixelizer使用总结

来源:互联网 发布:cpi数据分析 编辑:程序博客网 时间:2024/05/29 19:04


Table of Contents

  • 1 神灯软件的使用总结(GenomePixelizer)
    • 1.1 运行所需要的文件
    • 1.2 输入文件的格式
    • 1.3 图片的生成
    • 1.4 总结,现在暂时使用的是这些,以后有其他的用处再进行补充。

1 神灯软件的使用总结(GenomePixelizer)

这是一款生物分析类型的软件。从开始到现在我使用到功能只有其中的一 个功能,也就是对染色体上的位置进行分类分析,这里最重要的是对输入格式 以及某些用到功能进行解释。

1.1 运行所需要的文件

我们要对一个物种进行分析,我们需要提供给神灯一个文件。我这里一Yeast 也就是酵母为例子。 在根目录下放入一个Yeast.txt的文件,当然名字你自己随意。 然后里面是我们得到什么样子图的关键。

1. name of file containing gene coordinates: ./sheep/Yeast/GC_all_3.txt2. name of the distance matrix file: 3. number of chromosomes: 164. size of chromosomes: 20.3 80.1 31.4 152.3 56.8 26.7 106.8 52.5 43.1 72.7 65.8 105.9 91.7 77.2 106.4 94.2  5. identity upper level: 5006. identity lower level: 6007. window size (pixels) X: 100008. window size (pixels) Y: 100009. html prefix: http://mips.gsf.de/cgi-bin/proj/thal/search_gene?code=10. Title: a11. Laboratory: b#############################################################   for experienced users below this line   ########12. W/C correction: A13. horizontal size of gene: 1014. vertical size of gene: 1015. W/C coefficient: 316. W/C correction value: 517. chromosome thickness: 418. gene feature mode (standard [std] or extended [ext]):  std

我们从上面的文件可以非常明显的看到分为18条,每一点代表这不同的选择,修改后你会得到不同的图。 1.第一点是你画图需要的文件。./表示当前目录,也就是在软件的根目录下,你可以自己新建一个文件 夹,然后把文件放进去,只要修改上面文件的第一行就可以了
2.这个是用来显示两个gene间的相互作用的,也就是在染色体的图上将两个相互作用的gene用直线连接 起来
3.染色体的数目,酵母的是16条

4.每条染色体的大小,你这里可以按照染色体的实际长度,也可以把所有的染色体按照比例进行缩放。
5.这个和2是一体的,两个相互关联的gene之间有相似度的概念,和6相互作用确定上限和下限。

7.这个控制生成图片的大小。这里可以适当的设置的大些,分辨率相应的就会高些。

13.我们最后生成的图片,每一个位置用一个方块表示,horizontal size 控制的是小正方块的宽。

14.控制小正方形的高

15.加入我们在相同的位置,有几个点聚集在一起。那么这个参数控制的就是他们的距离,如果设置为1, 那么两个小方块之间就会靠的非常的紧密,大部分年区域重叠在一起。如果设置的大一些,上下两个小 方块就会有一定的间距。如果相同点的mark比较多最好设置的大一些。

16.这个和上面两个加起来才能控制的更好

17.染色体的粗细程度,这个看大家的喜好

1.2 输入文件的格式

1       1       8.075   W       red     Yeast1       2       8.7519  C       red     Yeast1       3       9.2614  W       red     Yeast1       4       10.8919 C       red     Yeast1       5       12.4218 W       red     Yeast1       6       12.9009 C       red     Yeast1       7       12.9009 W       red     Yeast1       8       12.9009 C       red     Yeast

这里的第一列是染色体的编号,第二列是所有mark的编号,后面是在染色 体上的位置,当然要和染色体一样,进行同样程度的缩放。然后后面是位点 在染色体的上下的位置,W表示上,C表示下。 这里有一个特别要注意的点: 加入在染色体的同一个位置有8个点,我们必须要把他们放在一起。然后W和C 交替W,不能同时为C或者W,必须交替。假若你都用W想把所有的位点都放到 上面,那么你只能得到4个点。

输入的第二个文件,也就是用来gene之间的相互连接的,格式如下:

1:  YBR160W YKL042W 0.672:  YBR160W YDR130C 0.98

上面的文件第一列和第二列是两个相互作用的基因,第三列就是我们上面说的 Identity,只有Identity的数值在我们规定的范围内的才能够在图上显示。

然后附带一个得到上面格式的程序: 我们的输入文件内容如下:

1 1 13 131635 136160 133897.51 2 13 131635 136160 133897.51 3 18 123717 124719 1242181 4 2 184396 184397 184396.51 5 2 198874 199811 199342.5  
use strict;use warnings;my @information;my $cout;my $length;my (%hash,$key1,$key2,$key3);open(OUT,">GC_all_3.txt")||die("can not open");open(IN,"GC_all_2.txt")||die("can not open");while(<IN>){        chomp;        @information=split/\s+/,$_;        $hash{$information[0]}{$information[5]}{$information[1]}="A";}foreach $key1 (sort {$a<=>$b} keys %hash){        foreach $key2 (sort {$a<=>$b} keys $hash{$key1})        {                $length=$key2/10000;                foreach $key3 (sort {$a<=>$b} keys $hash{$key1}{$key2})                {                        $cout++;                        if($cout%2==0)                        {                                print OUT "$key1\t$cout\t$length\tC\tred\tYeast\n";                         }                        else                        {                                print OUT "$key1\t$cout\t$length\tW\tred\tYeast\n";                         }                }        }}

1.3 图片的生成

最后的图片文件的生成: 图形界面下方,MakePostScript后点击可以生成图片,后面有框可以自定 义图片的名称,生成的是.ps的文件。可以用Photoshop可以进行图片的转换。

1.4 总结,现在暂时使用的是这些,以后有其他的用处再进行补充。

Author: GRC <grc@grc>

Date: 2013-05-31 14:29:24 CST

HTML generated by org-mode 6.33x in emacs 23


1. name of file containing gene coordinates: ./sheep/Yeast/GC_all_3.txt
2. name of the distance matrix file: ./sheep/Yeast/result_3.txt
3. number of chromosomes: 16
4. size of chromosomes: 20.3 80.1 31.4 152.3 56.8 26.7 106.8 52.5 43.1 72.7 65.8 105.9 91.7 77.2 106.4 94.2  
5. identity upper level: 100
6. identity lower level: 50
7. window size (pixels) X: 3000
8. window size (pixels) Y: 3000
9. html prefix: http://mips.gsf.de/cgi-bin/proj/thal/search_gene?code=
10. Title: a
11. Laboratory: b
########################################################
#####   for experienced users below this line   ########
12. W/C correction: A
13. horizontal size of gene: 10
14. vertical size of gene: 10
15. W/C coefficient: 1
16. W/C correction value: 5
17. chromosome thickness: 4
18. gene feature mode (standard [std] or extended [ext]):  std


原创粉丝点击