聚类分析软件操作流程

来源:互联网 发布:数据新闻报道比赛 编辑:程序博客网 时间:2024/05/19 16:28


                                       

 2011/2/24

背景简介:

在芯片数据聚类分析中,可用的软件有很多,其中最重要的软件就是Cluster和它的相关树可视化软件TreeView。

 

软件下载:

那如何获取这两款软件呢?以下为两款软件的获取地址:

http://bonsai.hgc.jp/~mdehoon/software/cluster/

选择Cluster 3.0 for windows 和 JavaTreeView 下载。

 

软件安装:

1.Cluster 3.0的安装:

Cluster 3.0 for windows 的运行环境为windows系统,所以直接点击clustersetup.exe即安装成功。

 

2.Java TreeView的安装:

Java TreeView下载完成后,文件解压后如下图(图-1)所示,此时Treeview.jar此时默认的是压缩文件,千万不要解压TreeView.jar文件包。在windows系统中,按理说双击setup.exe 文件能完成安装,但出于某些原因,有的电脑可能运行不了,那是因为缺少了一个Java的运行环境,因此我们需要下载JRE(Java Runtime Environment,Java运行环境)。

JRE软件官方下载地址为http://www.java.com/it/download/manual.jsp(For Windows版本)。

安装完JRE软件后,Treeview.jar文件会自动默认JRE打开,如下图(图-2)所示,若没有自动默认,可右击选择默认打开程序选择JAVA(TM)Platform打开。

 

 

 

 

 

 

 

 

 

 

 

 图-1                                       图-2

 

 

软件使用:

简单地说:

1、Cluster的作用是应用一定的公式对一定格式的数据进行

过滤(Filter Data)、

校准(Adjust Data)、

分层聚类(hierarchical clustering)、

K-均值聚类(K-meansclustering)、

自组织图谱SOM(self organizing map)、

PCA(principle-componetanalysis)。

最后输出CDT和GTR格式文件 ( CDT格式为TreeView的默认打开文件格式 ) 。

    

 2、TreeView的作用是对Cluster输出的数据进行可视化显示。

 

1.Cluster 3.0的使用:

(1)数据的载入:Cluster所识别的文件格式为TXT文本文件,文件格式如下图(图-3)所示,数据可由Excel表格直接复制粘贴入文本文件。

点击菜单栏File / Opendata file 选择相应文件即可。

图-3

 

 

 

(2)数据的过滤:Cluster的主界面如下图(图-4)所示,点击Filter Data标签,点击所有复选框,数据值默认,最后点击ApplyFilter按钮及AcceptFilter按钮。此时数据过滤完成。

图-4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3)数据的校准:点击主界面的AdjustData标签如下图(图-5),选择对数转换数据(Log transform data)、聚类基因(Center genes)以及聚类列(Centerarrays)前的复选框,数据默认,点击Apply按钮。

图-5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 (4)数据的分层聚类:点击主界面的Hierarchical 标签如下图(图-6),需要解释的是Genes区域是设定数据每一行即是否对各个基因进行聚类,Arrays区域是设定数据每一列即是否对几个时期进行聚类。

图-6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   此处我们只对每行即各个基因进行聚类,所以将Genes区域的Cluster前复选框勾上,

聚类标准(SimilarityMetic)我们选择correlationuncentered聚类方法函数(Clustering method)我们一般选择输出均值(Averagelink age)。点击完Averagelink age按钮则会在原始数据所在的文件夹自动生成两个文件,文件格式分别为CDT和GTR格式文件。

 

(5)此时Cluster软件的使命已经完成,接下来进入TreeView进行图形输出。

 

2.Java TreeView的使用:

(1) 软件的运行:双击(图-2)中的Treeview.jar文件。软件主界面如下图(图-7)所示。

图-7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2) 文件的载入:同样,点击菜单栏File / Open选择Cluster输出的DAT文件,稍等片刻即如下图(图-8)所示。

图-8

 

 

 

 

 

 

 

 

 

 

 

 

 

(3) 显示区域的选择:用鼠标左键按住在上图(图-8)中的彩图区域选择需要的显示区域,所选区域会在右边空白区显示如下图(图-9)所示。

图-9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4)所选区域设置:基因色块大小颜色深浅均在菜单栏Settings /  PixelSettings里设置,设置界面如下图(图-10)所示。

图-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Global:是设置全局图片大小;

Zoom :是设置每个基因色块的大小;

Contrast:是调节基因色块的对比度。

 

其他,比如字体等等如有需要均可在菜单栏Settings子目录下找到相应项进行设置,此处不再赘述。

 

(5) 图像的输出:点击菜单栏Export / Exportto image ,设置菜单的数据默认(当然有需要也可作相应更改),点击Save按钮,则输出如下图(图-11)所示的图片。

图-11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6) ColorBar的输出:点击菜单栏 Export/ Export ColorBar to image,设置界面如下图(图-12)所示:

图-12

 

 

 

 

 

 

 

 

 

 

 

对ColorBar里单个色块的多少、大小及整体的大小输出路径等都可进行设置,好!点击Save按钮即可输出图片文件如下图(图-13)所示。

图-13

 

 

(7)收工:OK!全都完成啦!(*^__^*)嘻嘻……

原创粉丝点击