R语言将层次聚类中的树分成簇

来源:互联网 发布:洗数据 编辑:程序博客网 时间:2024/05/18 22:13

说明

在聚类树图中可以观测到聚类的层次,但是仍然得不到组的信息,不过我们可以定义一个聚类树图会拥有多少个簇,并控制树的高度以便将树分成不同的组。

操作

接上节的数据hc
将数据分成四组

fit = cutree(hc,4)

检查数据的簇标签

fit [1] 1 1 2 1 2 1 2 2 1 1 1 2 2 1 1 1 2 1 2 3 4 3 4 3 3 4 4 3 4 4 4 3 3 3 4 4 3 4 4 4 4 4 4 4 3 3 4 4 4 3 4 3 3 4 4 4 3 4 4 3

统计每一个簇中的对象数

table(fit)fit 1  2  3  4 11  8 16 25 

使用红色矩形框可视化矩形的簇

plot(hc,hang = -0.01,cex =0.7)rect.hclust(hc,k=4,border = "red")

使用红色矩块区分聚类中的不同簇
除了使用红色矩形来框来界定簇,还可以使用它对单独某个簇进行标记:

plot(hc,hang = -0.01,cex =0.7)rect.hclust(hc,k = 4,which = 2,border = "red")

标记特定簇
标记特定簇
还可以调用dendextend包,使用不同的颜色来绘制红色矩形框的各个不同聚簇。
根据分支所在的不同簇,对其涂色

library(dendextend)#deletedend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")

不同簇不同色
不同簇不同色
在这些簇周围添加红色矩形框

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")dend %>% rect.dendrogram(k=4,horiz = TRUE)

不同簇添加矩形框
最后,在图中添加一条切割线来展示对树的操作结:

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")dend %>% rect.dendrogram(k=4,horiz = TRUE)abline(v = heights_per_k.dendrogram(dend)["4"] + .1,lwd = 2,lty = 2,col = "blue")

水平聚类树中绘制分割线
水平聚类树中绘制分割线