R语言文本分析(5)
来源:互联网 发布:数据库实例是什么意思 编辑:程序博客网 时间:2024/06/05 16:56
R语言文本分析(5)
采用移除稀疏项目的方法,将稀疏项目移除,得到新的项目文档矩阵,并对裁剪过的项目进行聚类分析。
通过剪枝合并的方法可以获得几个类团。也可以采用k-means进行聚类分析。
# 移除sparse项目myTdm2 <- removeSparseTerms(myTdm, sparse = 0.95)m2 <- as.matrix(myTdm2)# Cluster termsdistMatrix <- dist(scale(m2))fit <- hclust(distMatrix, method = "ward.D2")plot(fit)# cut tree into 10 clustersrect.hclust(fit, k=10)(groups <- cutree(fit, k=10))# Clustering the tweets with the k-means algorithmm3 <- t(m2)# set a fix random seedset.seed(222)# k-means clustering of tweetsk <- 8kmeansResult <- kmeans(m3, k)# cluster centersround(kmeansResult$centers, digits = 3)# check the top 3 words in every clusterfor (i in 1:k) { cat(paste("cluster ", i, ": ", sep = " ")) s <- sort(kmeansResult$centers[i,], decreasing = T) cat(names(s)[1:3], "\n") # print the tweets of every cluster # print(rdmTweets[which(kmeansResult$cluster == i)])}
0 0
- R语言文本分析(5)
- R语言-文本分析
- R语言文本分析(1)
- R语言文本分析(2)
- R语言文本分析(3)
- R语言文本分析(4)
- R语言文本分析篇
- R语言の文本分析
- 红楼梦文本分析-R语言
- R语言文本分析问题
- R语言:实现文本分析实例(基础篇)
- 【R语言】文本挖掘-情感分析
- R语言文本分类
- R语言做文本挖掘 Part5情感分析
- R语言做文本挖掘 Part5情感分析
- R语言做文本挖掘 Part5情感分析
- R文本情感分析(3)
- R文本分析
- 使用Gradle与Ant实现可配置不同环境的自动打包
- 关于javabean类(domain类)易错点
- Struts2实现图片上传(物业报修系统)
- 记忆中干过的mysql卸载和重装
- jQuery 效果 - slideToggle() 方法
- R语言文本分析(5)
- Could not get JDBC Connection; nested exception is org.apache.commons.dbcp.SQLNestedException: Canno
- 2012年第三届蓝桥杯C/C++程序设计本科B组决赛 方块填数(编程大题)
- 简单又好用的聊天室技术——WebSocket
- 重装系统时出现<windows root>\system32\ntoskrnl.exe 损坏或者丢失?解决方法。。。。。。
- 页面从底部弹出一个popWindow
- 在Linux下使用C++开发Nginx模块的编译配置
- HDU 2544 最短路
- 饿了么开源项目:Java Comparator生成器