R WGCNA基础(1)——数据过滤
来源:互联网 发布:c语言的平方根 编辑:程序博客网 时间:2024/05/22 04:54
WGCNA(Weighted Correlation Network analysis)是一个基于基因表达网络权重构建,描述基因表达的关联模式的R包。挺拗口的吧,其实简单点的话分析基因的共表达网络,就是两个样本有表达量,那么博主根据表达量可以计算相关性,但如果加入一些新的权重,比如重量、高度、应激条件等等,相当于把基因表达与条件结合起来分析两者之间的关联性或相关性,当然表达量是最关键的。由此也可以延伸到其他关联分析,比如SNP等等。最简单的所有基因表达的结果,额,博主随便找的数据,建议先做标准化之后再进行分类:
library(WGCNA)options(stringsAsFactors=FALSE)enableWGCNAThreads()myfile=read.table("test.txt", sep="\t", header=TRUE)mydata=as.data.frame(myfile[, -c(1)])rownames(mydata)=myfile$ENSTmytree=flashClust(dist(mydata), method="average")mycolor=numbers2colors(mydata, signed=FALSE)pdf(file="test.pdf")plotDendroAndColors(mytree, mycolor, groupLabels=names(mydata), dendroLabels=FALSE, hang=0.01)dev.off()
基因太多就是这个样子,大约2W个基因,如果少一点就好看了许多~~~
数据过滤:
clust = cutreeStatic(mytree, cutHeight = 15, minSize = 10)#将15以上数据过滤去keepSamples = (clust==1)dat = mydata[keepSamples, ]
- R WGCNA基础(1)——数据过滤
- R WGCNA基础(2)——层次聚类
- R WGCNA基础(3)——零零碎碎
- R WGCNA进阶
- Mysql基础——where 过滤数据
- 04#数据分析-R基础(1)
- R语言实例-数据过滤
- Weighted Network Analysis (WGCNA)
- 机器学习——垃圾邮件过滤(R语言)
- 数学之路(2)-数据分析-R基础(1)
- 04#数据分析-R基础(2-接1)
- 数学之路(2)-数据分析-R基础(1)
- 04.2#R基础(系统3)-R的数据操作
- 04.2#R基础(系统4)-R的数据可视化
- R语言数据基础
- WGCNA算法研究笔记(2)
- C#基础之 --- 数据过滤
- R语言——基础
- 使用bulk collect insert实现大数据快速迁移
- Davinci dm8168算法移植记录
- afinal logo Android的快速开发框架 afinal
- 三大国际主流项目管理体系
- 使用 PHPUnit 和 Selenium 进行测试
- R WGCNA基础(1)——数据过滤
- Category
- 地址空间
- ALV OO相关学习
- CDataExchange::PrepareCtrl(int nIDC)里出错 解决
- IcePush
- linux下oracle相关操作
- JSP PHP ASP 语言的比较和区别 详解
- ios 拍照 自定义