apply函数处理数据的方式

来源:互联网 发布:wine源码 编辑:程序博客网 时间:2024/06/05 08:35

apply函数网上流传比较广的一个例子:

生成data.frame

x <- cbind(x1 = 3, x2 = c(4:1, 2:5)); x
x1 x2
[1,] 3 4
[2,] 3 3
[3,] 3 2
[4,] 3 1
[5,] 3 2
[6,] 3 3
[7,] 3 4
[8,] 3 5

自定义函数myFUN,第一个参数x为数据 # 第二、三个参数为自定义参数,可以通过apply的’…’进行传入。

myFUN<- function(x, c1, c2) {
+ c(sum(x[c1],1), mean(x[c2]))
+ }

把数据框按行做循环,每行分别传递给myFUN函数,设置c1,c2对应myFUN的第二、三个参数

apply(x,1,myFUN,c1=’x1’,c2=c(‘x1’,’x2’))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] 4.0 4 4.0 4 4.0 4 4.0 4
[2,] 3.5 3 2.5 2 2.5 3 3.5 4

**看到这个例子的时候我有些疑问,对于自定义函数myFUN<- function(x, c1, c2) {
+ c(sum(x[c1],1), mean(x[c2]))
+ },x[c1]和x[c2]表示什么?如果x变量是输入的矩阵,这种表示形式显然是无效的,在R里面对于列的表示不能用这种方式使用列名,但是向量似乎是可以这么表示的,所以我尝试了一下:

a<-c(1,2,3)
names(a)<-c(“a”,”b”,”c”)
a
a b c
1 2 3
a[“b”]
b
2
a[“a”]
a
1
如此看来这个自定义函数就可以理解了:
apply函数使用时,将每一行都转成了向量进行处理,而这些向量的每个元素同时具有一个“列名”,因此在处理时,是对应的将这些“列名”(c1,c2)传输进去进行相应的运算。**

0 0
原创粉丝点击