apply函数处理数据的方式

来源：互联网发布：wine源码编辑：程序博客网时间：2024/06/05 08:35

apply函数网上流传比较广的一个例子：

生成data.frame

x <- cbind(x1 = 3, x2 = c(4:1, 2:5)); x
x1 x2
[1,] 3 4
[2,] 3 3
[3,] 3 2
[4,] 3 1
[5,] 3 2
[6,] 3 3
[7,] 3 4
[8,] 3 5

自定义函数myFUN，第一个参数x为数据 # 第二、三个参数为自定义参数，可以通过apply的’…’进行传入。

myFUN<- function(x, c1, c2) {
+ c(sum(x[c1],1), mean(x[c2]))
+ }

把数据框按行做循环，每行分别传递给myFUN函数，设置c1,c2对应myFUN的第二、三个参数

apply(x,1,myFUN,c1=’x1’,c2=c(‘x1’,’x2’))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] 4.0 4 4.0 4 4.0 4 4.0 4
[2,] 3.5 3 2.5 2 2.5 3 3.5 4

**看到这个例子的时候我有些疑问，对于自定义函数myFUN<- function(x, c1, c2) {
+ c(sum(x[c1],1), mean(x[c2]))
+ }，x[c1]和x[c2]表示什么？如果x变量是输入的矩阵，这种表示形式显然是无效的，在R里面对于列的表示不能用这种方式使用列名，但是向量似乎是可以这么表示的，所以我尝试了一下：

a<-c(1,2,3)
names(a)<-c(“a”,”b”,”c”)
a
a b c
1 2 3
a[“b”]
b
2
a[“a”]
a
1
如此看来这个自定义函数就可以理解了：
apply函数使用时，将每一行都转成了向量进行处理，而这些向量的每个元素同时具有一个“列名”，因此在处理时，是对应的将这些“列名”（c1，c2）传输进去进行相应的运算。**

0 0