使用by()分组计算描述性统计量,它可以一次返回若干个统计量。格式为:
by(data, INDICES, FUN)
其中data是一个数据框或矩阵;INDICES是一个因子或因子组成的列表,定义了分组;FUN是任意函数。
通过INDICES 定义的因子,对data 内容进行分组,即将整个data大数据框,划分为了若干个小的数据框,而函数则定义了对这些分组数据处理的方式。
例子
tmp = by(exp,
ids$symbol,
function(x) rownames(x)[which.max(rowMeans(x))])
这里面,exp 为原有的数据框,而ids$symbol 则是区分exp 信息的向量,其将exp 按照symbol 中的信息划分为若干个矩阵,而function 则定义了在同一组(同一symbol)中的列名筛选其中平均值最大的那一列( which.max(rowMeans(x))
)。