r:有人可以向我解释这个 dplyr 代码吗?
r: can someone explain this dplyr code to me?
非常简单的问题。这是代码:
library(dplyr)
library(tidyr)
mtcars %>% group_by(gear) %>% select(hp, disp) %>%
summarise_all(funs(n=sum(!is.na(.)), mean=mean(.,na.rm=T))) %>%
gather(variable, value, -gear) %>%
arrange(gear, sub('_.*', '', variable), sub('.*_', '', variable)) %>%
separate(variable, into = c('var', 'metric'), '_')
我理解 gather
语句之前的所有内容。我不熟悉这些功能,帮助文件也不是很有用。
谁能帮我解决这个问题?我想围绕这些命令构建一个函数,但我需要先了解这一切是如何工作的。
gather
从"wide"格式移动到长格式,-gear
表示不收集gear
。 gather
将剩余的列放入单个 variable
和 value
列。
arrange
只是按齿轮排序,sub
语句没有用,您可以将 arrange
行更改为 arrange(gear, variable)
.
separate
使用 _
作为分隔符将变量列一分为二
非常简单的问题。这是代码:
library(dplyr)
library(tidyr)
mtcars %>% group_by(gear) %>% select(hp, disp) %>%
summarise_all(funs(n=sum(!is.na(.)), mean=mean(.,na.rm=T))) %>%
gather(variable, value, -gear) %>%
arrange(gear, sub('_.*', '', variable), sub('.*_', '', variable)) %>%
separate(variable, into = c('var', 'metric'), '_')
我理解 gather
语句之前的所有内容。我不熟悉这些功能,帮助文件也不是很有用。
谁能帮我解决这个问题?我想围绕这些命令构建一个函数,但我需要先了解这一切是如何工作的。
gather
从"wide"格式移动到长格式,-gear
表示不收集gear
。 gather
将剩余的列放入单个 variable
和 value
列。
arrange
只是按齿轮排序,sub
语句没有用,您可以将 arrange
行更改为 arrange(gear, variable)
.
separate
使用 _
作为分隔符将变量列一分为二