使用分组变量计算多行的平均值
Calculate mean of multiple rows using grouping variables
我正在尝试计算多个 类 的总体平均值。目前数据库是长格式的。我尝试选择第一个 ID 号(组变量 1),然后是我感兴趣的虚拟变量 (stem=1) 类(分组变量 2),然后计算一个 GPA 平均值(即,stem GPA 平均值)对于感兴趣的类(词干=1)收到的成绩。
我在下面附上了一个数据库示例。总的来说,我正在尝试弄清楚如何计算每个学生的 stem GPA。
我尝试过使用 library(psych)、describeBy(data, dataset$id, dataset$stem),但无济于事。有什么建议吗?
对于这些操作,我更喜欢 dplyr
包。尝试例如
df %>% group_by(class) %>% summarise(mean_class=mean(class))
例如,使用 mtcars
数据集:
library(dplyr)
mtcars %>% group_by(cyl) %>% summarise(mean_disp = mean(disp))
会根据分组变量cyl
.
给你disp
的所有方法
我正在尝试计算多个 类 的总体平均值。目前数据库是长格式的。我尝试选择第一个 ID 号(组变量 1),然后是我感兴趣的虚拟变量 (stem=1) 类(分组变量 2),然后计算一个 GPA 平均值(即,stem GPA 平均值)对于感兴趣的类(词干=1)收到的成绩。
我在下面附上了一个数据库示例。总的来说,我正在尝试弄清楚如何计算每个学生的 stem GPA。
我尝试过使用 library(psych)、describeBy(data, dataset$id, dataset$stem),但无济于事。有什么建议吗?
对于这些操作,我更喜欢 dplyr
包。尝试例如
df %>% group_by(class) %>% summarise(mean_class=mean(class))
例如,使用 mtcars
数据集:
library(dplyr)
mtcars %>% group_by(cyl) %>% summarise(mean_disp = mean(disp))
会根据分组变量cyl
.
disp
的所有方法