两组观察值之间的两两差异
Pairwise differences between observations in two groups
我的数据集中有两个处理组,我正在寻找一种快速方法来计算第一组和第二组观察值之间的成对差异。
如何快速创建所有观察组合并取其差?
我想我可以像这样使用 expand.grid 来获得主题 ID 的组合...
expand.grid(df$subjectID[df$treatment == 'Active'],
df$subjectID[df$treatment == 'Placebo'])
然后我可以根据受试者 ID 加入结果值并取其差值。如果可用的话,我想要一种更通用的方法。
我基本上是在尝试从头开始计算 Mann-Whitney U 统计量,因此我需要确定活性治疗组的结果值是否大于安慰剂组的结果值(Y_a - Y_p > 0)。换句话说,我需要将积极治疗组的每一个反应与安慰剂治疗组的每一个反应进行比较。
所以如果我有一些看起来像这样的数据...
Subject Treatment Outcome
1 Active 5
2 Active 7
3 Active 6
4 Placebo 2
5 Placebo 1
我要计算差分矩阵...
S4 S5
S1 5-2 5-1
S2 7-2 7-1
S3 6-2 6-1
这是一些真实数据:
structure(list(subjectID = c(342L, 833L, 347L, 137L, 111L, 1477L
), treatment = c("CC + TV", "CC + TV", "CC + TV", "Control",
"Control", "Control"), score_ch = c(2L, 3L, 2L, 3L, 0L, 0L)), row.names = c(NA,
-6L), class = c("tbl_df", "tbl", "data.frame"))
我通过以下方式获得了想要的结果:
diff_df <- expand.grid('T_ID' = df$subjectID[df$treatment == 'CC + TV'],
'C_ID' = df$subjectID[df$treatment == 'Control'])
tttt <- diff_df %>%
left_join(df %>% select(subjectID, score_ch), by = c('T_ID' = 'subjectID')) %>%
left_join(df %>% select(subjectID, score_ch), by = c('C_ID' = 'subjectID')) %>%
mutate(val = case_when(score_ch.x == score_ch.y ~ 0.5,
score_ch.x > score_ch.y ~ 1,
score_ch.x < score_ch.y ~ 0))
但是那种..糟透了..
基数 R outer
怎么样?
Result <- outer(df[df$treatment == "Control",3],df[!df$treatment == "Control",3], FUN = '-')
colnames(Result) <- df[df$treatment == "Control","subjectID"]
rownames(Result) <- df[!df$treatment == "Control","subjectID"]
Result
# 137 111 1477
#342 1 0 1
#833 -2 -3 -2
#347 -2 -3 -2
我的数据集中有两个处理组,我正在寻找一种快速方法来计算第一组和第二组观察值之间的成对差异。
如何快速创建所有观察组合并取其差?
我想我可以像这样使用 expand.grid 来获得主题 ID 的组合...
expand.grid(df$subjectID[df$treatment == 'Active'],
df$subjectID[df$treatment == 'Placebo'])
然后我可以根据受试者 ID 加入结果值并取其差值。如果可用的话,我想要一种更通用的方法。
我基本上是在尝试从头开始计算 Mann-Whitney U 统计量,因此我需要确定活性治疗组的结果值是否大于安慰剂组的结果值(Y_a - Y_p > 0)。换句话说,我需要将积极治疗组的每一个反应与安慰剂治疗组的每一个反应进行比较。
所以如果我有一些看起来像这样的数据...
Subject Treatment Outcome
1 Active 5
2 Active 7
3 Active 6
4 Placebo 2
5 Placebo 1
我要计算差分矩阵...
S4 S5
S1 5-2 5-1
S2 7-2 7-1
S3 6-2 6-1
这是一些真实数据:
structure(list(subjectID = c(342L, 833L, 347L, 137L, 111L, 1477L
), treatment = c("CC + TV", "CC + TV", "CC + TV", "Control",
"Control", "Control"), score_ch = c(2L, 3L, 2L, 3L, 0L, 0L)), row.names = c(NA,
-6L), class = c("tbl_df", "tbl", "data.frame"))
我通过以下方式获得了想要的结果:
diff_df <- expand.grid('T_ID' = df$subjectID[df$treatment == 'CC + TV'],
'C_ID' = df$subjectID[df$treatment == 'Control'])
tttt <- diff_df %>%
left_join(df %>% select(subjectID, score_ch), by = c('T_ID' = 'subjectID')) %>%
left_join(df %>% select(subjectID, score_ch), by = c('C_ID' = 'subjectID')) %>%
mutate(val = case_when(score_ch.x == score_ch.y ~ 0.5,
score_ch.x > score_ch.y ~ 1,
score_ch.x < score_ch.y ~ 0))
但是那种..糟透了..
基数 R outer
怎么样?
Result <- outer(df[df$treatment == "Control",3],df[!df$treatment == "Control",3], FUN = '-')
colnames(Result) <- df[df$treatment == "Control","subjectID"]
rownames(Result) <- df[!df$treatment == "Control","subjectID"]
Result
# 137 111 1477
#342 1 0 1
#833 -2 -3 -2
#347 -2 -3 -2