按数字汇总分类变量:gtsummary 包
Summarize categorical variables by numeric: gtsummary package
我需要有关如何使用 gtsummary 包编写 R 代码以创建摘要 table 的帮助,其中多个分类变量作为行,列侧("by" 变量)是一个数字变量我的情况,年龄。所以从本质上讲,我想根据 mean/median 年龄来总结几个患者的分类特征。
例如,在此包中,使用数据 "trial",我想在 table 的行轴上添加分类变量(标记、阶段、等级)而 by 变量是 "age",所以这些变量的每个类别的中位年龄。
感谢您的帮助。
耐莉
我不是 100% 清楚你在问什么。我猜您想按高年龄和低年龄汇总数据(在下面的示例中按中位数拆分)?
首先,您需要创建一个分类年龄变量。
library(gtsummary)
library(tidyverse)
df_age_example <-
trial %>%
mutate(
# create a categorical age variable split at the median
age2 = ifelse(
age >= median(.$age, na.rm = TRUE),
"Age Above or at Median",
"Age Below Median"
)
) %>%
# keep variables to be summarized
select(age2, marker, grade)
然后您需要将该数据框传递给 tbl_summary()
以汇总数据。
tbl_summary(data= df_age_example, by = age2)
这将产生下面的 table。
希望对您有所帮助。编码愉快!
我需要有关如何使用 gtsummary 包编写 R 代码以创建摘要 table 的帮助,其中多个分类变量作为行,列侧("by" 变量)是一个数字变量我的情况,年龄。所以从本质上讲,我想根据 mean/median 年龄来总结几个患者的分类特征。
例如,在此包中,使用数据 "trial",我想在 table 的行轴上添加分类变量(标记、阶段、等级)而 by 变量是 "age",所以这些变量的每个类别的中位年龄。
感谢您的帮助。 耐莉
我不是 100% 清楚你在问什么。我猜您想按高年龄和低年龄汇总数据(在下面的示例中按中位数拆分)?
首先,您需要创建一个分类年龄变量。
library(gtsummary)
library(tidyverse)
df_age_example <-
trial %>%
mutate(
# create a categorical age variable split at the median
age2 = ifelse(
age >= median(.$age, na.rm = TRUE),
"Age Above or at Median",
"Age Below Median"
)
) %>%
# keep variables to be summarized
select(age2, marker, grade)
然后您需要将该数据框传递给 tbl_summary()
以汇总数据。
tbl_summary(data= df_age_example, by = age2)
这将产生下面的 table。
希望对您有所帮助。编码愉快!