按数字汇总分类变量:gtsummary 包

Summarize categorical variables by numeric: gtsummary package

我需要有关如何使用 gtsummary 包编写 R 代码以创建摘要 table 的帮助,其中多个分类变量作为行,列侧("by" 变量)是一个数字变量我的情况,年龄。所以从本质上讲,我想根据 mean/median 年龄来总结几个患者的分类特征。

例如,在此包中,使用数据 "trial",我想在 table 的行轴上添加分类变量(标记、阶段、等级)而 by 变量是 "age",所以这些变量的每个类别的中位年龄。

感谢您的帮助。 耐莉

我不是 100% 清楚你在问什么。我猜您想按高年龄和低年龄汇总数据(在下面的示例中按中位数拆分)?

首先,您需要创建一个分类年龄变量。

library(gtsummary)
library(tidyverse)

df_age_example <-
  trial %>%
  mutate(
    # create a categorical age variable split at the median
    age2 = ifelse(
      age >= median(.$age, na.rm = TRUE),
      "Age Above or at Median",
      "Age Below Median"
    )
  ) %>%
  # keep variables to be summarized 
  select(age2, marker, grade)

然后您需要将该数据框传递给 tbl_summary() 以汇总数据。

tbl_summary(data= df_age_example, by = age2)

这将产生下面的 table。

希望对您有所帮助。编码愉快!