按数字汇总分类变量：gtsummary 包

Question

我需要有关如何使用 gtsummary 包编写 R 代码以创建摘要 table 的帮助，其中多个分类变量作为行，列侧（"by" 变量）是一个数字变量我的情况，年龄。所以从本质上讲，我想根据 mean/median 年龄来总结几个患者的分类特征。

例如，在此包中，使用数据 "trial"，我想在 table 的行轴上添加分类变量（标记、阶段、等级）而 by 变量是 "age"，所以这些变量的每个类别的中位年龄。

感谢您的帮助。耐莉

Answer 1

我不是 100% 清楚你在问什么。我猜您想按高年龄和低年龄汇总数据（在下面的示例中按中位数拆分）？

首先，您需要创建一个分类年龄变量。

library(gtsummary)
library(tidyverse)

df_age_example <-
  trial %>%
  mutate(
    # create a categorical age variable split at the median
    age2 = ifelse(
      age >= median(.$age, na.rm = TRUE),
      "Age Above or at Median",
      "Age Below Median"
    )
  ) %>%
  # keep variables to be summarized 
  select(age2, marker, grade)

然后您需要将该数据框传递给 tbl_summary() 以汇总数据。

tbl_summary(data= df_age_example, by = age2)

这将产生下面的 table。

希望对您有所帮助。编码愉快！

按数字汇总分类变量：gtsummary 包

Summarize categorical variables by numeric: gtsummary package

r

gtsummary