tbl_regression (gsummary) 排序协变量水平和处理时间

tbl_regression (gtsummary) ordering covariables levels and processing time

gtsummary

最初在我的 df 中，我的 BMI 是数字格式的 (1-5)，我重新编码（体重不足到肥胖），分解并使用 relevel（正常，最初是 3）选择一个特定的参考。然后做了逻辑回归：y~BMI+其他协变量。我的问题如下：

1- 当我在 tbl_regression 中插入我的物流时，水平有不希望的订单（体重不足、肥胖 1、肥胖 2、超重）。有没有办法按照我想要的方式重新排列级别（体重过轻、超重、肥胖 1、肥胖 2）？

2- 我在一个小数据集上使用了 tbl_regression，结果没问题。然而，我的新模型基于 3M 观察和 13 个变量（数据库为 1Gb）。这次我的 tbl_regression 大约需要 1 小时来处理并输出 table，这不正常，因为我有一台速度很快的笔记本电脑。有没有办法提高效率？我尝试仅在使用 tbl_regression 时保留模型并删除了数据库，但它仍然非常长。我用试用数据试了一下，没问题..

1 - 我建议使用 contrasts() 来设置参考水平。 relevel() 函数只是将一个因子水平移动到第一个位置。这里的例子

2 - 我怀疑对于如此大的模型，置信区间计算是拖慢你速度的原因。如果您发现 summary() 和 broom::tidy() 以及与 tbl_regression() 相比，CI 计算的计算时间有很大差异，请创建一个说明性示例（任何人都可以运行在本地），可以进一步研究。