tbl_regression (gsummary) 排序协变量水平和处理时间
tbl_regression (gtsummary) ordering covariables levels and processing time
最初在我的 df 中,我的 BMI 是数字格式的 (1-5),我重新编码(体重不足到肥胖),分解并使用 relevel(正常,最初是 3)选择一个特定的参考。然后做了逻辑回归:y~BMI+其他协变量。我的问题如下:
1- 当我在 tbl_regression 中插入我的物流时,水平有不希望的订单(体重不足、肥胖 1、肥胖 2、超重)。有没有办法按照我想要的方式重新排列级别(体重过轻、超重、肥胖 1、肥胖 2)?
2- 我在一个小数据集上使用了 tbl_regression,结果没问题。然而,我的新模型基于 3M 观察和 13 个变量(数据库为 1Gb)。这次我的 tbl_regression 大约需要 1 小时来处理并输出 table,这不正常,因为我有一台速度很快的笔记本电脑。有没有办法提高效率?我尝试仅在使用 tbl_regression 时保留模型并删除了数据库,但它仍然非常长。我用试用数据试了一下,没问题..
1 - 我建议使用 contrasts()
来设置参考水平。 relevel()
函数只是将一个因子水平移动到第一个位置。这里的例子
2 - 我怀疑对于如此大的模型,置信区间计算是拖慢你速度的原因。如果您发现 summary()
和 broom::tidy()
以及 与 tbl_regression()
相比,CI 计算的计算时间有很大差异,请创建一个说明性示例(任何人都可以 运行 在本地),可以进一步研究。
最初在我的 df 中,我的 BMI 是数字格式的 (1-5),我重新编码(体重不足到肥胖),分解并使用 relevel(正常,最初是 3)选择一个特定的参考。然后做了逻辑回归:y~BMI+其他协变量。我的问题如下:
1- 当我在 tbl_regression 中插入我的物流时,水平有不希望的订单(体重不足、肥胖 1、肥胖 2、超重)。有没有办法按照我想要的方式重新排列级别(体重过轻、超重、肥胖 1、肥胖 2)?
2- 我在一个小数据集上使用了 tbl_regression,结果没问题。然而,我的新模型基于 3M 观察和 13 个变量(数据库为 1Gb)。这次我的 tbl_regression 大约需要 1 小时来处理并输出 table,这不正常,因为我有一台速度很快的笔记本电脑。有没有办法提高效率?我尝试仅在使用 tbl_regression 时保留模型并删除了数据库,但它仍然非常长。我用试用数据试了一下,没问题..
1 - 我建议使用 contrasts()
来设置参考水平。 relevel()
函数只是将一个因子水平移动到第一个位置。这里的例子
2 - 我怀疑对于如此大的模型,置信区间计算是拖慢你速度的原因。如果您发现 summary()
和 broom::tidy()
以及 与 tbl_regression()
相比,CI 计算的计算时间有很大差异,请创建一个说明性示例(任何人都可以 运行 在本地),可以进一步研究。