是否有一个 statsmodel 公式等同于 y ~ 的 R glm 库?

Is there a statsmodel formula equivalent of the R glm library for y ~ .?

我有一个包含以下列的数据框:

y as the dependent variable
A, B, C, D, E, F as the independent variables.

我想使用 statsmodels 模块进行回归,但我不想按如下方式表达公式参数:

formula = 'y ~ A + B + C + D + E + F'

R glm 库确实通过表达 formula = y ~ .

进行了简化

我想知道 R 中的 glm 库是否有 statsmodel 快捷方式。

P.S.: 我正在处理的实际数据框有 27 个变量

没有像“.”这样的快捷方式。在 statsmodels 使用的 patsy 公式处理中。

但是,python 字符串操作很简单。

我目前正在使用的一个例子, DATA 是我的数据框,docvis 是结果变量,我有一个公式中不需要的常量列。

formula = "docvis ~ " + " + ".join([i for i in DATA if i not in ["docvis", "const"]])
formula
'docvis ~ offer + ssiratio + age + educyr + physician + nonphysician + medicaid + private + female + phylim + actlim + income + totchr + insured + age2 + linc + bh + ldocvis + ldocvisa + docbin + aget + aget2 + incomet'

更明确的是直接使用列名 DATA.columns

在现代Python我们不需要在list comprehension中构建list,我们可以使用

formula = "docvis ~ " + " + ".join(i for i in DATA.columns if i not in ["docvis", "const"])