是否有一个 statsmodel 公式等同于 y ~ 的 R glm 库?
Is there a statsmodel formula equivalent of the R glm library for y ~ .?
我有一个包含以下列的数据框:
y as the dependent variable
A, B, C, D, E, F as the independent variables.
我想使用 statsmodels 模块进行回归,但我不想按如下方式表达公式参数:
formula = 'y ~ A + B + C + D + E + F'
R glm 库确实通过表达 formula = y ~ .
进行了简化
我想知道 R 中的 glm 库是否有 statsmodel 快捷方式。
P.S.: 我正在处理的实际数据框有 27 个变量
没有像“.”这样的快捷方式。在 statsmodels 使用的 patsy 公式处理中。
但是,python 字符串操作很简单。
我目前正在使用的一个例子,
DATA
是我的数据框,docvis
是结果变量,我有一个公式中不需要的常量列。
formula = "docvis ~ " + " + ".join([i for i in DATA if i not in ["docvis", "const"]])
formula
'docvis ~ offer + ssiratio + age + educyr + physician + nonphysician + medicaid + private + female + phylim + actlim + income + totchr + insured + age2 + linc + bh + ldocvis + ldocvisa + docbin + aget + aget2 + incomet'
更明确的是直接使用列名 DATA.columns
。
在现代Python我们不需要在list comprehension中构建list,我们可以使用
formula = "docvis ~ " + " + ".join(i for i in DATA.columns if i not in ["docvis", "const"])
我有一个包含以下列的数据框:
y as the dependent variable
A, B, C, D, E, F as the independent variables.
我想使用 statsmodels 模块进行回归,但我不想按如下方式表达公式参数:
formula = 'y ~ A + B + C + D + E + F'
R glm 库确实通过表达 formula = y ~ .
进行了简化我想知道 R 中的 glm 库是否有 statsmodel 快捷方式。
P.S.: 我正在处理的实际数据框有 27 个变量
没有像“.”这样的快捷方式。在 statsmodels 使用的 patsy 公式处理中。
但是,python 字符串操作很简单。
我目前正在使用的一个例子,
DATA
是我的数据框,docvis
是结果变量,我有一个公式中不需要的常量列。
formula = "docvis ~ " + " + ".join([i for i in DATA if i not in ["docvis", "const"]])
formula
'docvis ~ offer + ssiratio + age + educyr + physician + nonphysician + medicaid + private + female + phylim + actlim + income + totchr + insured + age2 + linc + bh + ldocvis + ldocvisa + docbin + aget + aget2 + incomet'
更明确的是直接使用列名 DATA.columns
。
在现代Python我们不需要在list comprehension中构建list,我们可以使用
formula = "docvis ~ " + " + ".join(i for i in DATA.columns if i not in ["docvis", "const"])