在泊松回归中修复 'TypeError'(使用 Python)

Fixing 'TypeError' in Poisson Regression (using Python)

我 运行 Python 中的泊松回归,它抛出以下错误:

TypeError: from_formula() takes at least 4 arguments (3 given)

我该如何解决?我的代码如下:

from statsmodels.genmod.generalized_estimating_equations import GEE
from statsmodels.genmod.cov_struct import (Exchangeable,
    Independence,Autoregressive) 
from statsmodels.genmod.families import Poisson

# 'df' is the dataframe containing all the data
f1 = "net_unique_bids ~ city1 + city2 + city3 + city4 + item_category1 + item_category2 + item_category3 + item_condition1 + item_condition2 + item_condition3 + asking_price + description_char_count + num_of_photos" 
model1 = GEE.from_formula(formula=f1, data=df, cov_struct=Independence(), family=Poisson())

背景: 我在我的拍卖网站上对收到的出价(因变量)进行建模,具有 city(分类)、item_category(分类),asking_price(连续),num_photos(连续)等

我的总体目标是找出哪些特征对收到的出价影响最大。这样,我就可以集中精力改进最重要的功能。

根据文档,模型定义的语法应遵循:

def from_formula(cls, formula, groups, data, subset=None, 
                time=None, offset=None, exposure=None, *args, **kwargs): 

您没有指定组,因此会引发错误。

groups : array-like or string Array of grouping labels. If a string, this is the name of a variable in data that contains the grouping labels.

也许你可以尝试使用数据帧的索引不分组? :/ 否则,使用你正在查看的城市的id将数据分成四组进行回归;不过,这需要将 city1...city4 从公式中剔除。我不是特别清楚什么适合你这里..