标准化特征以计算方差 inflation 因子
Standardize features to calculate variance inflation factors
我正在计算方差 inflation 个因子
from patsy import dmatrices
from statsmodels.stats.outliers_influence import variance_inflation_factor
y, X = dmatrices('A ~ B + C + D + E + F + G, data=df, return_type='dataframe')
vif = pd.DataFrame()
vif['VIF'] = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]
vif['variable'] = X.columns
vif
我现在如何使用 StandardScaler() 标准化特征,然后重新计算标准化特征的方差 inflation 因子?
使用“patsy import dmatrices”已经对特征进行了缩放和标准化。因此,无需使用 StandardScaler()
执行第二步
查看 patsy 的 stateful transforms and standardize。
我正在计算方差 inflation 个因子
from patsy import dmatrices
from statsmodels.stats.outliers_influence import variance_inflation_factor
y, X = dmatrices('A ~ B + C + D + E + F + G, data=df, return_type='dataframe')
vif = pd.DataFrame()
vif['VIF'] = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]
vif['variable'] = X.columns
vif
我现在如何使用 StandardScaler() 标准化特征,然后重新计算标准化特征的方差 inflation 因子?
使用“patsy import dmatrices”已经对特征进行了缩放和标准化。因此,无需使用 StandardScaler()
执行第二步查看 patsy 的 stateful transforms and standardize。