Imputer 减少了我的数据框中列的大小

Imputer reduces the size of columns in my dataframe

print(np.shape(ar_fulldata_input_xx))

Output: (9027, 1443)

现在我使用 Imputer 来估算数据框 ar_fulldata_input_xx 的缺失值,如下所示。

fill_NaN = Imputer(missing_values=np.nan, strategy='mean', axis=0)
imputed_DF = pd.DataFrame(fill_NaN.fit_transform(ar_fulldata_input_xx))

现在我按如下方式检查我估算的数据框的大小。

print(np.shape(imputed_DF))

Output: (9027, 1442)

为什么列大小减少了一个?

有什么方法可以找到插补函数后混合的列?

我有 运行 以下代码行来删除具有完整 "NAN" 值或完整“0”值的所有列。

ar_fulldata_input_xx = ar_fulldata_input_xx.loc[:, (ar_fulldata_input_xx != 0).any(axis=0)]

ar_fulldata_input_xx=ar_fulldata_input_xx.dropna(axis=1, how='all')

您可以在 pandas 上使用此操作:

ndf = df.fillna(df.mean())

其中一列似乎存在问题,未能正确导入原始文件中的数值,因此这很可能是 Imputer 无法正常工作的原因。 OP正在看。