Imputer 减少了我的数据框中列的大小
Imputer reduces the size of columns in my dataframe
print(np.shape(ar_fulldata_input_xx))
Output: (9027, 1443)
现在我使用 Imputer
来估算数据框 ar_fulldata_input_xx
的缺失值,如下所示。
fill_NaN = Imputer(missing_values=np.nan, strategy='mean', axis=0)
imputed_DF = pd.DataFrame(fill_NaN.fit_transform(ar_fulldata_input_xx))
现在我按如下方式检查我估算的数据框的大小。
print(np.shape(imputed_DF))
Output: (9027, 1442)
为什么列大小减少了一个?
有什么方法可以找到插补函数后混合的列?
我有 运行 以下代码行来删除具有完整 "NAN" 值或完整“0”值的所有列。
ar_fulldata_input_xx = ar_fulldata_input_xx.loc[:, (ar_fulldata_input_xx != 0).any(axis=0)]
和
ar_fulldata_input_xx=ar_fulldata_input_xx.dropna(axis=1, how='all')
您可以在 pandas 上使用此操作:
ndf = df.fillna(df.mean())
其中一列似乎存在问题,未能正确导入原始文件中的数值,因此这很可能是 Imputer 无法正常工作的原因。 OP正在看。
print(np.shape(ar_fulldata_input_xx))
Output: (9027, 1443)
现在我使用 Imputer
来估算数据框 ar_fulldata_input_xx
的缺失值,如下所示。
fill_NaN = Imputer(missing_values=np.nan, strategy='mean', axis=0)
imputed_DF = pd.DataFrame(fill_NaN.fit_transform(ar_fulldata_input_xx))
现在我按如下方式检查我估算的数据框的大小。
print(np.shape(imputed_DF))
Output: (9027, 1442)
为什么列大小减少了一个?
有什么方法可以找到插补函数后混合的列?
我有 运行 以下代码行来删除具有完整 "NAN" 值或完整“0”值的所有列。
ar_fulldata_input_xx = ar_fulldata_input_xx.loc[:, (ar_fulldata_input_xx != 0).any(axis=0)]
和
ar_fulldata_input_xx=ar_fulldata_input_xx.dropna(axis=1, how='all')
您可以在 pandas 上使用此操作:
ndf = df.fillna(df.mean())
其中一列似乎存在问题,未能正确导入原始文件中的数值,因此这很可能是 Imputer 无法正常工作的原因。 OP正在看。