python 相当于 R 的 NA 是多少?
What is python's equivalent of R's NA?
python 相当于 R 的 NA 是多少?
更具体地说:
R 有 NaN、NA、NULL、Inf 和 -Inf。 NA 通常在有缺失数据时使用。 python 的等价物是什么?
numpy 和 pandas 等库如何处理缺失值?
scikit-learn 如何处理缺失值?
python 2.7 和 python 3 有什么不同吗?
pandas
看看这个。
http://pandas.pydata.org/pandas-docs/dev/missing_data.html
pandas 使用 NaN
。您可以使用 isnull()
或 not null()
测试空值,使用 dropna()
等将它们从数据框中删除。 datetime
对象的等价物是 NaT
nan
在 numpy 中可以很好地处理许多函数:
>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False, True, False, False], dtype=bool)
Scikit-learn 目前不处理缺失值。
对于大多数机器学习算法,不清楚如何处理缺失值,因此我们依赖于用户在将它们提供给算法之前处理它们。
Numpy 没有 "missing" 值。 Pandas 使用 NaN,但在可能导致混淆的数值算法中。可以使用屏蔽数组,但我们还没有在 scikit-learn 中这样做。
python 相当于 R 的 NA 是多少?
更具体地说: R 有 NaN、NA、NULL、Inf 和 -Inf。 NA 通常在有缺失数据时使用。 python 的等价物是什么?
numpy 和 pandas 等库如何处理缺失值?
scikit-learn 如何处理缺失值?
python 2.7 和 python 3 有什么不同吗?
pandas
看看这个。
http://pandas.pydata.org/pandas-docs/dev/missing_data.html
pandas 使用 NaN
。您可以使用 isnull()
或 not null()
测试空值,使用 dropna()
等将它们从数据框中删除。 datetime
对象的等价物是 NaT
nan
在 numpy 中可以很好地处理许多函数:
>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False, True, False, False], dtype=bool)
Scikit-learn 目前不处理缺失值。 对于大多数机器学习算法,不清楚如何处理缺失值,因此我们依赖于用户在将它们提供给算法之前处理它们。 Numpy 没有 "missing" 值。 Pandas 使用 NaN,但在可能导致混淆的数值算法中。可以使用屏蔽数组,但我们还没有在 scikit-learn 中这样做。