python 相当于 R 的 NA 是多少?

What is python's equivalent of R's NA?

python 相当于 R 的 NA 是多少?

更具体地说: R 有 NaN、NA、NULL、Inf 和 -Inf。 NA 通常在有缺失数据时使用。 python 的等价物是什么?

numpy 和 pandas 等库如何处理缺失值?

scikit-learn 如何处理缺失值?

python 2.7 和 python 3 有什么不同吗?

pandas 看看这个。

http://pandas.pydata.org/pandas-docs/dev/missing_data.html

pandas 使用 NaN。您可以使用 isnull()not null() 测试空值,使用 dropna() 等将它们从数据框中删除。 datetime 对象的等价物是 NaT

nan 在 numpy 中可以很好地处理许多函数:

>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False,  True, False, False], dtype=bool)

Scikit-learn 目前不处理缺失值。 对于大多数机器学习算法,不清楚如何处理缺失值,因此我们依赖于用户在将它们提供给算法之前处理它们。 Numpy 没有 "missing" 值。 Pandas 使用 NaN,但在可能导致混淆的数值算法中。可以使用屏蔽数组,但我们还没有在 scikit-learn 中这样做。