当我们使用 corr.() 时,我们应该关心 DataFrame 中的 NA 数据吗?

Should we care about NA data in a DataFrame when we use corr.()?

我尝试计算 DataFrame 的相关矩阵。但是我很困惑,我们应该用 0 替换所有 NA 数据还是只删除它们?也就是说,NA数据会不会影响相关性的计算?

如果您使用相关值根据它们是否相关对数据集进行分类,当然,您可以将 NaN 视为 0。也许解释 NaN 输出的更好方法是“不可解释”或“没有意义”,而显着相关性为 0 表示“无相关性”

另请参阅:

  • python - how to compute correlation-matrix with nans in data-matrix