如何解释 Spark PCA 输出?

How do I interpret Spark PCA output?

I 运行 具有三个变量的 Spark (2.2) PCA:x、y 和 z。 我得到:

+-----------------------------------------------------------+
|pcaFeatures                                                |
+-----------------------------------------------------------+
|[4192.998527751072,7.815744760976605,2.064076348440629]    |
|[934.9987857492071,6.178849121007534,2.0229856767680876]   |
|[81.99880210954893,6.012098465539804,2.0127405793319535] ...

所以这些是特征向量。它们是否按顺序对应于 x、y 和 z?如果 PCA 是关于特征缩减的,那么我可以说 x 解释了大部分数据所以只使用 x 吗?既然我有一个值向量,我可以用百分比表示吗?

PCA 用于减少维数。如果输入维数是 3 (x, y, z) 并且输出维数也是 3,那么实际上并没有降维,PCA 也没有任何意义。

输出特征不对应于 x、y 和 z。这只是一个新的 一组功能。不,你不能说第一个特征解释了大部分数据。