关于Matlab中PCA函数的参数

Question

我有一个 115*8000 的数据，其中 115 是特征的数量。当我像这样使用 matlab 的 pca 函数时

[coeff,score,latent,tsquared,explained,mu] = pca(data);

关于我的数据。我得到一些值。我在 here 上读到如何减少我的数据，但有一件事让我感到困惑。 explained 数据显示了一个特征对计算的影响有多大，但特征是否在这个过程中得到了重组，或者特征与我赋予它的功能的顺序完全相同？

我也给出了 115 个特征，但 explained 显示了 114 个。为什么会这样？

Answer 1

PCA 中的数据未 "reorganized"，转换为新的 space。当您裁剪 PCA space 时，那是您的数据，但您无法在那里 visualize/understand 它，您需要将其转换回 "normal" space ，使用特征向量等。

解释给你114因为你现在115的答案是什么！ 100%的数据可以用整个数据来解释！

在这个答案中进一步了解它：

Answer 2

PCA 不会 "choose" 您的某些特征并移除其余特征。所以你不应该还在考虑运行 PCA 之后的原始特征。

它在维基百科上有很好的解释 here。您正在将样本从原始特征定义的 space 转换为特征线性不相关并称为 "principal components" 的 space。注意：这些组件不再是原来的功能。

2D 中的一个示例可能是：您在欧几里德 space 中定义了一个向量 z=(2,3)。它需要 2 个特征（x 和 y）。如果我们更改 space 并使用坐标向量 v=(2,3) 和 w 将其定义为 v 的正交向量，则 z=(1,0) i.e. z=1.v+0.w 现在只能用一个特征（第一个坐标！）表示.

您分享的 link 准确地解释了（在所选答案中）您可以如何使用 pca 函数的输出来降低维度。

（正如 Ander 所指出的，您不关心最后的组件，因为它们无论如何都是最弱的，您想要删除它们）

关于Matlab中PCA函数的参数

About argument of PCA function in Matlab

matlab

classification

pca