Sklearn PCA 是 pca.components_ 的载荷?

Sklearn PCA is pca.components_ the loadings?

Sklearn PCA 是 pca.components_ 加载?我很确定是这样,但我正在尝试遵循一篇研究论文,但我从他们的加载中得到了不同的结果。我在 sklearn 文档中找不到它。

pca.components_ 是您将数据投影到的 space 的正交基。它的形状为 (n_components, n_features)。如果您只想保留具有 100 个样本和 50 个维度(也称为特征)的数据集的前 3 个组件(例如,做 3D 散点图),pca.components_ 的形状将是 (3, 50)

我认为你所说的 "loadings" 是每个样本投影到由分量跨越的向量 space 中的结果。这些可以通过在调用 pca.fit(X_train) 之后调用 pca.transform(X_train) 来获得。结果将具有 (n_samples, n_components) 的形状,对于我们之前的示例,即 (100, 3)

这个之前的答案大部分是正确的,除了负载。 components_ 实际上是负载,正如提问者最初所说的那样。 fit_transform 函数的结果将为您提供主成分(transformed/reduced 矩阵)。