在 scikit-learn 中使用 PCA 生成索引时出现值错误

Question

我正在尝试使用以下函数从数据生成索引：

函数：

import numpy as np
from sklearn.decomposition import PCA   

def pca_index(data,components=1,indx=1):
    corrs = np.asarray(data.cov())
    pca   = PCA(n_components = components).fit(corrs)
    trns = pca.transform(data)
    index=np.dot(trns[0:indx],pca.explained_variance_ratio_[0:indx])
    return index

索引：从主成分生成

index = pca_index(data=mydata,components=3,indx=2)

调用函数时出现以下错误：

Traceback (most recent call last):

File "<ipython-input-411-35115ef28e61>", line 1, in <module>
index = pca_index(data=mydata,components=3,indx=2)

File "<ipython-input-410-49c0174a047a>", line 15, in pca_index
index=np.dot(trns[0:indx],pca.explained_variance_ratio_[0:indx])

ValueError: shapes (2,3) and (2,) not aligned: 3 (dim 1) != 2 (dim 0)

任何人都可以帮助解决这个错误。

根据我的理解，当我将下标索引作为变量 (indx) 传递时，在以下几点出现了一些错误：

trns[0:indx],pca.explained_variance_ratio_[0:**indx**]

Answer 1

在 np.dot 中，您试图将维度为 (2,3) 的矩阵与维度为 (2,) 的矩阵相乘，即向量。

但是，您只能将 NxM 乘以 MxP，例如(3,2) 到 (2,1) 或 (2,3) 到 (3,1)。

在您的示例中，第二个矩阵的维度为 (2,)，用 numpy 术语来说，它与 (2,1) 相似但不同。您可以使用 vector.reshape([2,1])

将向量重塑为矩阵

您也可以转置第一个矩阵，从而将其维度从 (2,3) 转换为 (3,2)。

但是，请确保您乘以适当的矩阵，因为结果可能与您预期的不同。

在 scikit-learn 中使用 PCA 生成索引时出现值错误

Value error while generating indexes using PCA in scikit-learn

pca

python-3.x

scikit-learn