做PCA(主成分分析)时,'similar / compatible'怎么得是数据?

When doing PCA (Principal Component Analysis), how 'similar / compatible' has to be the data?

我试图了解 运行 在 SPSS 或 R 上进行 PCA 时数据的兼容性。 我拥有的数据集是关于葡萄牙葡萄酒的信息,我知道有些属性是不可比的,例如 pH 值、酒精度和质量排名。

如果我在 R 上规范化此数据,它是否与 PCA 兼容?我想要实现的是了解哪些属性可以提高质量(不过必须是 PCA)。 如果这个问题很愚蠢,我很抱歉,我是数据分析的学生,由于这种冠状病毒的情况,类 没有交付,我仍然必须交付一个我不知道如何开始的 CA . 谢谢!

在 SPSS FACTOR 中,您可以对相关矩阵或协方差矩阵进行 PCA。如果您使用协方差矩阵,则范围较大的变量往往会主导解决方案。如果您使用相关矩阵(默认),则每个变量将被归一化为相同的方差,从而导致不同的解决方案,其中具有较大原始尺度的变量不一定主导解决方案。