PCA:给定解释百分比变化所需的 PC 数量是什么意思?
PCA: What does it mean that the number of necessary PCs for a given explanation percentage changes?
假设有一个执行 PCA 的程序。
该程序计算覆盖数据总变异的给定份额所需的 PC 数量,例如95%.
假设对于时间 t=1 时使用的数据,为了覆盖 95% 的方差所需的 PC 数是 10。
在 t=2,我们用 t=2 的数据重新运行程序。
对于 t=2,为了覆盖 95% 的方差所需的 PC 数量是 5.
因此,从 t=1 到 t=2,覆盖 95% 的方差所需的 PC 数从 10 下降到 5。
主要问题:
在这种情况下,我们可以对从 t=1 到 t=2 的数据变化做出任何结论吗?
示例:
我们可以这样说吗:"Since the number of PCs decreases from t=1 to t=2, there is more correlation in the data at t=1 than at t=2. With more correlation in the data, fewer PCs are needed to cover a given share of the varaince in the data."
是的,如果原始变量是强相关的,减少数量的分量可以解释 80% 到 90% 的方差,方差百分比对应于您数据中已保留信息的百分比由个人电脑。此外,如果您想了解有关 PCA 的更多详细信息,您可以阅读这条很棒的评论:https://stats.stackexchange.com/questions/2691/making-sense-of-principal-component-analysis-eigenvectors-eigenvalues/140579#140579
假设有一个执行 PCA 的程序。 该程序计算覆盖数据总变异的给定份额所需的 PC 数量,例如95%.
假设对于时间 t=1 时使用的数据,为了覆盖 95% 的方差所需的 PC 数是 10。
在 t=2,我们用 t=2 的数据重新运行程序。 对于 t=2,为了覆盖 95% 的方差所需的 PC 数量是 5.
因此,从 t=1 到 t=2,覆盖 95% 的方差所需的 PC 数从 10 下降到 5。
主要问题:
在这种情况下,我们可以对从 t=1 到 t=2 的数据变化做出任何结论吗?
示例:
我们可以这样说吗:"Since the number of PCs decreases from t=1 to t=2, there is more correlation in the data at t=1 than at t=2. With more correlation in the data, fewer PCs are needed to cover a given share of the varaince in the data."
是的,如果原始变量是强相关的,减少数量的分量可以解释 80% 到 90% 的方差,方差百分比对应于您数据中已保留信息的百分比由个人电脑。此外,如果您想了解有关 PCA 的更多详细信息,您可以阅读这条很棒的评论:https://stats.stackexchange.com/questions/2691/making-sense-of-principal-component-analysis-eigenvectors-eigenvalues/140579#140579