解释 PCA 向量 WEKA
Interpreting the PCA Vector WEKA
我在 WEKA 资源管理器中完成了 Select 属性 PCA,但我无法解释输出,因为新属性输出向量加起来不等于 1。
我的理解是,给定一些属性,PCA 应该 return 一个较小的子集,它被定义为结合旧属性的新属性(例如给定属性 A、B、C,PCA 应该 return 一个新的属性向量 0,25A+0,5B+0,25C)。
但我得到的是:
−0.1669A +0.542B −0.4038C +0.4344D −0.3698E −0.3523F +0.0329G +0.0797H +0.4103I +0.4252J
这总和为 0.6317(带负号)或 2.8835(如果考虑绝对值)。有什么想法吗?
PCA 可以 包含比例因子。
这可能是更常见的情况。
权重因子的总和不必为1,因为最终结果没有概率维度。权重因子是所谓的 "similarity/contribution" 因子。因此,特征向量具有负权重是完全正常的,因为它对最终结果没有"contribute"。
我建议你看看下面的内容:
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htm
https://en.wikipedia.org/wiki/Eigenface
我认为 eigenfaces 中的人脸 recognition/reconstruction 是 PCA 分析的一个很好的例子,因为您对 "what" 特征向量及其使用方式有直观的了解
负权重的一个很好的例子如下:
如果数据集中的某些人戴着眼镜,则此特征将更强烈地表现在一个或多个特征脸上。为了构造不戴眼镜的人的脸,这些特征脸是强不相关的(可能权重很小或为负),而与戴眼镜的人强相关。
如果你看更多的例子,我相信你会明白的!
我在 WEKA 资源管理器中完成了 Select 属性 PCA,但我无法解释输出,因为新属性输出向量加起来不等于 1。
我的理解是,给定一些属性,PCA 应该 return 一个较小的子集,它被定义为结合旧属性的新属性(例如给定属性 A、B、C,PCA 应该 return 一个新的属性向量 0,25A+0,5B+0,25C)。
但我得到的是:
−0.1669A +0.542B −0.4038C +0.4344D −0.3698E −0.3523F +0.0329G +0.0797H +0.4103I +0.4252J
这总和为 0.6317(带负号)或 2.8835(如果考虑绝对值)。有什么想法吗?
PCA 可以 包含比例因子。
这可能是更常见的情况。
权重因子的总和不必为1,因为最终结果没有概率维度。权重因子是所谓的 "similarity/contribution" 因子。因此,特征向量具有负权重是完全正常的,因为它对最终结果没有"contribute"。
我建议你看看下面的内容:
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htm https://en.wikipedia.org/wiki/Eigenface
我认为 eigenfaces 中的人脸 recognition/reconstruction 是 PCA 分析的一个很好的例子,因为您对 "what" 特征向量及其使用方式有直观的了解
负权重的一个很好的例子如下:
如果数据集中的某些人戴着眼镜,则此特征将更强烈地表现在一个或多个特征脸上。为了构造不戴眼镜的人的脸,这些特征脸是强不相关的(可能权重很小或为负),而与戴眼镜的人强相关。
如果你看更多的例子,我相信你会明白的!